science >> Wetenschap >  >> Elektronica

Geoptimaliseerde plagiaatdetectie is 400x sneller dan conventionele methoden

Tegoed:Unsplash/CC0 Publiek domein

In een wereld waar zoveel informatie zo direct beschikbaar is voor studenten, moeten docenten en studentbeoordelaars voortdurend vechten tegen plagiaat. De tijd en moeite die een examinator nodig heeft om mogelijk honderden essays te moeten verwerken om te controleren op dergelijke problemen, hoe klein ook, is enorm. Er bestaan ​​halfautomatische tools voor het identificeren van plagiaat in een tekstvoorbeeld, maar ook deze nemen computerbronnen in beslag en zijn vaak onpraktisch en meer geschikt voor afzonderlijke documenten.

Schrijven in het International Journal of Innovative Computing and Applications , heeft een team uit Australië en Sri Lanka een nieuwe computationele benadering voor plagiaatdetectie ontwikkeld die gebruikmaakt van vectorruimte en gebruikmaakt van de architectuur van grafische verwerkingseenheden en hun compute unified device architecture (CUDA) in plaats van een conventionele computerchip, een centrale verwerkingseenheid, CPU.

Jiffriya Mohamed Abdul Cader van het Sri Lanka Institute of Advanced Technological Education Sammanthurai, Akmal Jahan Mohamed Abdul Cader van de South Eastern University of Sri Lanka, Hasindu Gamaarachchi van de University of New South Wales, Australië, en Roshan G. Ragel Faculty of Engineering, University uit Peradeniya, Sri Lanka, leggen uit dat conventionele seriële testen van 1.000 documenten een half uur kunnen duren.

Het prototype van hun GPU-aanpak verbetert dat aanzienlijk, het duurt slechts 36 seconden om dezelfde dataset te verwerken en eventuele geplagieerde tekstgedeelten te markeren. De onderzoekers hebben hun prototype echter verder geoptimaliseerd en de verwerkingstijd voor duizend documenten teruggebracht tot slechts 4 seconden. Dat is bijna 400 keer sneller dan conventionele benaderingen. Een dergelijke snelheid zou een zegen zijn voor examinatoren die worden geconfronteerd met honderden, zo niet duizenden door studenten ingediende documenten om te controleren op plagiaat.

De volgende stap zal zijn om dezelfde benadering te testen op tekst die in andere soorten documenten wordt aangetroffen, in plaats van alleen maar essays met rechte tekst, inclusief notitieboekjes, opdrachten, rapporten, scripties en dergelijke. + Verder verkennen

'Opinion-mining'-algoritme vat automatisch sentimenten op sociale media samen