science >> Wetenschap >  >> Elektronica

In de verleiding komen om te spieken bij een schriftelijk examen? Kunstmatige intelligentie zal je voor 90% zeker pakken

Krediet:CC0 Publiek Domein

Door big data te combineren met kunstmatige intelligentie, konden onderzoekers van de Universiteit van Kopenhagen bepalen of je je opdracht hebt geschreven of dat een ghostwriter het voor je heeft geschreven - met een nauwkeurigheid van bijna 90 procent.

Verschillende onderzoeken hebben aangetoond dat spieken bij opdrachten wijdverbreid is en steeds vaker voorkomt onder middelbare scholieren. Aan de afdeling Computerwetenschappen van de Universiteit van Kopenhagen, pogingen om fraude bij opdrachten op te sporen door middel van schrijfanalyse door middel van kunstmatige intelligentie zijn al een paar jaar aan de gang. Nutsvoorzieningen, op basis van analyses van 130, 000 schriftelijke Deense opdrachten, wetenschappers kunnen, met bijna 90 procent nauwkeurigheid, detecteren of een student een opdracht alleen heeft geschreven of dat een ghostwriter deze heeft samengesteld.

Deense middelbare scholen gebruiken momenteel het Lectio-platform om te controleren of een leerling geplagieerd werk heeft ingeleverd met passages die rechtstreeks zijn gekopieerd uit een eerder ingeleverde opdracht. Middelbare scholen vinden het moeilijker om te ontdekken of een leerling iemand anders heeft ingeschakeld om de opdracht voor hen te schrijven, iets dat min of meer gesystematiseerd gebeurt via online diensten. De zaak van de SRP, een grote schriftelijke opdracht in het laatste jaar van de Deense middelbare school, is bijzonder veelzeggend. Omdat de opdracht dubbel telt, studenten zijn zo ver gegaan dat ze hun schrijfopdrachten op de Deense geclassificeerde website uitbesteden, Den Blå Avis.

"Het probleem van vandaag is dat als iemand wordt ingehuurd om een ​​opdracht te schrijven, Lectio ziet het niet. Ons programma identificeert discrepanties in schrijfstijlen door recent ingeleverd werk te vergelijken met eerder ingeleverd werk van een student. Onder andere variabelen, het programma kijkt naar:woordlengte, zinsbouw en hoe woorden worden gebruikt. Bijvoorbeeld, of 'bijvoorbeeld' wordt geschreven als 'ex' of 'bijv. "" legt Ph.D. student Stephan Lorenzen van de afdeling Informatica. Hij, samen met de rest van de DIKU-DABAI onderzoeksgroep, hebben onlangs hun bevindingen gepresenteerd op een grote Europese AI-conferentie.

Voorafgaand aan het plaatsen van de val, een ethisch debat

Het programma, Ghost Writer, is gebouwd rond machine learning en neurale netwerken - takken van kunstmatige intelligentie die met name handig zijn voor het herkennen van patronen in afbeeldingen en teksten. MaCom, het bedrijf dat Lectio levert aan Deense middelbare scholen, heeft een dataset gemaakt van 130, 000 schriftelijke opdrachten vanaf 10, 000 middelbare scholieren beschikbaar voor Ghostwriter-projectonderzoekers bij de afdeling Computerwetenschappen. Voor nu, het is nog steeds een onderzoeksproject.

Stephan Lorenzen denkt niet dat het onrealistisch is dat het programma in de niet al te verre toekomst zijn weg vindt naar middelbare scholen, omdat scholen voortdurend gelijke tred moeten houden met technologische ontwikkelingen om de verificatie van auteurschap aan te pakken. "Ik denk dat het realistisch is om te verwachten dat middelbare scholen het op een gegeven moment gaan gebruiken. Maar voordat ze dat doen, er moet een ethische discussie zijn over hoe de technologie moet worden toegepast. Elk resultaat dat door het programma wordt geleverd, mag nooit op zichzelf staan, maar dienen ter ondersteuning en onderbouwing van een vermoeden van bedrog, ', meent Lorenzen.

Politie en nepnieuws

De technologische basis van Ghostwriter kan elders in de samenleving worden toegepast. Bijvoorbeeld, het programma zou kunnen worden gebruikt in politiewerk als aanvulling op de analyse van vervalste documenten, een taak die wordt uitgevoerd door forensische documentonderzoekers en anderen.

"Het zou leuk zijn om samen te werken met de politie, die momenteel forensische documentonderzoekers inzetten om te zoeken naar kwalitatieve overeenkomsten en verschillen tussen de teksten die ze vergelijken. We kunnen naar grote hoeveelheden data kijken en patronen vinden. Ik kan me voorstellen dat deze combinatie het politiewerk ten goede zou komen, " zegt Lorenzen, die benadrukt dat ook hier ethische discussies nodig zijn.

De kunstmatige intelligentie die onderzoekers van de faculteit Informatica gebruiken om spieken bij opdrachten op te sporen, kent een breed scala aan toepassingen. Het is al gebruikt om Twitter-tweets te analyseren om te bepalen of ze zijn samengesteld door echte gebruikers of zijn geschreven door betaalde bedriegers of robots.

Feiten:

  • Het ghostwriter-programma gebruikt een zogenaamd Siamees neuraal netwerk om de schrijfstijlen van twee teksten te onderscheiden. Het netwerk is getraind op grote hoeveelheden data om te leren van representaties van schrijfstijlen, die vervolgens worden vergeleken.
  • Wanneer een student een opdracht inlevert, het netwerk vergelijkt het met hun eerdere opdrachten. Voor elke vorige opdracht het netwerk geeft een procentuele score voor schrijfstijlovereenkomst met de nieuwe opdracht.
  • Uiteindelijk, een gewogen gemiddelde van deze scores wordt berekend met een berekening die ook andere factoren meeneemt, zoals levertijd, rekening houden. Deze eindscore wordt weergegeven als een percentage en geeft de overeenkomst weer tussen de nieuwe opdracht en de schrijfstijl van de student.
  • De onderzoeksgroep achter het resultaat is het Danish Centre for Big Data Analytics-driven Innovation (DIKU-DABAI). De groep wordt geleid door professor Stephen Alstrup.