science >> Wetenschap >  >> Elektronica

Een nieuw convolutief neuraal netwerkmodel om misbruik en onbeleefdheid op Twitter te detecteren

Schema van de stappen voor detectie van onbeleefdheid. De geel gekleurde blokken vertegenwoordigen ingangen, de roodgekleurde blokken vertegenwoordigen de classificaties en de blauwgekleurde blokken vertegenwoordigen de tussenstappen. Krediet:Maity et al.

Onderzoekers van de Northwestern University, McGill-universiteit, en het Indian Institute of Technology Kharagpur hebben onlangs een convolutioneel neuraal netwerk (CNN) -model op karakterniveau ontwikkeld dat kan helpen om beledigende berichten op Twitter te detecteren. Dit model bleek beter te presteren dan verschillende basislijnmethoden, met een nauwkeurigheid van 93,3 procent.

In recente jaren, beledigend gedrag op online platforms is exponentieel toegenomen, vooral op Twitter. Social-mediabedrijven zoeken daarom naar effectieve nieuwe methoden om dit gedrag te identificeren om in te grijpen en te voorkomen dat het ernstige schade veroorzaakt.

"Twitter, dat aanvankelijk was opgevat als een 'e-stadsplein, ' verandert in een mosh pit, "Animesh Mukherjee, een van de onderzoekers die het onderzoek heeft uitgevoerd, vertelde Tech Xplore . "Een toenemend aantal cyberaanvallen, er worden elke dag meldingen gedaan van cyberpesten en onbehoorlijkheden, waarvan vele gebruikers ernstig treffen. In feite, dit is een van de belangrijkste redenen waarom Twitter zijn actieve volgersbestand verliest."

Online-inhoud kan zich snel verspreiden en een zeer breed publiek bereiken, dus gevallen van online misbruik slepen vaak lange tijd aan met zeer nadelige gevolgen. Het slachtoffer of de slachtoffers, evenals andere gevoelige omstanders, kan uiteindelijk de woorden van de dader ontelbare keren lezen voordat deze uiteindelijk van Twitter verdwijnen. Daarom is het belangrijk dat sociale mediaplatforms deze inhoud effectief en snel detecteren, het uitvoeren van tijdige interventies om het te verwijderen.

"We zijn begonnen met het doel om een ​​mechanisme te ontwikkelen dat automatisch onbeleefde tweets vroegtijdig kan detecteren, voordat ze ernstige schade kunnen aanrichten, " zei Mukherjee. "We merkten dat het vaakst, een slachtoffer/doelwit wordt aangevallen na het uiten van sterke gevoelens jegens bepaalde genoemde entiteiten. Dit leidde ons naar het centrale idee om meningsconflicten te gebruiken om onbeschaafde tweets te detecteren."

Mukherjee en zijn collega's realiseerden zich dat beledigende berichten vaak verband houden met meningsverschillen tussen de dader en het doelwit, met name meningen over een bekende publieke figuur of entiteit. Ze hebben daarom entiteitsspecifieke sentimentinformatie in hun CNN-model opgenomen, in de hoop dat dit de prestaties bij het opsporen van beledigende inhoud zou verbeteren.

In het hieronder aangehaalde voorbeeld van de context van onbeleefdheid, we zien dat het doelwit positief twittert over Donald Trump en US Economy. Echter, de dader (rekeninghouder) twittert negatief over Trump en positief over president Obama. We kunnen constateren dat er een meningsconflict is tussen het doelwit en de rekeninghouder, aangezien de gevoelens die worden geuit ten aanzien van de gemeenschappelijke benoemde entiteit Donald Trump tegengesteld zijn. De hele uitwisseling van berichten doorlopen, we vinden dat dit meningsconflict uiteindelijk leidt tot een onbeleefde post. Krediet:Maity et al.

"Het karakterniveau CNN probeert automatisch patronen te extraheren uit onbeschaafde tweets die ze onderscheiden van andere tweets, "Pawan Goyal, een andere onderzoeker die het onderzoek heeft uitgevoerd, vertelde TechXplore. "We hebben er ook voor gekozen om embedding op karakterniveau te gebruiken, in plaats van inbedding op woordniveau. Omdat tweets meestal klein zijn, slechts enkele woorden bevatten, en hebben veel spellingsvariaties, modellen op tekenniveau blijken robuuster te zijn dan modellen op woordniveau."

Dit CNN-model op karakterniveau presteerde 4,9 procent beter dan de beste basislijnmethode, het bereiken van een nauwkeurigheid van 93,3 procent bij het detecteren van onbeschaafde tweets. De onderzoekers voerden ook een post-hoc analyse uit, gedragsaspecten van daders en slachtoffers op Twitter onder de loep nemen, in de hoop incidenten van onbeleefdheid beter te begrijpen.

Uit deze analyse bleek dat een aanzienlijk deel van de gebruikers recidivisten waren die doelen meer dan 10 keer hadden lastiggevallen. evenzo, sommige doelwitten waren bij verschillende gelegenheden door verschillende daders lastiggevallen. "De meest interessante bevinding van dit onderzoek is dat meningsconflicten sterk correleren met onbeschaafd gedrag op Twitter, "Zei Mukherjee. "Deze enkele functie die verband houdt met het op char-CNN gebaseerde diepe neurale model kan zeer effectief zijn bij het vroegtijdig identificeren van onbeschaafde tweets."

In de toekomst, het CNN-model van Mukherjee en zijn collega's zou kunnen helpen om misbruik op Twitter tegen te gaan en te verminderen. De onderzoekers proberen nu vergelijkbare modellen te ontwikkelen om haatspraak op Twitter te detecteren, evenals op andere sociale mediaplatforms.

"In de tussentijd, we onderzoeken ook hoe haatzaaiende uitlatingen zich verspreiden op sociale media, en onderzoeken hoe verschillende methoden om haatzaaiende uitlatingen tegen te gaan kunnen helpen om dit wrede online fenomeen aan te pakken, ' zei Mukherjee.

© 2018 Tech Xplore