science >> Wetenschap >  >> Elektronica

De nepnieuwsdetector

Er zijn veel methoden om te bepalen of nieuws 'nep' is, ' inclusief het analyseren van de taalkundige kenmerken van verhalen om belangrijke patronen te extraheren. Krediet:Patrick Dodson

Een verhaal op Reddit vraagt, "Hebben de Palestijnen Texas erkend als onderdeel van Mexico?" De oorsprong van het verhaal is misschien dubieus, maar het verhindert niet dat het 'nepnieuws'-verhaal in slechts vier dagen 1,5 miljoen likes op meerdere platforms verzamelt. Het nepnieuws-dilemma gaat eeuwen terug, volgens Politico, maar de opmars van technologie en de opkomst van sociale media, het is nu op zijn hoogtepunt.

Het probleem van nepnieuws fascineert Shivam Parikh, een doctoraatsstudent in UAlbany's College of Engineering and Applied Sciences. Parikh, werken met universitair hoofddocent computerwetenschappen Pradeep Atrey, onlangs over dit onderwerp gepresenteerd op de IEEE 1st International Conference on Multimedia Information Processing and Retrieval. hun papier, "Mediarijke nepnieuwsdetectie:een enquête, " kijkt naar de uitdagingen die gepaard gaan met het detecteren van nepnieuws, bestaande detectiebenaderingen die sterk gebaseerd zijn op tekstgebaseerde analyse, en populaire nepnieuws-datasets.

Nepnieuws kan elke inhoud zijn die niet waarheidsgetrouw is en wordt gegenereerd om de lezers ervan te overtuigen te geloven in iets dat niet waar is, zei Parikh, die werkt als systeemontwikkelaar-analist voor ITS bij UAlbany.

De uitdaging voor de detectie van nepnieuws komt met de democratisering van nieuwsbronnen, en hoe gemakkelijk moderne technologie het delen van nieuwsartikelen maakt in het tijdperk van sociale media.

Parikh en Atrey wilden met hun krant verschillende cruciale stukjes van de 'nepnieuws'-puzzel aanpakken:

  • De verschillende platforms die kunnen worden gebruikt om inhoud effectief en breed te verspreiden;
  • De soorten gegevensnieuwsartikelen kunnen bevatten, en de impact van elk type gegevens op lezers;
  • De verschillende soorten nepnieuwscategorieën;
  • Bestaande methoden voor het detecteren van nepnieuws; en
  • Actuele datasets die beschikbaar zijn voor detectie van nepnieuws.

De onderzoekers sluiten af ​​met openstaande onderzoeksuitdagingen op het gebied van nepnieuwsdetectie.

in 2017, tweederde van de Amerikaanse volwassenen krijgt nieuws van sociale media, een sprong van 5 procent ten opzichte van 2016, volgens Reuters. Niet verrassend, dit is een zegen en een vloek voor mensen als Facebook en Twitter:de statistiek geeft de populariteit van de platforms weer, evenals hun rol als primaire bronnen voor de verspreiding van nepnieuws.

Maar terwijl de socialemediagiganten worstelen met het misbruik van hun platforms, ze worden ook geconfronteerd met de ontmoedigende aard van hun taak. Nepnieuws kan vele vormen aannemen, inclusief gephotoshopte afbeeldingen, valse door gebruikers gegenereerde inhoud of vervalste accounts, netwerkgebaseerde inhoud die is ontworpen om een ​​bepaalde organisatie of groep aan te spreken, evenals op kennis gebaseerde verhalen die een wetenschappelijke of redelijke verklaring van onopgeloste problemen bevatten, vaak resulterend in de verspreiding van valse informatie.

Maar hoewel de taak om nepnieuws te detecteren misschien ontmoedigend klinkt, er zijn verschillende veelbelovende methoden ter beschikking van onderzoekers. Parikh en Atrey presenteren een categorisering van deze benaderingen, hun belangrijkste kenmerken en analyseer vervolgens hun respectieve voordelen en beperkingen.

Deze methoden omvatten benaderingen die taalkundige kenmerken van verhalen analyseren om belangrijke patronen in nepnieuws te extraheren, of misleiding modellering, dat is het proces van het clusteren van bedrieglijke versus waarheidsgetrouwe verhalen. Andere benaderingen omvatten het ontwikkelen van voorspellende modellen die positieve of negatieve coëfficiënten kunnen toekennen die de waarschijnlijkheid van de waarheid van een verhaal kunnen vergroten of verkleinen; of content cue-analyse, die is gebaseerd op de ideologie van wat journalisten graag voor gebruikers schrijven en wat gebruikers graag lezen.

Gelukkig, onderzoekers hebben ruime toegang tot repositories van "nepnieuws" -artikelen in de vorm van openbaar beschikbare datasets, zoals BuzzFeedNews of LIAR. Maar hoewel elk van de datasets ruimschoots de mogelijkheid biedt om linguïstische detectiemodellen te bestuderen, geen enkele beschikt over een methode om foto's te analyseren, bijvoorbeeld.

"Visuele presentatie speelt een grote rol bij mensen die geloven in nepnieuwscontent. Dit vraagt ​​om verificatie van niet alleen taal, maar beelden, geluid, ingesloten inhoud, zoals embedded video, tweeten, Facebook-post en hyperlinks, ' zei Parikh.

Parikh pleit ook voor een detectiemethode die de bron van het nieuwsbericht kan verifiëren, en overweeg de betrouwbaarheid of validiteit van de bron zodra deze is vastgesteld. Een geloofwaardigheidscontrole van de auteur kan een vergelijkbare functie hebben, waar een systeem kan worden gebruikt om ketens van nepnieuws te detecteren die zijn geschreven door dezelfde auteur of dezelfde groep auteurs.

Parikh weet dat hij slechts de oppervlakte van het onderwerp heeft bekrast. Nog altijd, hij is vastbesloten om de kwestie te onderzoeken terwijl hij zijn doctoraat aan UAlbany nastreeft.