science >> Wetenschap >  >> anders

April Fools hoax-verhalen kunnen aanwijzingen bieden om nepnieuws te identificeren

Krediet:CC0 Publiek Domein

Het bestuderen van 1 april hoax nieuwsverhalen zou aanwijzingen kunnen bieden voor het spotten van 'nepnieuws'-artikelen, nieuw onderzoek onthult.

Academische experts in natuurlijke taalverwerking van de Lancaster University die geïnteresseerd zijn in bedrog, hebben de taal vergeleken die wordt gebruikt in geschreven 1 april-hoaxes en nepnieuwsverhalen.

Ze hebben ontdekt dat er overeenkomsten zijn in de geschreven structuur van humoristische 1 april-hoaxes - de spoofartikelen die elk jaar op 1 april door de media worden gepubliceerd - en kwaadaardige nepnieuwsverhalen.

De onderzoekers hebben een nieuwe dataset samengesteld, of corpus, van meer dan 500 April Fools-artikelen afkomstig van meer dan 370 websites en geschreven over 14 jaar.

"April Fools-hoaxes zijn erg handig omdat ze ons een verifieerbare hoeveelheid misleidende teksten bieden die ons de mogelijkheid bieden om meer te weten te komen over de taalkundige technieken die worden gebruikt wanneer een auteur iets fictiefs schrijft, vermomd als een feitelijk verslag, " zei Edward Dearden van de Lancaster University, en hoofdauteur van het onderzoek. "Door te kijken naar de taal die in April Fools werd gebruikt en deze te vergelijken met nepnieuwsverhalen, kunnen we een beter beeld krijgen van het soort taal dat wordt gebruikt door auteurs van desinformatie."

Een vergelijking van aprilgrap-hoaxteksten met echte nieuwsartikelen die in dezelfde periode zijn geschreven, maar niet op 1 april zijn gepubliceerd, onthulde stilistische verschillen.

Onderzoekers richtten zich op specifieke kenmerken in de teksten, zoals de hoeveelheid gebruikte details, vaagheid, formaliteit van schrijfstijl en complexiteit van taal.

Vervolgens vergeleken ze de April Fools-verhalen met een 'nepnieuws'-dataset, eerder samengesteld door een ander team van onderzoekers.

Hoewel niet alle functies van April Fools-hoaxes nuttig bleken te zijn voor het opsporen van nepnieuws, er waren een aantal vergelijkbare kenmerken gevonden in beide.

Ze ontdekten dat April Fools-hoaxes en nepnieuwsartikelen meestal minder complexe taal bevatten, een gemakkelijker leesprobleem, en langere zinnen dan echt nieuws.

Belangrijke details voor nieuwsberichten, zoals namen, plaatsen, data en tijden, bleken minder vaak te worden gebruikt binnen aprilgrappen en nepnieuws. Echter, eigennamen, zoals de namen van prominente politici 'Trump' of 'Hillary', komen vaker voor in nepnieuws dan in echte nieuwsartikelen of aprilgrappen, die beduidend minder hebben.

Voornaamwoorden van de eerste persoon, zoals 'wij', zijn ook een prominente functie voor zowel April Fools als nepnieuws. Dit druist in tegen het traditionele denken bij het opsporen van misleiding, wat suggereert dat leugenaars minder voornaamwoorden van de eerste persoon gebruiken.

De onderzoekers ontdekten dat april dwazen hoax verhalen, in vergelijking met echt nieuws:

  • Zijn over het algemeen korter van lengte
  • Gebruik meer unieke woorden
  • Gebruik langere zinnen
  • Zijn gemakkelijker te lezen
  • Verwijzen naar vage gebeurtenissen in de toekomst
  • Meer verwijzingen naar het heden bevatten
  • Zijn minder geïnteresseerd in gebeurtenissen uit het verleden
  • Minder eigennamen bevatten
  • Gebruik meer voornaamwoorden van de eerste persoon

Nepnieuwsverhalen, in vergelijking met echt nieuws:

  • Zijn korter in lengte
  • Zijn gemakkelijker te lezen
  • Gebruik simplistische taal
  • Minder leestekens bevatten
  • Meer eigennamen bevatten
  • Zijn over het algemeen minder formeel - gebruik meer voornamen zoals 'Hillary' en bevatten meer godslastering en spelfouten
  • Bevat zeer weinig data
  • Gebruik meer voornaamwoorden van de eerste persoon

De onderzoekers hebben ook een 'classifier' voor machinaal leren gemaakt om te identificeren of artikelen April Fools-hoaxes zijn, nepnieuws of echte nieuwsverhalen. De classifier behaalde een nauwkeurigheid van 75 procent bij het identificeren van 1 april-artikelen en 72 procent bij het identificeren van nepnieuwsverhalen. Toen de classifier werd getraind in aprilgrap-hoaxes en de taak kreeg om nepnieuws te identificeren, registreerde hij een nauwkeurigheid van meer dan 65 procent.

Dr. Alistair Baron, co-auteur van het artikel, zei:"Kijken naar details en complexiteit in een tekst is cruciaal om te bepalen of een artikel een hoax is. Hoewel er veel verschillen zijn, onze resultaten suggereren dat April Fools en nepnieuwsartikelen enkele vergelijkbare functies delen, meestal met structurele complexiteit.

"Onze bevindingen suggereren dat er bepaalde kenmerken gemeen zijn tussen verschillende vormen van desinformatie en het verkennen van deze overeenkomsten kan belangrijke inzichten opleveren voor toekomstig onderzoek naar misleidende nieuwsverhalen."

Het onderzoek is beschreven in het artikel 'Fool's Errand:Looking at April Fools Hoaxes as Disinformation through the Lens of Deception and Humor', die zal worden gepresenteerd op de 20e internationale conferentie over computerlinguïstiek en intelligente tekstverwerking, die in april in La Rochelle wordt gehouden.