science >> Wetenschap >  >> anders

Taalkundige aanwijzingen kunnen de sleutel zijn tot het ontmaskeren van nepnieuws

Tegoed:CC0 Publiek Domein

Nadat de onthullingen over de Amerikaanse presidentsverkiezingen van 2016 werden beïnvloed door door Rusland gegenereerd 'nepnieuws', werden veel mensen kritischer tegenover nieuws op sociale media. "Nepnieuws" werd vervolgens door verschillende woordenboeken en taalorganisaties, zoals de Taalraad van Noorwegen, bedacht als het woord van het jaar 2017. In Noorwegen hebben velen van ons geleerd dat als iets te mooi lijkt om waar te zijn, dat vaak ook zo is.

Maar hoe zit het met de taal zelf - kan deze een indicatie geven van hoe waar de tekst die u leest, is?

Aan de Universiteit van Oslo werken taalkundigen nu samen met computerwetenschappers en kunstmatige intelligentie-onderzoekers bij de onafhankelijke onderzoeksorganisatie SINTEF om de taal van nepnieuws, wat zij Fakespeak noemen, bloot te leggen.

"We onderzoeken of er taalkundige verschillen zijn tussen echte en valse nieuwsteksten in het Noors, Engels en Russisch. Ons doel is om de huidige factchecktools te verbeteren", zegt Silje Susanne Alvestad.

Ze is hoofd van het Fakespeak-project en erkent dat taalkunde, haar vakgebied, belangrijke maatschappelijke voordelen kan bieden door nepnieuws te bestrijden.

"Sinds enkele jaren wordt er in mediastudies en informatica onderzoek gedaan naar verschillende aspecten van nepnieuws, bijvoorbeeld de manier waarop het wordt verspreid. Maar in de taalkunde zijn er hiaten met betrekking tot dit fenomeen", zegt Alvestad .

Informele stijl en werkwoorden in de tegenwoordige tijd kunnen belangrijke tekens zijn

Toegegeven, er zijn enkele taalkundigen die in het verleden nepnieuwsartikelen hebben aangepakt. In 2003 publiceerde de New York Times journalist Jayson Blair werd betrapt op het fabriceren van een aantal nieuwsartikelen. Jack Grieve en zijn collega's van de Universiteit van Birmingham hebben deze valse teksten verzameld in wat taalkundigen een corpus noemen, en ze vergeleken met een selectie van echte nieuwsverhalen geschreven door Blair.

"De onderzoekers gingen ervan uit dat, aangezien Jayson Blair verschillende motieven had voor het schrijven van deze twee soorten artikelen - om informatie te verschaffen in zijn echte teksten en met de bedoeling mensen te misleiden met zijn nepteksten - de stijl en de taalkundige kenmerken ook anders zouden zijn", zegt Alvestad.

En ja hoor, de teksten waren verschillend van stijl. "De onware hadden een informele stijl, terwijl de echte teksten vergelijkbaar waren met andere teksten met een hoge informatiedichtheid."

De Britse onderzoekers ontdekten verschillende taalverschillen:

  • Echte teksten:vaker gebruik van zelfstandige naamwoorden en woorden die zelfstandige naamwoorden wijzigen. De woorden waren gemiddeld langer.
  • Nepteksten:vaker gebruik van werkwoorden, vooral in de tegenwoordige tijd. Ook meer gebruik van voornaamwoorden, bijvoeglijke naamwoorden en kleine woorden om de betekenis te benadrukken (nadrukkelijke woorden).

Alvestad en haar taalkundige collega's, Nele Põldvere en Elizaveta Kibisova, bouwen voort op deze bevindingen terwijl ze nu de taalkundige kenmerken van nepnieuws in het Noors, Engels en Russisch onderzoeken.

Hoe metaforen worden gebruikt, kan een belangrijk teken zijn

Een metafoor is een uitdrukking die uit het ene domein wordt gehaald en op het andere wordt toegepast. Je kunt bijvoorbeeld een metafoor uit de oorlog op het gebied van gezondheid gebruiken als je het hebt over 'een virus aanvallen'.

De UiO-onderzoekers onder leiding van Nele Põldvere hebben Blairs gebruik van metaforen onder de loep genomen.

"Hij gebruikt minder metaforen in zijn nepnieuwsartikelen dan wanneer hij de waarheid schrijft. Een mogelijke verklaring hiervoor is dat we meestal metaforen gebruiken als we verhalen navertellen over iets dat we zelf hebben meegemaakt", zegt Alvestad.

Daarnaast gebruikt Blair linguïstische elementen die positieve emoties beschrijven of proberen te bevorderen.

"Eerder onderzoek heeft aangetoond dat wanneer je mensen opzettelijk wilt misleiden, je meestal sterke negatieve emoties probeert uit te lokken. Het tegenovergestelde was echter waar bij Jayson Blair. Als hij valse artikelen schrijft, gebruikt hij woorden, zinnen en bewoordingen die positieve emoties oproepen. ."

Alvestad wijst erop dat dit te wijten kan zijn aan het onderwerp:verschillende teksten van Blair waren nepverhalen over heldhaftige Amerikaanse soldaten tijdens de oorlog in Irak.

"Blair wilde de oorlog in Irak in een positief daglicht stellen."

Een uitdaging om genoeg nepnieuws in het Noors te vinden

Wanneer onderzoekers echte en nepteksten van dezelfde persoon vergelijken, zoals ze doen met de teksten van Blair, komen er waardevolle gegevens naar voren. Ze beschermen tegen verschillende mogelijke bronnen van fouten, zoals verschillen in persoonlijke schrijfstijl en verschillen in genre. Tegelijkertijd kan het moeilijk zijn om te generaliseren op basis van bevindingen die afkomstig zijn van een enkel individu.

"Jack Grieve en zijn collega's voerden verschillende kleinere onderzoeken uit, vergelijkbaar met de Jayson Blair-studie, en ze kwamen tot de conclusie dat mensen op verschillende manieren liegen", merkt Alvestad op.

Eén auteur slaagt er vaak niet in om voldoende tekst te produceren. Terwijl de teksten van Jayson Blair in totaal 80 pagina's beslaan, werken machine learning-specialisten liever met tekstverzamelingen die veel groter zijn. De onderzoekers hebben er daarom voor gekozen om teksten van één auteur te combineren met teksten van verschillende auteurs, die ze verzamelen bij factcheckingdiensten.

Alvestad en haar collega's hebben goede vooruitgang geboekt bij het analyseren van de taal van nepnieuws in het Engels, terwijl zowel het Noors als het Russisch enkele methodologische uitdagingen bieden.

"Hoewel Engels de meest gebruikte taal online is en het onderwerp van het meeste onderzoek is geweest, is het moeilijk om voldoende materiaal in het Noors te vinden. Noorwegen staat bovenaan de lijst van onderzoeken over vertrouwen in de media, dus dit is niet verwonderlijk ."

Toch hebben de onderzoekers enkele voorbeelden van nepnieuws van individuele auteurs die ook echte artikelen hebben geschreven waarmee ze kunnen vergelijken, en werken ze samen met de Noorse factcheckdienst Faktisk.no om een ​​grotere set teksten te verzamelen.

"Dat laatste kost veel tijd, omdat geen van de factcheckingdiensten waarmee we contact hebben gehad, archieven heeft die ze met ons kunnen delen. We moeten daarom onze weg terug vinden naar de oorspronkelijke tekst die vaak is gewijzigd of verwijderd nadat de feitelijke feiten zijn gecontroleerd. We willen deze artikelen natuurlijk bekijken zoals ze waren voordat de feiten werden gecontroleerd", zegt Alvestad.

Moeilijk om bronnen in Russische nepnieuwsberichten te verifiëren

Het is goed gedocumenteerd dat onwaarheden in overvloed aanwezig zijn in de Russische media. Toch is het voor Alvestad en haar collega's een uitdaging om Russische teksten te vinden die ze als onderzoeksmateriaal kunnen gebruiken.

"Het zou bijvoorbeeld interessant zijn om de impact van Russische informatie voorafgaand aan de invasie van Oekraïne te onderzoeken", zegt Alvestad.

Een dergelijk onderzoek brengt echter een aantal uitdagingen met zich mee.

“Allereerst werd het voor journalisten in Rusland al vroeg moeilijk om iets te schrijven dat afweek van de versie van de werkelijkheid door de autoriteiten. Daardoor lijken de teksten meer op persberichten dan op nieuwsartikelen en missen ze vaak de namen van de auteurs. namen en bronnen van de auteurs op te nemen, zodat we ook teksten kunnen vinden waarmee we de misleidende teksten kunnen vergelijken."

Bovendien zijn de factcheckdiensten in Rusland enigszins anders dan in landen als Noorwegen.

"In Rusland is het verboden om nepnieuws over bepaalde onderwerpen te verspreiden, maar hun definitie van nepnieuws is niet helemaal dezelfde als de onze."

Om goed materiaal in het Russisch te vinden, kijken de onderzoekers nu naar factcheckingdiensten en media buiten Rusland, zoals het Oekraïense stopfake.org.

Betere tools om nepnieuws te ontdekken

Het socialemediaplatform Facebook gebruikt momenteel kunstmatige intelligentie om te waarschuwen voor mogelijke desinformatie. Als de zaken gaan zoals de onderzoekers in het Fakespeak-project hopen, kunnen dergelijke tools worden verbeterd.

“Dit is hoe we werken:eerst analyseren de taalkundigen die aan het project werken de teksten. Vervolgens geven ze de resultaten door aan de computerwetenschappers, die de taalkundige kenmerken in de bestaande tools verwerken. Het doel hiervan is ervoor te zorgen dat nepnieuws sneller kunnen worden gedetecteerd dan op dit moment mogelijk is."

Zijn uw resultaten relevant voor andere talen?

"Als het Fakespeak-project ontdekt dat er gemeenschappelijke kenmerken zijn in de drie talen die we onderzoeken, zou dit een interessante bevinding zijn. Dit zijn echter alleen de Indo-Europese talen - er zijn veel andere taalfamilies. We zullen er veel meer nodig hebben studies om iets te kunnen zeggen of deze eigenschappen universeel zijn."

Alvestad meldt dat er binnen en buiten de academische wereld grote belangstelling is voor het onderzoek van Fakespeak en dat ze regelmatig vragen krijgt van onderzoekers die geïnteresseerd zijn om mee te werken. Ze wijst op de waarde van onderzoekers die zowel disciplines als instellingen nauw samenwerken op een manier die nieuwe kennis genereert.

"We zijn eigenlijk een voorbeeld van een interdisciplinair project dat geesteswetenschappelijk onderzoek zeer nuttig maakt voor de samenleving", besluit ze. + Verder verkennen

April Fools hoax-verhalen kunnen aanwijzingen bieden om 'nepnieuws' te identificeren