science >> Wetenschap >  >> anders

Woorddetectives:wetenschap kan opiniecolumnist helpen

Krediet:CC0 Publiek Domein

Taaldetectives zeggen dat de belangrijkste aanwijzingen voor wie het anonieme opiniestuk van de New York Times schreef waarin president Donald Trump werd bekritiseerd, misschien niet de vreemde en glimmende "lodestar, " maar de kleine woorden die mensen gewoonlijk overlezen:"Ik, " "van" en "maar."

En lodestar? Dat kan een rode haring zijn die bedoeld is om speurders van het spoor te brengen, zeggen sommige experts.

Experts gebruiken een combinatie van taalgebruik, statistieken en computerwetenschap om erachter te komen wie documenten heeft geschreven die anoniem zijn of mogelijk geplagieerd. Ze hebben op die manier zelfs misdaden en historische mysteries opgelost. Sommigen noemen het veld forensische taalkunde, anderen noemen het stylometrie of doen gewoon 'auteursattributie'.

Het veld staat plotseling centraal nadat een niet-geïdentificeerde "hoge ambtenaar" in de Times schreef dat hij of zij deel uitmaakte van een "verzet" -beweging die vanuit de regering werkte om de gevaarlijkste impulsen van Trump te beteugelen.

"Mijn telefoon rinkelt met verzoeken om die analyse te doen en ik heb gewoon geen tijd, ", zegt computer- en taalwetenschapper Patrick Juola van Duquesne University.

Robert Leonard, een professor taalkunde aan de Hofstra University die heeft geholpen bij het oplossen van moorden door taal te onderzoeken, zegt dat als experts het juiste aantal schrijfvoorbeelden zouden kunnen krijgen van functionarissen van wie de identiteit bekend is, "een analyse zou zeker gedaan kunnen worden."

Volgens een politicoloog zijn er ongeveer 50 mensen in de regering-Trump die voldoen aan de beschrijving van de Times als een hoge ambtenaar van de regering en de auteur zouden kunnen zijn. De sleutel zou zijn om te kijken naar hoe ze schrijven, de woorden die ze gebruiken, welke woorden ze naast elkaar zetten, spelling, interpunctie en zelfs tijden, deskundigen zeggen.

"Taal is een reeks keuzes. Wat te zeggen, hoe je het moet zeggen en wanneer je het moet zeggen, "zegt Juola. "En er zijn veel verschillende opties."

Een van de favoriete technieken van Juola en andere experts is kijken naar wat 'functiewoorden' worden genoemd. Dit zijn woorden die mensen altijd gebruiken, maar die moeilijk te definiëren zijn omdat ze meer functie dan betekenis hebben. Enkele voorbeelden zijn "van, " ''met, " ''de, " ''een, "'over' en 'en'.

"We gebruiken ze allemaal, maar we gebruiken ze niet op dezelfde manier, "zegt Juola. "We gebruiken ze niet in dezelfde frequentie." Hetzelfde geldt voor apostrofs en andere interpunctie.

Bijvoorbeeld, zeg je "anders dan" of "anders dan?" vraagt ​​computerwetenschap en data-expert Shlomo Argamon van het Illinois Institute of Technology.

Vrouwen gebruiken vaker eerste en tweede persoon voornaamwoorden:"I, "'ik' en 'jij' - en meer tegenwoordige tijd, zegt Argamon.

Mannen gebruiken "de, " ''van, "'dit' en 'dat' vaker, hij zegt.

"Je zoekt naar aanwijzingen en je probeert het nut van die aanwijzingen in te schatten, " zegt Argamon. Maar hij is minder optimistisch dat de Trump opiniestuk zaak om verschillende redenen zal worden gekraakt, inclusief de stijlredactie van de New York Times en mogelijke pogingen om taaldetectives voor de gek te houden met woorden die iemand anders graag gebruikt, zoals 'lodestar'. Grotendeels, hij is pessimistisch, want om een ​​goede vergelijking te maken, monsters van alle verdachten moeten worden verzameld en moeten vergelijkbaar zijn, zoals alle opiniecolumns in tegenstelling tot romans, toespraken of tijdschriftverhalen.

Rachel Greenstadt van de Drexel University bestudeert wanneer mensen onderzoekers proberen af ​​te stoten met woorden die ze normaal niet gebruiken of opzettelijk slecht gespeld. Ze zegt dat haar eerste instinct is dat het woord 'lodestar' - een vice-president Mike Pence meerdere keren heeft gebruikt - 'een rode haring' is. Het lijkt te opzettelijk.

"De meeste mensen zijn nog steeds op zoek naar hapklare functies zoals lodestar in plaats van te proberen het hele plaatje te begrijpen, " zegt Hofstra's Leonard.

Greenstadt zegt dat taalanalyse "zo'n beetje zou kunnen bijdragen aan het beeld" van wie de opiniestukken van de Times schreef, maar ze voegt eraan toe "uit zichzelf, Ik zou me zorgen maken om het te gebruiken."

Nog altijd, met de juiste voorwaarden zijn woorden belangrijk.

Juola getuigde in ongeveer 15 processen en behandelde nog meer zaken die nooit voor de rechtbank kwamen. Zijn grootste zaak was in 2013, toen een Britse krant een tip kreeg dat het boek "The Cuckoo's Calling" van Robert Galbraith echt geschreven was door Harry Potter-auteur J.K. Rowling. Over ongeveer een uur, Juola voedde twee Rowling-boeken, "The Cuckoo's Calling" en zes andere romans in zijn computer, analyseerde de taalpatronen met vier verschillende systemen en concludeerde dat Rowling het deed.

Een paar dagen later, Rowling bekende.

Het was lang niet de eerste keer dat het taalgebruik de echte boosdoener ving. De broer van de Unabomber identificeerde hem vanwege zijn kenmerkende schrijfstijl. Veldpioniers hielpen bij het vinden van een ontvoerder die de unieke term 'duivelsstrook' gebruikte voor het grasveld tussen het trottoir en de weg. De uitdrukking wordt alleen gebruikt in delen van Ohio.

Ook in de politiek, woorden zijn poker vertelt. 1996, de roman "Primary Colors" over een Clinton-achtige presidentskandidaat zette Washington in rep en roer om erachter te komen wie de anonieme auteur was. Een analyse door een Vassar-professor en ander werk wees op Joe Klein van Newsweek en hij gaf het uiteindelijk toe.

Maar het literaire speurwerk gaat terug tot de oprichting van de republiek. Historici hadden moeite om uit te zoeken welke specifieke Federalist Papers door Alexander Hamilton waren geschreven en welke door James Madison. Een statistische analyse uit 1963 kwam erachter:een van de vele aanwijzingen kwam neer op het gebruik van de woorden 'terwijl' en 'terwijl'. Madison gebruikte "terwijl"; Hamilton gaf de voorkeur aan 'terwijl'.

Juola zegt dat experts in het veld introverte mensen over het algemeen kunnen onderscheiden van extraverte mensen. mannen van vrouwen, Opleidingsniveau, leeftijd, plaats, bijna alles behalve astrologisch teken.

"De wetenschap is erg goed, " zei Juola. "Het is niet helemaal DNA. Sommige wetenschappers beschouwen het zelfs als de op één na meest nauwkeurige vorm van forensische identificatie die we hebben, omdat het zo goed is."

© 2018 The Associated Press. Alle rechten voorbehouden.