science >> Wetenschap >  >> Fysica

Hoe Word Cops anonieme auteurs ontmaskeren

Amerikaanse president Donald Trump, zie hier tijdens een kabinetsvergadering met staatssecretaris Mike Pompeo (links) en minister van Defensie Jim Mattis (rechts), zou wanhopig de identiteit willen weten van het anonieme OpEd-stuk van de New York Times. Win McNamee/Getty Images

Als je aan forensisch onderzoek denkt, je denkt waarschijnlijk aan botten in een ondiep graf of vingerafdrukken op een plaats delict. En dat is begrijpelijk. We kunnen tv-drama's als "CSI" daarvoor bedanken.

Maar forensisch onderzoek - "met betrekking tot of omgaan met de toepassing van wetenschappelijke kennis op juridische problemen" (bedankt Merriam-Webster, daarvoor) is veel meer dan dijbenen en vingerafdrukken. Er zijn forensisch psychologen, bijvoorbeeld, en forensische ingenieurs. De American Academy of Forensic Scientists omvat zowel forensisch pathologen, degenen die zich bezighouden met de gewonden of doden, en forensische accountants. Elk gebied waar wetenschap en wetenschappelijke kennis op de wet kan worden toegepast - of het nu gaat om het oplossen van misdaden of gewoon om het verstrekken van informatie voor gebruik in zoiets alledaags als, zeggen, een lopend contract - is, per definitie, forensisch.

Zelfs experts in iets dat slaperig klinkt als taalkunde - de studie van taal en hoe deze wordt gebruikt en gestructureerd - kunnen als forensische wetenschappers worden beschouwd.

"Veel van het werk eerlijk gezegd, is nerd, " zegt James R. Fitzgerald, een forensisch linguïst en 20-jarige veteraan van de FBI die, bewijzen dat niet al het taalkundige werk slaperig is of voor nerds, hielp de zaak van Unabomber Ted Kaczynski in 1996 open te breken. "Je zit en telt het aantal stippen in meerdere punten van ellipsen ... die me in feite één keer hebben geholpen een zaak op te lossen. En je doet onderzoek op internet en verschillende corpora, over de frequentie van bepaalde leestekens, of alternatieve spelling van bepaalde woorden.

"Veel mensen kunnen amateur-linguïsten zijn. Maar er is echt iemand nodig die het veld bestudeert, het veld kennen, een echte waardering hebben voor het taalgebruik, dat volgens mij de beste forensische taalkundige is. Het is geen parttime optreden. Het moet worden genomen als een fulltime, serieus beroep."

Forensische taalkundigen, misschien vanwege hun aangeboren nerdigheid, misschien nooit een eigen tv-programma krijgen. Maar deze wetenschappers - en dat zijn wetenschappers, in de eerste plaats - kunnen op hun eigen manier mysteries en misdaad helpen oplossen.

Wat forensische taalkundigen doen

Begin september 2018, de New York Times publiceerde een anoniem opiniestuk dat was geschreven, de krant zei, door een hoge functionaris in de regering van president Donald Trump. Het essay was vernietigend in zijn weergave van een chaotisch Witte Huis en een uit de hand gelopen president. Direct, mensen in het hele land - vooral, misschien veelzeggend, in het Witte Huis - begon zich af te vragen: Wie schreef het?

Die vraag staat in het stuurhuis van de forensisch linguïst, een taak die Fitzgerald "auteursattributieanalyse" noemt:uitzoeken wie iets heeft geschreven, of dat een vernietigende opinie is, een losgeldbrief, een maatschappijschokkend manifest, een dreigende e-mail of een flagrant eenzijdige en misschien oneerlijke pizzarecensie op Yelp.

Een specifieke naam aan een specifieke groep woorden geven is niet altijd gemakkelijk of mogelijk, vooral als je maar één schrijfvoorbeeld hebt om mee te werken. Nog altijd ...

"Je kunt veel leren door naar één document te kijken - wat linguïstische demografische profilering wordt genoemd, " zegt Robert Leonard, de directeur van het afstudeerprogramma forensische taalkunde aan de Hofstra University en, met Fitzgerald, co-directeur van het Instituut voor Forensische Linguïstiek van de school, Dreigingsbeoordeling en strategische analyse. "Je kunt ontzettend veel leren over mensen, zonder het ergens mee te vergelijken, omdat je het eigenlijk vergelijkt met alle andere documenten die jij en alle andere taalkundigen sinds het begin der tijden hebben bestudeerd."

Wat kun je ontdekken?

"We kunnen zien of iemand zeer goed opgeleid is, misschien opgeleid in de sociale wetenschappen, hoe oud ze zijn, misschien, van de fraseologie die ze gebruiken, en veel, veel andere dingen, " zegt Leonard. "Welke werkervaring ze hebben, waar ze wonen ... "

Iets moeilijker te bepalen, Leonard zegt, is het geslacht van een persoon. Veranderende genderrollen hebben daar iets mee te maken.

Het profileren van een schrijver op basis van een enkel document kan onmiddellijk helpen om een ​​pool van vermoedelijke auteurs te verkleinen (naar, bijvoorbeeld, een goed opgeleide persoon van middelbare leeftijd uit het Midwesten die Engels als eerste taal spreekt). Een getrainde taalkundige kan een onbekende auteur verder ontmaskeren door met verschillende geschriften te werken, vervolgens het document in kwestie vergelijken met anderen waarvan de auteurs bekend zijn.

Hoe forensische taalkunde werkt

De taal van mensen, gesproken of geschreven, verschilt in veel opzichten, om vele redenen die kunnen omvatten (maar zijn lang niet beperkt tot) hun opleiding, hun omgeving, hun leeftijd, hun stemming en hun beoogde publiek.

Die verschillen, volgens Carole Chaski - zij is de uitvoerend directeur van het Institute for Linguistic Evidence, een non-profit organisatie voor wetenschappelijk onderzoek, en de chief executive officer van forensisch taalkundig adviesbureau ALIAS Technology - vallen in een paar categorieën. Uit een artikel dat ze schreef in de Journal of Law and Policy:

In de taaltheorie, taal is onderverdeeld in niveaus voor analytische doeleinden. Deze niveaus zijn geluid, woord, en woordcombinaties. Deze niveaus, respectievelijk, worden geanalyseerd in fonetiek en fonologie; morfologie en het lexicon; syntaxis; semantiek en pragmatiek; en prosodie.

Tot die categorieën behoren zaken als interpunctie en spelling, te. Forensische taalkundigen, dan, bij het onderzoeken van schrift, kijk wetenschappelijk naar alles, van het geheel tot hoe een bepaalde zin is opgebouwd tot het gebruik van een punt of een vraagteken of een apostrof. Ze kijken naar lidwoorden ("a" en "de"). Ze zoeken naar "gekenmerktheid, " een taalkundige term die verwijst naar hoe een bepaald woord of een bepaalde zin afwijkt van de norm.

"Als ik echt ga zitten met deze documenten, waar ik naar zoek zijn indicatoren van lexicale kenmerken; wat zijn de woorden die afzonderlijk worden gebruikt, zijn ze ongebruikelijk, zijn ze onderscheidend, zijn ze zeldzaam? Zijn ze uniek?" zegt Fitzgerald, die zijn leven en carrière profileerde in een serie van drie boeken 'A Journey to the Center of the Mind'. "Wat zijn enkele stilistische kenmerken van de auteur? Hoe gebruikt hij of zij interpunctie, hoe formatteren ze hun communicatie - en dat is belangrijk, te. Gebruiken ze puntkomma's, gebruiken ze em-streepjes, gebruiken ze streepjes ...

"Ik zoek natuurlijk naar fouten, en zijn het gedwongen fouten, zijn het fouten in een poging om de werkelijke identiteit van de auteur te verhullen, of lijken het natuurlijke fouten te zijn? Zoals ik altijd heb gezegd, het is veel gemakkelijker voor een anonieme auteur om te stompen dan om slim te zijn."

Bij het proberen de auteur van een anoniem geschrift te identificeren, misleiding is een veel voorkomende tactiek. In het opiniestuk van de New York Times, het woord "lodestar" werd in beslag genomen door verschillende forensische taalkundigen. Het is een woord dat vaak wordt gebruikt door vice-president Mike Pence.

De algemene overeenstemming, Hoewel, is dat het woord in het opiniestuk is geplaatst om taalkundigen op het spoor te komen van de echte auteur.

Auteurs Joe Klein en J.K. Rowling (ook bekend als Robert Galbraith) probeerde hun ware identiteit te verbergen toen ze hun boeken 'Primary Colors' en 'The Cuckoo's Calling' schreven. ' maar woordspeurders hebben ze ontdekt. Hoe dingen werken

Een woordspeurder worden

Anonimiteit werkt soms, maar forensische taalkundigen zijn een vervelende boel. Een Engelse professor aan Vassar, wat taalkundig speurwerk doen, Newsweek-columnist Joe Klein werd terecht ontmaskerd als de voorheen anonieme auteur van een roman over de eerste presidentiële run van Bill Clinton. "Harry Potter"-auteur J.K. Rowling werd bekend gemaakt als de schrijver van een detectiveroman, gepubliceerd onder de nom de plume Robert Galbraith.

Het identificeren van Kaczynski als de auteur van een anoniem manifest dat naar nieuwszenders werd gemaild, leidde tot zijn veroordeling. Dat blijft Fitzgeralds meest bekende geval. Hij en Leonard werkten aan de zaak JonBenét Ramsey, te, helpen in 2006 om iemand uit te sluiten die valselijk bekende de jonge Colorado-schoonheidskandidaat in 1996 te hebben vermoord.

De meeste forensische taalkunde is niet zo bekend, Hoewel. Het is nauwgezet werk, gedaan buiten de schijnwerpers voor een computer.

"Ik denk dat alle forensische wetenschappen lijden aan wat wordt genoemd, 'Het CSI-syndroom, ' waar alles in een uur netjes in een strik wordt vastgebonden, ", zegt Leonard, die - tussen haakjes - een eerdere carrière had als origineel lid van de rockgroep Sha Na Na en in 1969 optrad in Woodstock, vlak voor Jimi Hendrix. "Wat ik zoek in studenten is [dat ze zijn], natuurlijk, zeer intelligent en in staat om taalgegevens tot in het kleinste detail door te nemen. Niet alleen weten hoe taal werkt in termen van talen en dialecten en interactie tussen mensen in verschillende sociale groepen in verschillende talen, ... maar ook om te kunnen focussen op de kleinste datapunten, en begrijp de context waarin het voorkomt."

NU DAT IS INTERESSANT

Zoals met alle wetenschappen, Er bestaan ​​concurrerende opvattingen onder forensische taalkundigen. Chaski, bijvoorbeeld, neemt wat velen zouden beschouwen als een meer strikt wetenschappelijke kijk op het veld. Ze ontwikkelt en gebruikt computerprogramma's met complexe algoritmen om auteurs te identificeren. "[D]eze tools moeten zo betrouwbaar zijn, " vertelde ze The New Yorker, "dat ik ze kan automatiseren en iemand ze kan gebruiken ..." Ze pleit voor het vaststellen van "best practices" in het veld, gebruikmakend van informatie die doordrenkt is van "grondwaarheidsgegevens" en onafhankelijk is van rechtbanken en rechtszaken die de resultaten kunnen vertekenen. Ze wil dat deze praktijken worden getest en opnieuw worden getest en repliceerbaar zijn. Ze schuwt subjectieve opvattingen. "Best practices in forensische taalkunde zijn essentieel om het gebied van auteurschapsidentificatie voort te stuwen van een academisch of rechtshandhavingsadviesbureau naar een echte forensische wetenschap die nuttig is voor het gerechtelijk systeem, " zij schrijft.