science >> Wetenschap >  >> Elektronica

Haatdragende taal op Twitter voorspelt frequentie van echte haatmisdrijven

Krediet:CC0 Publiek Domein

Volgens een eerste-van-zijn-soort studie, steden met een hogere incidentie van een bepaald soort racistische tweets meldden meer werkelijke haatmisdrijven gerelateerd aan ras, etniciteit, en nationale afkomst.

Een onderzoeksteam van de New York University analyseerde de locatie en taalkundige kenmerken van 532 miljoen tweets die tussen 2011 en 2016 werden gepubliceerd. Ze trainden een machine learning-model - een vorm van kunstmatige intelligentie - om twee soorten tweets te identificeren en te analyseren:de tweets die rechtstreeks zijn gericht het aanhangen van discriminerende opvattingen - en degenen die zelfverhalend zijn - die discriminerende opmerkingen of handelingen beschrijven of becommentariëren. Het team vergeleek de prevalentie van elk type discriminerende tweet met het aantal werkelijke haatmisdrijven dat in diezelfde periode in diezelfde steden werd gemeld.

Het onderzoek werd geleid door Rumi Chunara, een assistent-professor computerwetenschappen en techniek aan de NYU Tandon School of Engineering en biostatistiek aan het NYU College of Global Public Health, en Stephanie Kok, een assistent-professor biostatistiek en sociale en gedragswetenschappen aan het NYU College of Global Public Health.

"We ontdekten dat meer gerichte, discriminerende tweets gepost in een stad die verband houden met een hoger aantal haatmisdrijven, " zei Chunara. "Deze trend in verschillende soorten steden (bijvoorbeeld Stedelijk, landelijk, groot, en klein) bevestigt de noodzaak om meer specifiek te onderzoeken hoe verschillende soorten discriminerende uitingen online kunnen bijdragen aan de gevolgen in de fysieke wereld."

De analyse omvatte steden met een breed scala aan verstedelijking, verschillende gradaties van bevolkingsdiversiteit, en verschillende niveaus van gebruik van sociale media. Het team beperkte de dataset tot tweets en vooringenomen misdaden die ras, discriminatie op grond van etnische of nationale afkomst. Haatmisdrijven worden gecategoriseerd en gevolgd door de Federal Bureau of Investigation, en misdaden gemotiveerd door ras, etniciteit, of nationale afkomst vertegenwoordigen het grootste deel van de haatmisdrijven in de natie. Statistieken over seksuele geaardheidsmisdrijven waren niet in alle steden beschikbaar, hoewel de onderzoekers deze vorm van vooringenomenheid eerder hebben bestudeerd.

De groep identificeerde ook een reeks discriminerende termen en uitdrukkingen die vaak worden gebruikt op sociale media in het hele land, evenals termen die specifiek zijn voor een bepaalde stad of regio. Deze inzichten kunnen nuttig zijn bij het identificeren van groepen die mogelijk het doelwit zijn van racistisch gemotiveerde misdaden en vormen van discriminatie op verschillende plaatsen. Hoewel de meeste tweets in deze analyse zijn gegenereerd door echte Twitter-gebruikers, het team ontdekte dat gemiddeld 8% van de tweets met gerichte discriminerende taal werd gegenereerd door bots.

Er was een negatief verband tussen het aandeel van op ras/etniciteit/nationale afkomst gebaseerde discriminatie-tweets die zelfvertellingen van ervaringen waren en het aantal misdaden op basis van dezelfde vooroordelen in steden. Chunara merkte op dat, hoewel ervaringen met discriminatie in de echte wereld bekende psychologische stressoren zijn met gezondheids- en sociale gevolgen, de implicaties van online blootstelling aan verschillende soorten online discriminatie - zelfvertellingen versus gerichte, bijvoorbeeld - verder onderzoek nodig.

Deze resultaten vertegenwoordigen een van de grootste, meest uitgebreide analyses van discriminerende posts op sociale media en echte vooroordelen in dit land, hoewel de onderzoekers benadrukken dat de specifieke causale mechanismen tussen haatspraak op sociale media en echte gewelddaden moeten worden onderzocht.