Science >> Wetenschap >  >> anders

Het extraheren van intersectionele stereotypen uit Engelse tekst

Op taal gebaseerde eigenschapsstereotypen van FISE toegepast op statische inbedding. Elk paneel vertegenwoordigt de specifieke kenmerken die verband houden met elk intersectioneel kwadrant in het contrast van (A) geslacht per ras, (B) geslacht per klasse of (C) ras per klasse. Krediet:Charlesworth et al.

Het ontginnen van enorme datasets van het Engels onthult stereotypen over geslacht, ras en klasse die gangbaar zijn in Engelssprekende samenlevingen. Tessa Charlesworth en collega's ontwikkelden een stapsgewijze procedure, Flexible Intersectional Stereotype Extraction (FISE), die ze toepasten op miljarden woorden Engelse internettekst.



Deze procedure stelde hen in staat eigenschappen te onderzoeken die verband houden met intersectionele identiteiten, door te kwantificeren hoe vaak beroepslabels of bijvoeglijke naamwoorden voor eigenschappen werden gebruikt in de buurt van uitdrukkingen die verwezen naar meerdere identiteiten, zoals 'zwarte vrouwen', 'rijke mannen', 'arme vrouwen' of 'arme vrouwen'. Blanke mannen."

In hun analyse, gepubliceerd in PNAS Nexus laten de auteurs eerst zien dat de methode een geldige manier is om stereotypen te extraheren:beroepen die in werkelijkheid werden gedomineerd door bepaalde identiteiten (bijvoorbeeld architect, ingenieur, manager worden gedomineerd door blanke mannen) worden ook, in taal, sterk geassocieerd met diezelfde intersectionele groep in een tempo dat aanzienlijk boven de kans ligt:​​ongeveer 70%.

Vervolgens keken de auteurs naar persoonlijkheidskenmerken. Uit de FISE-procedure bleek dat 59% van de onderzochte eigenschappen verband hield met 'blanke mannen', maar slechts 5% van de eigenschappen werd geassocieerd met 'zwarte vrouwen'.

Volgens de auteurs wijzen de onevenwichtigheden in de frequentie van eigenschappen op een alomtegenwoordige androcentrische (op mannen gerichte) en etnocentrische (op blanken gerichte) vooroordelen in het Engels. De valentie (positiviteit/negativiteit) van de bijbehorende eigenschappen was ook niet in balans. Ongeveer 78% van de eigenschappen geassocieerd met "White Rich" was positief, terwijl slechts 21% van de eigenschappen geassocieerd met "Black Poor" positief was.

Patronen zoals deze hebben volgens de auteurs stroomafwaartse gevolgen voor AI, computervertaling en tekstgeneratie. Naast het inzicht in hoe intersectionele vooroordelen dergelijke uitkomsten bepalen, merken de auteurs op dat FISE kan worden gebruikt om een ​​reeks intersectionele identiteiten in verschillende talen en zelfs in de geschiedenis te onderzoeken.

Meer informatie: Tessa ES Charlesworth et al., Intersectionele stereotypen uit inbedding extraheren:ontwikkeling en validering van de flexibele intersectionele stereotype-extractieprocedure, PNAS Nexus (2024). DOI:10.1093/pnasnexus/pgae089

Aangeboden door PNAS Nexus