science >> Wetenschap >  >> Elektronica

Taalveranderingen in gender- en etnische stereotypen correleerden met grote sociale bewegingen en demografische veranderingen

Krediet:CC0 Publiek Domein

Kunstmatige-intelligentiesystemen en algoritmen voor machinaal leren liggen de laatste tijd onder vuur omdat ze bestaande vooroordelen in onze samenleving kunnen oppikken en versterken, afhankelijk van de gegevens waarmee ze zijn geprogrammeerd.

Maar een interdisciplinaire groep Stanford-wetenschappers zette dit probleem op zijn kop in een nieuwe... Proceedings van de National Academy of Sciences paper gepubliceerd op 3 april.

De onderzoekers gebruikten woordinbedding - een algoritmische techniek die relaties en associaties tussen woorden in kaart kan brengen - om veranderingen in gender- en etnische stereotypen in de afgelopen eeuw in de Verenigde Staten te meten. Ze analyseerden grote databases van Amerikaanse boeken, kranten en andere teksten en bekeken hoe die taalkundige veranderingen correleerden met actuele demografische gegevens van de Amerikaanse volkstelling en grote sociale verschuivingen zoals de vrouwenbeweging in de jaren zestig en de toename van de Aziatische immigratie, volgens het onderzoek.

"Woordinbeddingen kunnen worden gebruikt als een microscoop om historische veranderingen in stereotypen in onze samenleving te bestuderen, " zei James Zou, een assistent-professor biomedische datawetenschap. "Ons eerdere onderzoek heeft aangetoond dat inbeddingen bestaande stereotypen effectief vastleggen en dat die vooroordelen systematisch kunnen worden verwijderd. Maar we denken dat, in plaats van die stereotypen te verwijderen, we kunnen inbeddingen ook gebruiken als historische lens voor kwantitatieve, taalkundige en sociologische analyses van vooroordelen."

Zou was co-auteur van het artikel met geschiedenisprofessor Londa Schiebinger, linguïstiek en informatica Professor Dan Jurafsky en afgestudeerde elektrotechniekstudent Nikhil Garg, wie was de hoofdauteur.

"Dit soort onderzoek opent allerlei deuren voor ons, "Zei Schiebinger. "Het biedt een nieuw niveau van bewijs dat geesteswetenschappers in staat stelt om vragen te stellen over de evolutie van stereotypen en vooroordelen op een schaal die nog nooit eerder is gedaan."

De geometrie van woorden

Een woord inbedding is een algoritme dat wordt gebruikt, of getraind, op een verzameling tekst. Het algoritme wijst vervolgens een geometrische vector toe aan elk woord, elk woord weergeeft als een punt in de ruimte. De techniek maakt gebruik van locatie in deze ruimte om associaties tussen woorden in de brontekst vast te leggen.

"Inbeddingen zijn een krachtig taalkundig hulpmiddel voor het meten van subtiele aspecten van woordbetekenis, zoals vooroordelen, ' zei Jurafsky.

Neem het woord 'eervol'. Met behulp van de inbeddingstool, uit eerder onderzoek bleek dat het bijvoeglijk naamwoord een nauwere relatie heeft met het woord 'man' dan het woord 'vrouw'.

In zijn nieuwe onderzoek het Stanford-team gebruikte inbeddingen om specifieke beroepen en bijvoeglijke naamwoorden te identificeren die bevooroordeeld waren ten opzichte van vrouwen en bepaalde etnische groepen in het decennium van 1900 tot heden. De onderzoekers trainden die inbeddingen in krantendatabases en gebruikten ook inbeddingen die eerder waren getraind door Stanford-student informatica, Will Hamilton, op andere grote tekstdatasets. zoals het Google Books-corpus van Amerikaanse boeken, die meer dan 130 miljard woorden bevat die in de 20e en 21e eeuw zijn gepubliceerd.

De onderzoekers vergeleken de vooroordelen die door die inbeddingen werden gevonden met demografische veranderingen in de gegevens van de Amerikaanse volkstelling tussen 1900 en heden.

Verschuivingen in stereotypen

De onderzoeksresultaten lieten in de 20e eeuw kwantificeerbare verschuivingen zien in genderafbeeldingen en vooroordelen ten opzichte van Aziaten en andere etnische groepen.

Een van de belangrijkste bevindingen die naar voren kwam, was hoe vooroordelen ten opzichte van vrouwen in de loop van de tijd ten goede veranderden.

Bijvoorbeeld, bijvoeglijke naamwoorden zoals "intelligent, "Logisch" en "bedachtzaam" werden in de eerste helft van de 20e eeuw meer geassocieerd met mannen. Maar sinds de jaren zestig dezelfde woorden zijn in toenemende mate geassocieerd met vrouwen met elk volgend decennium, in verband met de vrouwenbeweging in de jaren zestig, hoewel er nog steeds een kloof is.

Het onderzoek toonde ook een dramatische verandering in stereotypen ten opzichte van Aziaten en Aziatische Amerikanen.

Bijvoorbeeld, in de jaren 1910, woorden als "barbaars, "monsterlijk" en "wreed" waren de bijvoeglijke naamwoorden die het meest werden geassocieerd met Aziatische achternamen. die bijvoeglijke naamwoorden werden vervangen door woorden als "geremd, "passief" en "gevoelig." Deze taalverandering correleert met een sterke toename van de Aziatische immigratie naar de Verenigde Staten in de jaren zestig en tachtig en een verandering in culturele stereotypen, aldus de onderzoekers.

"De grimmigheid van de verandering in stereotypen viel me op, ' zei Garg. 'Als je geschiedenis bestudeert, je leert over propagandacampagnes en deze achterhaalde opvattingen van buitenlandse groepen. Maar hoeveel de destijds geproduceerde literatuur die stereotypen weerspiegelde, was moeilijk te waarderen."

Algemeen, de onderzoekers toonden aan dat veranderingen in de woordinbedding nauw volgden met demografische verschuivingen gemeten door de Amerikaanse volkstelling.

Vruchtbare samenwerking

Het nieuwe onderzoek belicht de waarde van interdisciplinair teamwerk tussen geesteswetenschappen en wetenschappen, aldus onderzoekers.

Schiebinger zei dat ze contact had gezocht met Zou, die in 2016 bij Stanford kwam, nadat ze zijn eerdere werk had gelezen over het de-biasing van machine learning-algoritmen.

"Dit heeft geleid tot een zeer interessante en vruchtbare samenwerking, "Schiebinger zei, eraan toevoegend dat leden van de groep samen aan verder onderzoek werken.

"Het onderstreept het belang van samenwerking tussen humanisten en computerwetenschappers. Deze nieuwe methoden voor machinaal leren in geesteswetenschappelijk onderzoek hebben een kracht die nog maar net wordt begrepen, " ze zei.