Wetenschap
Deze woordwolk toont reacties op sociale media op de vraag waar Rohingya-vluchtelingen naartoe moeten. Krediet:Carnegie Mellon University
Maak de volgende zin af:Rohingya-vluchtelingen moeten naar ... —
A. Pakistan.
B. Bangladesh.
C. Hel.
Dit zijn geen goede keuzes, maar het zijn allemaal gevoelens die herhaaldelijk op sociale media zijn geuit. De Rohingya's, die in 2017 Myanamar begon te ontvluchten om etnische zuivering te vermijden, zijn slecht toegerust om zichzelf te verdedigen tegen deze online aanvallen, maar innovaties van het Language Technologies Institute (LTI) van de Carnegie Mellon University kunnen helpen de haatzaaiende uitlatingen tegen hen en andere stemloze groepen tegen te gaan.
De LTI-onderzoekers hebben een systeem ontwikkeld dat gebruikmaakt van kunstmatige intelligentie om snel honderdduizenden reacties op sociale media te analyseren en de fractie te identificeren die rechteloze minderheden zoals de Rohingya-gemeenschap verdedigt of ermee sympathiseert. Menselijke moderatoren van sociale media, die onmogelijk zoveel opmerkingen handmatig kunnen doorzoeken, zou dan de optie hebben om deze "hulptoespraak" in commentaarsecties te markeren.
"Zelfs als er veel haatdragende inhoud is, we kunnen nog steeds positieve opmerkingen vinden, " zei Ashiqur R. KhudaBukhsh, een postdoctoraal onderzoeker in het LTI die het onderzoek deed met alumnus Shriphani Palakodety. Het vinden en benadrukken van deze positieve opmerkingen, Ze stellen voor, zou net zoveel kunnen doen om het internet veiliger te maken, een gezondere plek, zoals het detecteren en elimineren van vijandige inhoud of het verbieden van de verantwoordelijke trollen.
Aan zichzelf overgelaten, de Rohingya's zijn grotendeels weerloos tegen online haatzaaiende uitlatingen. Velen van hen hebben een beperkte vaardigheid in wereldtalen zoals Engels, en ze hebben weinig toegang tot internet. De meesten hebben het te druk met proberen in leven te blijven om veel tijd te besteden aan het posten van hun eigen inhoud, zei KhudaBukhsh.
Om relevante hulptoespraak te vinden, de onderzoekers gebruikten hun techniek om meer dan een kwart miljoen reacties van YouTube te doorzoeken in wat volgens hen de eerste AI-gerichte analyse van de Rohingya-vluchtelingencrisis is. Ze zullen hun bevindingen presenteren op de jaarlijkse conferentie van de Association for the Advancement of Artificial Intelligence, 7-12 februari, in New York City.
evenzo, in een nog niet gepubliceerde studie, ze gebruikten de technologie om te zoeken naar anti-oorlogs "hooptoespraak" onder bijna een miljoen YouTube-commentaren rond de Pulwama-terreuraanval van februari 2019 in Kasjmir, die het al lang bestaande geschil tussen India en Pakistan over de regio aanwakkerde.
Het vermogen om zulke grote hoeveelheden tekst te analyseren voor inhoud en mening is mogelijk dankzij recente grote verbeteringen in taalmodellen, zei Jaime Carbonell, LTI-directeur en co-auteur van het onderzoek. Deze modellen leren van voorbeelden, zodat ze kunnen voorspellen welke woorden waarschijnlijk in een bepaalde volgorde zullen voorkomen en machines kunnen helpen begrijpen wat sprekers en schrijvers proberen te zeggen.
Maar de CMU-onderzoekers ontwikkelden een verdere innovatie die het mogelijk maakte om deze modellen toe te passen op korte sociale-mediateksten in Zuid-Azië, hij voegde toe. Korte stukjes tekst, vaak met spel- en grammaticafouten, zijn voor machines moeilijk te interpreteren. In Zuid-Aziatische landen is het nog moeilijker, waar mensen meerdere talen kunnen spreken en de neiging hebben om te "code-switchen, " het combineren van stukjes van verschillende talen en zelfs verschillende schrijfsystemen in dezelfde verklaring.
Bestaande machine learning-methoden creëren representaties van woorden, of woordinbeddingen, zodat alle woorden met een vergelijkbare betekenis op dezelfde manier worden weergegeven. Deze techniek maakt het mogelijk om de nabijheid van een woord tot anderen in een opmerking of post te berekenen. Om deze techniek uit te breiden naar de uitdagende teksten van Zuid-Azië, het CMU-team verkreeg nieuwe inbeddingen die taalgroeperingen of -clusters aan het licht brachten. Deze taalidentificatietechniek werkte even goed of beter dan commercieel beschikbare oplossingen.
Deze innovatie is een technologie geworden voor computationele analyses van sociale media in die regio, merkte Carbonell op.
Uit steekproeven van de YouTube-opmerkingen bleek dat ongeveer 10% van de opmerkingen positief was. Toen de onderzoekers hun methode gebruikten om te zoeken naar hulpspraak in de grotere dataset, de resultaten waren 88% positief, wat aangeeft dat de methode de handmatige inspanning die nodig is om ze te vinden aanzienlijk kan verminderen, zei KhudaBukhsh.
"Geen land is te klein om vluchtelingen op te nemen, "zei een sms, terwijl een ander betoogde dat "alle landen een standpunt zouden moeten innemen voor deze mensen."
Maar het detecteren van pro-Rohingya-teksten kan een tweesnijdend zwaard zijn:sommige teksten kunnen taal bevatten die als haatzaaiende uitlatingen tegen hun vermeende vervolgers kan worden beschouwd, hij voegde toe.
Antagonisten van de Rohingya zijn "echt een beetje zoals dieren, niet zoals mensen, dus daarom genocide op onschuldige mensen, " zei een dergelijke tekst. Hoewel de methode handmatige inspanningen vermindert, opmerkingen zoals deze wijzen op de voortdurende behoefte aan menselijk oordeel en aan verder onderzoek, concludeerden de wetenschappers.
Wetenschap © https://nl.scienceaq.com