science >> Wetenschap >  >> anders

Kunnen computers helpen om partijdige scheidslijnen te dichten?

Willem Sethares. Krediet:Universiteit van Wisconsin-Madison

Onderzoekers van de Universiteit van Wisconsin-Madison gebruiken computers op nieuwe manieren om een ​​alomvattend beeld te krijgen van hoe mensen communiceren over politiek, en hoe die gesprekken vorm kunnen krijgen door media, sociale netwerken en persoonlijke interacties.

Wat hun computeranalyse vindt, de onderzoekers hopen, zou kunnen helpen de kloof te overbruggen tussen mensen aan weerszijden van het politieke gangpad die niet in staat zijn samen te komen om de problemen van de samenleving op te lossen omdat ze niet eens met elkaar kunnen praten - zozeer zelfs dat ze net zo goed verschillende talen kunnen spreken.

"Een van de belangrijkste vragen voor ons is:helpt het communicatiesysteem mensen om de problemen te begrijpen die ze definiëren in hun sociale en politieke leven?" zegt Lewis Friedland, een professor in UW-Madison's School voor Journalistiek en Massacommunicatie. "Of, hebben we een systeem dat de verdeeldheid tussen mensen juist verergert - dat het gemakkelijker maakt om op te delen in 'ingroups' en 'outgroups, ' om anderen te zien als in tegenstelling tot ons of onwaardig?"

Op basis van posts op sociale media, opiniepeilingen, berichtgeving en persoonlijke interviews uit heel Wisconsin die teruggaan tot 2010, Friedland en medewerkers zullen een beeld schetsen van politieke interacties als een levende, veranderende omgeving - een 'communicatie-ecologie' - met webben van interactie tussen mensen en instellingen in de staat. Ondersteund door financiering van het UW2020-initiatief, het is een van de meest ambitieuze pogingen ooit om te begrijpen hoe mensen in een hele staat over politiek praten, en hoe die gesprekken in de loop van de tijd zijn veranderd.

"Niemand heeft geprobeerd communicatie-ecologieën op staatsniveau te modelleren, vooral over acht jaar, ", zegt Friedland. "Er is een enorme creativiteit nodig bij het verzamelen van gegevens, het modelleren van relaties en het ontwikkelen van analysemethoden."

De onderzoekers benutten de kracht van machine learning, waarin UW-Madison een toonaangevende innovator is, om te detecteren hoe mensen van tegengestelde politieke overtuigingen verschillende betekenissen toekennen aan dezelfde woorden.

Bijvoorbeeld, het woord 'regulering' kan voor liberalen en conservatieven aanzienlijk verschillende connotaties hebben - 'nuttig en noodzakelijk' of 'lastig en invasief'. Hoewel die gevoelens misschien intuïtief lijken, het is moeilijk om nauwkeurig te definiëren en te kwantificeren hoe mensen betekenissen aan woorden toekennen.

Machine learning biedt een oplossing voor dat probleem door woorden om te zetten in geometrische concepten, vectoren genaamd, en door wiskundige bewerkingen te gebruiken om vergelijkingen te maken.

"Vectoren laten je iets zien over de woorden, " zegt William Sethares, een UW-Madison professor in elektrische en computertechniek en medewerker aan het project. "Eenvoudige dingen zoals synoniemen hebben vergelijkbare vectoren, en vectoren voor analoge woorden zullen dezelfde relaties met elkaar hebben."

Vectoren zijn abstracte objecten die lengte en richting hebben; in twee dimensies, een vector ziet eruit als een pijlsymbool. Woordvectoren zijn vergelijkbaar met eenvoudige pijlen, behalve dat ze in veel meer dimensies bestaan. Ook al zou het onmogelijk zijn om woordvectoren op een plat vel papier te tekenen, de voorstellingen voor "koning" en "koningin" zouden, in zekere zin, wijzen in dezelfde richtingen ten opzichte van elkaar als die voor "jongen" en "meisje".

Na vergelijking van vectoren van ongeveer 2, 000 tweets gepost door liberalen, conservatieven en onpartijdige, de onderzoekers identificeerden de top 10 woorden met verschillende gebruiken tussen politieke ideologieën, waaronder "politicus, " "overheid" en "milieu."

Het onthullen van die verschillen vereiste een nieuwe computationele benadering, ontwikkeld door Sethares en afgestudeerde student Prathusha Sarma.

Het proces van het transformeren van woorden in vectoren heet inbedding, en het gaat meestal om programmeeralgoritmen om door enorme hoeveelheden tekst te bladeren, zoals het geheel van Wikipedia of elk Google-nieuwsverhaal dat ooit is gepubliceerd.

The problem is that the powerful generic word embeddings from giant databases like Wikipedia often miss nuances in language—after all, every word becomes one single vector, so terms with multiple meanings can confuse even the smartest algorithms (think of "hack, " which can describe either what an ax does, a computer invasion, or an untalented writer).

While those subtle differences might emerge in specific data sets, like the text of 2, 000 political tweets, there simply wouldn't be enough words to construct accurate vectors.

"Any small niche uses words in its own way, " says Sethares. "The things that work really well require billions of words, so we're caught in a trap because we can't train algorithms on a small data set."

In plaats daarvan, Sethares and Sarma found an effective method to combine the strength of word embeddings derived from Wikipedia with the specificity of political tweets. Their algorithm not only identified words that conservatives and liberals use differently, but also predicted the political ideology of a tweet's author with roughly 90 percent accuracy based on language alone.

Sethares and colleagues plan to apply the same machine learning approaches to Wisconsin political news and campaign speeches. The approach could enable them to draw comparisons between political dialogue in urban and rural communities as well as examine how partisan word meanings may have shifted over time.

They then will combine information about word meanings with additional layers of data, including insights from in-person interviews, election results and historical statistics from public opinion polling. The resulting communication ecology will offer unprecedented insights into how the Wisconsin political environment is evolving.

"The environment is getting noisier and noisier, " says Friedland. "People who have limited time and attention can only focus on so much in a given day."

And even though untangling partisan gridlock will require substantial empathy and effort from people across the political spectrum, understanding the communication environment is an important first step toward bridging the divide, Friedland adds.