science >> Wetenschap >  >> anders

Sociale media kunnen inzicht geven in het welzijn van een gemeenschap, geleerde vondsten

Veel voorkomende woorden uit het woordenboek Linguistic Inquiry en Word Count Positive Emotion die zoals verwacht (boven) of onverwacht (onder) correleren met geluk in Gallup County. Krediet:Kokil Jaidka en Johannes C. Eichstaedt.

Sociale media kunnen meer onthullen dan alleen de stemming of gemoedstoestand van een enkele persoon. Het kan de psychologische toestanden van een hele populatie vastleggen, volgens nieuw onderzoek door Stanford-wetenschapper Johannes Eichstaedt.

Eichstaedts resultaten, gepubliceerd op 27 april in de Proceedings van de National Academy of Sciences , ontdekte dat door middel van machine learning - een computer leren patronen in grote datasets te identificeren en te analyseren - onderzoekers kunnen zien, in principe, hoe een samenleving het in realtime doet.

"Deze methoden laten echt zien hoe psychologische metingen in de 21e eeuw in onze digitale wereld kunnen worden uitgevoerd, " zei Eichstaedt, die een assistent-professor psychologie is aan de School of Humanities and Sciences en een junior fellow bij het Stanford Institute for Human-Centered Artificial Intelligence.

Het afgelopen decennium is Eichstaedt heeft het gebruik van sociale media getest, inclusief Twitter, als een manier om het welzijn van een gemeenschap te meten. Hij stelt dat sociale media de grootste dataset over gedrag, emoties en gedachten in de menselijke geschiedenis.

Hoewel de onderzoekers in de krant erkennen dat Twitter niet representatief is voor de Amerikaanse bevolking, het kan nog steeds inzicht geven in hoe mensen hun dagelijks leven ervaren.

"Waar het ons echt om gaat, is hoe goed de bevolking het doet op het gebied van psychologische en fysieke gezondheid, niet alleen dat het BBP groeit, "zei Eichstaedt. "Misschien geeft het je niet om het meten van subjectief welzijn op zich, maar subjectief welzijn heeft invloed op sterfte, waaronder hartaandoeningen. Het heeft ook gevolgen voor de economische resultaten. Dus, het is een vrij belangrijke variabele om vast te leggen voor een populatie."

Van enquêteonderzoek tot sociale media

Om de verschillende manieren te evalueren om het welzijn van een regio te analyseren, Eichstaedt en een team van onderzoekers vergeleken meer dan een miljard geo-tagged Tweets van 2009 tot 2015 met 1,7 miljoen reacties van de Gallup-Sharecare Well-Being Index, een diepgaand onderzoek dat meet hoe mensen het dagelijks leven ervaren.

Onderzoekers vertrouwen al lang op enquêtes zoals Gallup om het welzijn van een bevolking te meten. Hoewel nauwkeurig, het kunnen kostbare en tijdrovende ondernemingen zijn. Soms duurt het jaren om voldoende gegevens te verzamelen voor ruwe schattingen van de gemeenschap, zei Eichstaedt.

Maar wanneer aangevuld met datagestuurde technieken, een deel van die last kan worden verlicht. Eichstaedt ontdekte dat wanneer een algoritme wordt getraind met zowel de reacties van gebruikers op een schriftelijke welzijnsenquête als een steekproef van posts van sociale media van dezelfde respondenten, het kan dan op een veel grotere schaal worden ingezet om te voorspellen hoe mensen uit een hele regio zouden hebben gereageerd op een traditionele enquête, alleen gebaseerd op hun Tweets.

Woorden uit hun context begrijpen

Voordat machine learning-methoden werden gebruikt, onderzoekers kozen woorden of vroegen beoordelaars om woorden te annoteren voor hoe "positief" ze zijn. Maar het kan erg lastig zijn om woorden te kiezen die welzijn meten, zei Eichstaedt.

Bijvoorbeeld, de onderzoekers ontdekten dat internettaal zoals "LOL" - het populaire acroniem voor "hardop lachen" - en de woorden "goed" en "liefde" vaak werden gebruikt in gebieden met een lager inkomen en lager onderwijs (en, in het algemeen, lager welzijn). Dus ook al lijken dit positieve woorden, ze zijn misschien niet, zei Eichstaedt.

evenzo, Eichstaedt ontdekte dat woorden als 'huiswerk' en 'belastingen' uit hun verband negatief kunnen lijken, maar de onderzoekers ontdekten dat deze woorden meer werden gebruikt door mensen met een hogere opleiding en een hoger inkomen - een groep waarvan andere onderzoeken hebben vastgesteld dat ze doorgaans een hoger welzijn hebben.

"Als je woorden kiest om welzijn te meten, het is erg belangrijk om aandacht te besteden aan culturele verschillen in taalgebruik in de VS, ’ zei Eichstädt.

Maar machine learning-methoden kunnen helpen bepalen welke woorden belangrijker zijn dan andere. Toen het algoritme de posts op sociale media van een persoon vergeleek met hun enquêtereacties, het leerde dat woorden als 'LOL' geen betrouwbare indicatoren van welzijn zijn en gebruikte in plaats daarvan woorden als 'leuk' en 'opgewonden'.

"De computer de woorden laten leren is misschien wel de beste manier om woorden te vinden die welzijn meten, "Zei Eichstaedt. "Verschillen in taalgebruik kunnen behoorlijk complex zijn."

Toekomstig gebruik

De onderzoekers merken op dat welzijn ook wordt geassocieerd met andere belangrijke factoren, inclusief algehele gezondheid. Bijvoorbeeld, hoe gestrest mensen zijn, kan ongezond gedrag veroorzaken - zoals overmatig drinken of roken - dat op zijn beurt een negatieve invloed heeft op hun gezondheid, hij zei.

"Als mensen lijden aan depressies en angsten, we moeten het weten, zodat we ervoor kunnen zorgen dat ze over de middelen beschikken die ze nodig hebben, " zei Eichstaedt, die momenteel deze methode toepast om de impact van de nieuwe coronaviruspandemie op de bevolking van steden in de VS te bestuderen.

"COVID-19 is een natuurramp die onze sociale normen en routines op een ongekende schaal onderbreekt, "Zei Eichstaedt. "Met deze realtime op Twitter gebaseerde technologie, psychologen kunnen monitoren of eenzaamheid en angst zich voordoen in gemeenschappen, en hoe ons welzijn wordt beïnvloed door sociale afstand. Er is geen andere gegevensbron die zo'n meting op populatieschaal kan leveren en zo snel schattingen kan geven. Nu meer dan ooit, het gebruik van robuuste machine learning-methoden is erg belangrijk."