science >> Wetenschap >  >> Elektronica

Nieuw algoritme voor machine learning kan leeftijd en geslacht voorspellen op basis van alleen je Twitter-profiel

Nieuw algoritme voor machine learning kan leeftijd en geslacht voorspellen op basis van alleen je Twitter-profiel. Krediet:Shutterstock

Een nieuwe "demografische inferentie"-tool, ontwikkeld door academici, kan voorspellingen doen die uitsluitend zijn gebaseerd op de informatie in iemands sociale-mediaprofiel (d.w.z. schermnaam, biografie, profielfoto, en naam). De tool, die in 32 talen werkt, zou de weg kunnen effenen voor het meenemen van standpunten op sociale media in populaire enquêtemethoden.

Onderzoekers van de Universiteit van Oxford, Universiteit van Michigan, Universiteit van Massachusetts, GESIS – Leibniz Instituut voor Sociale Wetenschappen, het Max Planck Instituut, en Stanford University hebben een methode ontwikkeld om informatie over een eigenaar van een sociale-media-account af te leiden op basis van de informatie die is bekendgemaakt in hun Twitter-profielinformatie.

Een nieuw machine learning-systeem - deze week onthuld op de webconferentie in San Francisco - leerde de patronen die verband houden met verschillende leeftijden, geslachten, en tussen organisaties en individuen uit een dataset van meer dan vier miljoen Twitter-accounts in 32 talen. Deze informatie werd vervolgens gecombineerd met geschatte locaties en opnieuw gewogen tegen censusgegevens om nauwkeurigere schattingen van de bevolking in 1 te produceren. 101 statistische regio's in de hele EU.

Dit zou de weg kunnen effenen voor een meer representatief begrip van de opvattingen van mensen over belangrijke maatschappelijke kwesties en onderwerpen, op basis van wat ze op sociale media plaatsen en toegeschreven aan specifieke geografische locaties en demografische groepen.

Dr. Scott Hale, Senior onderzoeker, Oxford Internet Instituut, University of Oxford zei:"Ondanks het verstrekken van veel datapunten, sociale media zijn lange tijd een onbetrouwbaar hulpmiddel geweest om te begrijpen welke problemen het belangrijkst zijn voor een bredere bevolking, gegeven hoe mensen zichzelf selecteren om een ​​​​platform te gebruiken.

"Dit eerste onderzoek in zijn soort voert demografische voorspellingen uit over de eigenaar van een sociale media-account, puur op basis van de profielinformatie van het account in 32 talen en herweegt vervolgens de online steekproef om meer op een offline populatie te lijken.

"We zien dit als een belangrijke stap in de richting van het gebruik van sociale media om een ​​nauwkeuriger beeld te krijgen van de problemen en onderwerpen die het publiek het meest interesseren en om te begrijpen welke standpunten over- of ondervertegenwoordigd zijn."

Deze informatie en gegevens die aan dit onderzoek ten grondslag liggen, zijn beschikbaar gesteld in een open source-bibliotheek en u kunt de inferentietool testen op www.euagendas.org/m3demo