science >> Wetenschap >  >> Elektronica

Sites willen jouw (geanonimiseerde) social media data

Persoonlijke privacy balanceren met gedetailleerde inzichten. Krediet:Dawn Hudson/Shutterstock.com

De reacties van sociale-mediasites op het Facebook-Cambridge Analytica-schandaal en nieuwe Europese privacyregelgeving hebben gebruikers veel meer controle gegeven over wie toegang heeft tot hun gegevens, en voor welke doeleinden. Naar mij, als gebruiker van sociale media, dit zijn positieve ontwikkelingen:het is eng om te bedenken wat deze platforms zouden kunnen doen met de schat aan gegevens die over mij beschikbaar zijn. Maar als onderzoeker verhoogde beperkingen op het delen van gegevens maken me zorgen.

Ik ben een van de vele wetenschappers die afhankelijk zijn van data van sociale media om inzicht te krijgen in het handelen van mensen. In een haast om de privacy van individuen te beschermen, Ik maak me zorgen dat een onbedoeld slachtoffer kennis over de menselijke natuur kan zijn. Mijn meest recente werk, bijvoorbeeld, analyseert gevoelens die mensen op Twitter uiten om uit te leggen waarom de aandelenmarkt zo veel fluctueert in de loop van één dag. Er zijn toepassingen die veel verder gaan dan financiën. Andere wetenschappers hebben de tevredenheid van reizigers in het openbaar vervoer bestudeerd, het functioneren van noodwaarschuwingssystemen tijdens natuurrampen en hoe online interacties van invloed zijn op de wens van mensen om een ​​gezonde levensstijl te leiden.

Dit stelt een dilemma – niet alleen voor mij persoonlijk, maar voor de samenleving als geheel. De meeste mensen willen niet dat sociale-mediaplatforms hun persoonlijke informatie delen of verkopen, tenzij specifiek geautoriseerd door de individuele gebruiker. Maar als leden van een collectieve samenleving, het is nuttig om de sociale krachten op het werk te begrijpen die het dagelijks leven en langetermijntrends beïnvloeden. Vóór de recente crises Facebook en andere bedrijven maakten het legitieme onderzoekers al moeilijk om hun gegevens te gebruiken, onder meer door het moeilijker en duurder te maken om gegevens te downloaden en te openen voor analyse. De hernieuwde publieke druk voor privacy betekent dat het waarschijnlijk nog moeilijker wordt.

Social media data gebruiken in onderzoek

Het is absoluut verontrustend om te bedenken dat mensen of bedrijven mijn gegevens zouden kunnen analyseren en manieren vinden om mij te beïnvloeden om beslissingen te nemen die ik anders misschien niet zou nemen - of die zelfs in strijd zijn met mijn eigen belangen. Ik hoef alleen maar te denken aan het aantal keren dat ik tijdens een sportevenement een tv-reclame voor pizza heb gezien en een pizza heb besteld.

Dat is het punt van marketing, natuurlijk - maar sociale media is anders omdat de informatie specifiek over mij gaat. En het gebruik van die informatie kan veel meer beïnvloeden dan welk voedsel ik koop, zoals op wie ik stem. Echter, als onderzoeker in de financiële wereld, Ik erken ook dat dezelfde gegevens kunnen worden gebruikt om ons te helpen collectief gedrag te begrijpen dat anders onmogelijk te verklaren is.

Een deel van mijn onderzoek, bijvoorbeeld, onderzoekt kortetermijntrends in aandelenkoersen. Financiële experts hebben vastgesteld dat op de lange termijn, de aandelenkoersen van een bedrijf worden bepaald door de toekomstige waarde van het bedrijf. Maar in de loop van een enkele dag, aandelenkoersen kunnen sterk variëren. Veel financiële onderzoekers en financiële analisten zullen u vertellen dat deze bewegingen zinloos geluid zijn, schijnbaar willekeurige stukjes informatie over bedrijven die de perceptie van beleggers beïnvloeden en ervoor zorgen dat aandelenkoersen voortdurend variëren.

Maar door social media data te analyseren, Ik kan eigenlijk begrijpen wat dat geluid is, waar het vandaan komt en wat het betekent. Bijvoorbeeld, wat mensen op Twitter schrijven over de nieuwe iPhone heeft invloed op de aandelenkoers van Apple, soms binnen enkele minuten – maar zelfs in de loop van dagen. De snelheid van het effect hangt af van het belang of de bekendheid van de persoon die de tweet verzendt, en hoe snel anderen – inclusief de media – de boodschap oppikken.

De resultaten van mijn onderzoek kunnen beleggers helpen om te bepalen wanneer en hoe ze de markt betreden. Indien, bijvoorbeeld, gebruikers van sociale media denken dat de nieuwste iPhone niet zo goed zal zijn als verwacht, beleggers kunnen hun investering in Apple-aandelen uitstellen. Dat zou hen kunnen vrijmaken om te investeren in iets anders met een betere buzz, in de hoop op een hoger rendement.

Anonimiseren van gegevens

Het is waar - en zorgwekkend - dat sommige vermoedelijk onethische mensen hebben geprobeerd sociale-mediagegevens voor hun eigen voordeel te gebruiken. Maar de gegevens zijn niet het eigenlijke probleem, en de toegang van onderzoekers tot data afsnijden is niet de oplossing. Dit zou de samenleving ook de voordelen van sociale media-analyse ontnemen.

Gelukkig, er is een manier om dit dilemma op te lossen. Anonimisering van gegevens kan de individuele privacy van mensen intact houden, terwijl onderzoekers toegang krijgen tot collectieve data die belangrijke inzichten kunnen opleveren.

Er is zelfs een sterk model om dat evenwicht efficiënt te vinden:het U.S. Census Bureau. Al decenia, die overheidsinstantie heeft extreem persoonlijke gegevens verzameld van huishoudens in het hele land:leeftijden, arbeidsstatus, inkomensniveaus, Burgerservicenummers en politieke voorkeuren. De resultaten die het publiceert zijn zeer rijk, maar ook niet herleidbaar tot een individu.

Het is vaak technisch mogelijk om de anonimiteitsbescherming van gegevens, meerdere stukjes geanonimiseerde informatie gebruiken om de persoon te identificeren waar ze allemaal betrekking op hebben. Het Census Bureau neemt maatregelen om dit te voorkomen.

Bijvoorbeeld, wanneer leden van het publiek toegang hebben tot volkstellingsgegevens, het Census Bureau beperkt informatie die waarschijnlijk specifieke personen kan identificeren, zoals melden dat er slechts één persoon in een gemeenschap is met een bijzonder hoog of laag inkomensniveau.

Voor onderzoekers is het proces enigszins anders, maar biedt aanzienlijke bescherming, zowel in de wet als in de praktijk. Geleerden moeten het doorlichtingsproces van het Census Bureau doorstaan ​​om er zeker van te zijn dat ze legitiem zijn, en moeten training krijgen over wat ze wel en niet met de gegevens kunnen doen. De straffen voor het overtreden van de regels omvatten niet alleen het verbod op het gebruik van volkstellingsgegevens in de toekomst, maar ook civielrechtelijke boetes en zelfs strafrechtelijke vervolging.

Zelfs dan, wat onderzoekers krijgen komt zonder naam of burgerservicenummer. In plaats daarvan, het Census Bureau gebruikt wat het noemt "beschermde identificatiesleutels, " een willekeurig getal dat gegevens vervangt waarmee onderzoekers individuen kunnen identificeren.

De gegevens van elke persoon zijn gelabeld met zijn of haar eigen identificatiesleutel, waardoor onderzoekers informatie van verschillende typen kunnen koppelen. Bijvoorbeeld, een onderzoeker die wil bijhouden hoe lang het duurt voordat mensen een hbo-opleiding hebben voltooid, kan het opleidingsniveau van individuen in de loop van de tijd volgen, dankzij de identificatiesleutels.

Sociale-mediaplatforms zouden een soortgelijk anonimiseringsproces kunnen implementeren in plaats van de hindernissen - en kosten - om toegang te krijgen tot hun gegevens. Ze zouden gebruikersidentificatienummers kunnen toewijzen in plaats van hun echte identiteit te delen, en kunnen instemmen met overheidsvoorschriften die bepalen wie toegang kan krijgen tot welke gegevens, inclusief echte straffen voor het overtreden van de regels. Dan konden onderzoekers de inzichten ontdekken die het gebruik van sociale media biedt, net zoals ze doen met volkstellingsgegevens, zonder de privacy van mensen te bedreigen.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.