science >> Wetenschap >  >> Elektronica

Facebook-gegevensverzameling - wat u moet weten

Een wassen beeld van Facebook-baas Mark Zuckerberg. Krediet:Shutterstock

Facebook verdient het grootste deel van zijn geld met advertenties, en - terwijl het Cambridge Analytica-schandaal het bedrijf van Mark Zuckerberg blijft achtervolgen - eisen gebruikers te weten hoe hun gegevens worden geruzied en verzameld.

Maar terwijl de bezorgdheid over de privacy van Facebook-gebruikers is toegenomen, het is duidelijk sinds de oprichting van Facebook dat zijn bedrijf is gebaseerd op wijdverbreide surveillance van mensen, wiens gegevens het product zijn.

Sommigen hebben de onthullingen van het Cambridge Analytica-schandaal – waarin gegevens zouden zijn verzameld van 50 miljoen Facebook-profielen – afgeschilderd als een "existentiële crisis", terwijl anderen potentiële implicaties voor academisch onderzoek hebben benadrukt.

Kortom, De methoden voor het verzamelen van gegevens van Facebook zijn een onderwerp van plotselinge en wijdverbreide bezorgdheid geworden.

Wat is dataverzameling?

Gegevens oogsten, zoals de agrarische naam doet vermoeden, is vergelijkbaar met het oogsten van gewassen, omdat het gaat om verzamelen en opslaan met de verwachting van toekomstige beloning.

Gegevens kunnen op verschillende manieren worden verzameld, variërend van eenvoudig kopiëren en plakken tot ingewikkelder programmeren. De gekozen methode wordt vaak beperkt door de site die wordt geoogst. Op eenvoudige zoekniveaus, veel sites bestrijden automatisch oogsten met Google CAPTCHA's en reCAPTCHA's, die sites helpen onderscheid te maken tussen mensen en bots.

Als je ooit tekst van Facebook hebt gekopieerd en geplakt of een afbeelding van Twitter hebt opgeslagen, je hebt gegevens van sociale media verzameld. De actie van "screenshots" is op de meeste sites toegestaan, omdat gebruikers meestal alleen toegang hebben tot informatie die openbaar of voor hen zichtbaar is omdat ze zijn ingelogd. het zou onmogelijk zijn om de eenvoudigste methoden voor het verzamelen van gegevens volledig uit te bannen, zoals het maken van aantekeningen en het maken van foto's.

Facebook en andere sociale netwerken houden zich meer bezig met het beperken van geautomatiseerde gegevensverzameling, vanwege de eisen aan webservers en om te bepalen wie toegang heeft tot welke gegevens (en waarom). Persoonlijke informatie en gedrag op sociale media hebben commerciële, politieke en onderzoekswaarde.

Sociale netwerken bepalen hun eigen gebruiksbeleid, het balanceren van commerciële belangen met derden en zorgen over de privacy van gebruikers van regelgevende instanties - vaak beschreven in bedrijfsdocumenten als jongleren met het optimaliseren van "klantgedrag" en het naleven van "gemeenschapsnormen".

Hoe worden gegevens verzameld?

Application Programming Interfaces (API's) worden gebruikt door Facebook, Twitter, Instagram en andere sites om de toegang van potentiële oogsters te beperken. API's werken als een software-tussenpersoon waarmee de computer van een onderzoeker of app-ontwikkelaar op een gecontroleerde manier kan 'praten' met een sociaal netwerk.

Lees meer:​​Hoe het Facebook-targetingmodel van Cambridge Analytica echt werkte – volgens de persoon die het heeft gebouwd

Een van de belangrijkste voorwaarden betreft beperkingen op de manier waarop verzamelde gegevens kunnen worden gebruikt en gedeeld, die agressief kan worden nagestreefd. In 2010, computerprogrammeur Pete Warden verzamelde gegevens van 210 miljoen openbare Facebook-profielen voor onderzoeksdoeleinden. Maar hij slaagde er niet in eerst toestemming te vragen aan Facebook, waardoor de servicevoorwaarden worden geschonden. Later werd hij geconfronteerd met de dreiging van juridische stappen van Facebook en werd hij gedwongen de gegevens te verwijderen - in navolging van de vermeende rol van academisch onderzoeker Aleksandr Kogan in het Cambridge Analytica-schandaal.

Kogan's app, genaamd "thisyourdigitallife", ontwikkeld in 2014 via zijn bedrijf Global Science Research (GSR) – los van zijn universitaire werk – was een persoonlijkheidstest die 270, 000 gebruikers ingelogd, accepteren dat het toegang zou hebben tot sommige van hun persoonlijke informatie en ook tot sommige van de gegevens van hun vrienden. Het betekende ook dat die vrienden niet hadden ingestemd met het gebruik van hun gegevens op deze manier.

Facebook werkt zijn API regelmatig bij en in 2014 bevestigde het bedrijf dat het zou stoppen met het toestaan ​​van apps van derden om toegang te krijgen tot gegevens over de vrienden van app-gebruikers. Hierdoor werd de methode voor het verzamelen van gegevens die door Kogan zou worden gebruikt, uitgeschakeld.

Er zijn een paar verschillende manieren waarop ontwikkelaars - die moeten instemmen met het beleid van Facebook - gegevens kunnen verzamelen met behulp van de API van het bedrijf en ze gaan allemaal uit van basisvaardigheden voor computerprogrammering. Een van de gemakkelijkste manieren om dit te doen, is door toegang te krijgen tot de API met behulp van een gespecialiseerde softwaretoolbox - Python en R hebben tools die speciaal voor dit doel zijn ontworpen. In mijn onderzoek, Ik gebruik het Rfacebook-pakket om Facebook-gegevens te verzamelen.

Een belangrijk onderscheid tussen mijn app en anderen is dat ik geen interactie heb met gebruikers, omdat mijn app niet live is. Mijn app is in wezen een geautomatiseerde manier om informatie van openbare Facebook-groepen te kopiëren en plakken. Ik gebruik de Facebook API om te onderzoeken hoe openbare groepspagina's zijn gebruikt om te protesteren tegen bezuinigingen in Ierland.

Omdat ik openbare gegevens van openbare pagina's verzamel, Ik vraag gebruikers niet om in te loggen en er is geen front-end interface op Facebook, hoewel dit kan worden gedaan met behulp van de API-toolkits van Facebook om de hoeveelheid gegevens die toegankelijk is uit te breiden. Het is een methode die een aantal vragen oproept over functionaliteit, gebruikersinformatie en toegangsrechten.

De API van Facebook kan worden gebruikt om allerlei openbaar beschikbare informatie te verzamelen, zoals enkele recente berichten van The Conversation UK of berichten in openbare groepen.

Maar pogingen om verder te gaan dan openbare informatie om gegevens te verzamelen van Facebook-gebruikers die niet zijn ingelogd op de app, zoals Zuckerberg, bijvoorbeeld - fouten retourneren. Facebook "likes" kunnen niet worden verzameld omdat Zuckerberg geen gebruiker van mijn app is en hij hem geen toestemming heeft gegeven om toegang te krijgen tot zijn gegevens.

Onder de laatste API-updates van Facebook, app-machtigingen zijn vereist om informatie te verzamelen die verder gaat dan openbare profieleigenschappen. Dit betekent dat gebruikers moeten inloggen op een app en toegang moeten verlenen tot andere informatie, zodat ontwikkelaars de gegevens kunnen verzamelen.

Legitiem onderzoek bedreigd?

Hoewel bedrijven vol advertenties duidelijk belang hebben bij het "gebruiken" van gegevens, academici hebben de afgelopen weken de aandacht gevestigd op onderzoekers die Facebook-gegevens verzamelen. De praktijk is relatief mainstream geworden in sociaalwetenschappelijk onderzoek.

De mate waarin toekomstig onderzoek zou kunnen worden beperkt door wijzigingen in de API van Facebook, is dringend. Maar het is vermeldenswaard dat, zodra de gegevens zijn verzameld, Facebook - dat legaal mensen kan vervolgen die zijn servicevoorwaarden "schenden" om te proberen hen te dwingen gegevens te verwijderen - heeft beperkte controle over waar de gegevens terechtkomen.

Voor onderzoekers die zich zorgen maken over hoe het Cambridge Analytica-schandaal hun werk zal beïnvloeden, het is de moeite waard om in de gaten te houden welke veranderingen Facebook doorvoert in de volgende API-update. Het kan een beter inzicht geven in het soort onderzoek dat kan worden toegestaan ​​door het gebruik van verzamelde Facebook-gegevens - en wat permanent kan worden uitgesloten.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.