science >> Wetenschap >  >> Elektronica

Facebooks datalockdown is een ramp voor academische onderzoekers

Krediet:Shutterstock

Facebook heeft onlangs drastische beperkingen voor gegevenstoegang aangekondigd op zijn app en website. Het bedrijf vatte de lockdown op als een poging om gebruikersinformatie te beschermen. als reactie op de publieke verontwaardiging na het Cambridge Analytica-schandaal.

Maar de beslissing is in overeenstemming met de toenemende beperkingen die worden opgelegd aan onderzoekers die Facebook en zijn app voor het delen van foto's Instagram bestuderen. die op 4 april ook onmiddellijk de toegang tot zijn gegevens begon te beperken.

In feite, in februari van dit jaar zijn verschillende beperkingen ingevoerd, voordat het Cambridge Analytica-fiasco – waarbij gegevens zouden zijn verzameld van 50 miljoen Facebook-profielen – publiekelijk uitbrak. API van Facebook, versie 2.5, deze maand met pensioen zou gaan, onder meer door de toegang tot de ID van gebruikers die deelnemen aan openbare fora te voorkomen.

Sociale netwerken bieden twee belangrijke toegangspunten voor het verzamelen van gegevens:ze werken als interfaces voor gebruikers en software-interfaces die zijn ontworpen voor gebruik door computerprogramma's, bekend als Application Programming Interfaces (API's).

Hoewel API's bedoeld zijn voor programmeurs die apps bouwen die bijdragen aan het groeiende ecosysteem van diensten die worden aangeboden door sociale netwerken, onderzoekers hebben deze interfaces ook gebruikt om sociaal gedrag online te bestuderen.

Gezien de gigantische omvang van het gebruikersbestand van Facebook (2,13 miljard bij de laatste telling), externe controle van de inhoud op het sociale netwerk is uiterst belangrijk. In recente jaren, echter, onderzoekers hebben een zware strijd geleverd met het bedrijf om toegang tot gegevens te bieden. Door zijn laatste besluit is het nu vrijwel onmogelijk geworden om grootschalig onderzoek te doen op Facebook.

De veranderingen maken ter ziele gegane software en bibliotheken gewijd aan academisch onderzoek op Facebook, inclusief netvizz, KnooppuntXL, SocialMediaLab, fb_scrape_public en Rfacebook, die allemaal vertrouwden op de API's van Facebook om gegevens te verzamelen.

Systematisch onderzoek naar Facebook-inhoud is nu onhoudbaar, het veranderen van wat al een zorgwekkend ondoorzichtige was, sociale netwerk opgesloten in een zwarte doos die aantoonbaar nog minder verantwoordelijk is voor wetgevers en het publiek - die beiden profiteerden van academici die de ontwikkelingen op de site volgden.

Deen Freelon, de ontwikkelaar van fb_scrape_public die grote, openbaar beschikbare datasets op Facebook, ons via e-mail vertelde dat "de beslissing om de toegang tot de Pages API te beperken in de toekomst ernstig afbreuk zou kunnen doen aan op inhoud gebaseerd Facebook-onderzoek, afhankelijk van hoe bereid Facebook is om toegang goed te keuren. Als het de toegang voor de meeste onderzoeksdoeleinden niet goedkeurt, dat zou kunnen leiden tot prikkels voor onderzoekers om Facebook rechtstreeks te schrapen, die de servicevoorwaarden schendt." Het schrapen of oogsten van gegevens is een methode waarmee een computerprogramma informatie uit webpagina's haalt.

Bernhard Rieder, een universitair hoofddocent aan de Universiteit van Amsterdam die netvizz ontwikkelde - een tool die gegevens van Facebook haalt voor onderzoeksdoeleinden - gelooft dat de verhuizing een gevolg was van het niveau van vrije toegang dat tot 2015 aan iedereen werd gegeven en dat "er een reële mogelijkheid is dat deze diensten zullen in toenemende mate ondoorgrondelijk en onwaarneembaar zijn".

Tot drie jaar geleden, Facebook stond apps van derden toe om toegang te krijgen tot gegevens over de vrienden van app-gebruikers. Het was deze functie die werd gebruikt door Aleksandr Kogan, een onderzoeker aan de Universiteit van Cambridge.

Kogan – via zijn Global Science Research-startup, die los stond van zijn academische werk - naar verluidt profielinformatie verzameld van 270, 000 Facebook-gebruikers en tientallen miljoenen van hun vrienden gebruiken een persoonlijkheidstest-app genaamd "thisisyourdigitallife". Er wordt beweerd dat Cambridge Analytica die gegevens heeft gebruikt om politieke campagnes aan te pakken, waaronder de Amerikaanse presidentsverkiezingen van 2016.

Marc Smit, die het Microsoft-team leidde dat NodeXL heeft gemaakt, die sociale netwerkgegevens analyseert, vertelde ons dat er een mogelijkheid was om de sociale netwerken die mensen kiezen te heroverwegen in het licht van het dataschandaal.

Waarom API's belangrijk zijn

Met API's kunnen onderzoekers grootschalige gegevens ophalen en databases beheren die verband houden met betekenisvolle gebeurtenissen. Zonder hen, webinterfaces moeten worden geschraapt om toegang te krijgen tot de gegevens, wat arbeidsintensief is en de hoeveelheid informatie die kan worden verzameld en verwerkt drastisch beperkt.

Door onderzoekers buiten de API's te houden, worden ze beperkt tot mensintensieve middelen voor het verzamelen van gegevens die geen representatieve voorbeelden van gebeurtenissen in de echte wereld kunnen produceren, zoals sociale bewegingen, verkiezingen en desinformatiecampagnes.

Twitter beheert drie goed gedocumenteerde, openbare API's naast het premium- en enterprise-aanbod. De relatieve toegankelijkheid van Twitter leidt ertoe dat het enorm oververtegenwoordigd is in onderzoek op sociale media. Maar openbare en open API's vormen een uitzondering in het ecosysteem van sociale media. Facebook's openbare feed-API, bijvoorbeeld, is beperkt tot een beperkt aantal media-uitgevers.

Gegevensvergrendeling

De API-lockdown van Facebook zal de kloof vergroten tussen brancheonderzoekers die zijn ingehuurd door sociale netwerken en onderzoekers die buiten bedrijven werken. Het is een kloof die wordt gekenmerkt als de kloof tussen "big data-rijke onderzoekers", die toegang hebben tot bedrijfseigen gegevens en mogelijk alleen werken in het belang van het bedrijf waaraan ze zijn gelieerd, en de "big data poor" of het brede universum van academische onderzoekers.

De beslissing van Facebook breidt deze pool van "big data poor" drastisch uit. Het beperkt onderzoek tot projecten die door het netwerk worden gesponsord en brengt mogelijk onderzoek in gevaar dat kritiek heeft op Facebook.

Kort na het besluit om API-toegang drastisch te beperken, Facebook vowed to help researchers gain access to social media data of public interest, starting with elections. The announcement was met with a mix of celebration and subdued support from researchers.

Luca Rossi, who is associate professor at the IT University of Copenhagen, cautioned that the "data sharing model proposed by Facebook is deeply problematic and it will probably reinforce existing differences in terms of data access". The restriction is likely to continue the trend of researchers doing research they are able to as opposed to research they deem important.




The impact on data science education is also considerable. If researchers are unable to access data from social networks, they will be unable to train students in data science, sociale wetenschappen, computer sciences and digital humanities on methods of data collection and analysis that are rigorous, critical and ethical.

Facebook's decision to render the API useless for meaningful research is a regrettable departure for collaboration between the social network giant and academics and it's already having an impact.

The Events API, which researchers relied on to retrieve information about public events such as demonstrations, no longer permits access to users or posts on the event wall.

Facebook's Groups API and Pages API were the endpoints researchers queried to study public discussions on Facebook, but the recent policy shift seals off those online conversations by restricting access to posts, comments or members participating in a public page or group.

The changes made to Instagram's API are even more radical, with Facebook deciding to deprecate the API – a technical term for killing data access altogether.

Nasty side effect

Facebook's decision to restrict researchers is ironic because academics have long discussed the problems that led to the Cambridge Analytica scandal. Rieder wrote about the risks of Facebook API's wide open data door back in 2013.

He cautioned against how much data a third-party app could get from Facebook. Facebook, echter, ignored those concerns until 2015, when management and policies regulating the sharing of Facebook data took a sharp turn and became increasingly more restrictive for researchers.

Vanaf dat moment, Facebook has become increasingly more cautious about external scrutiny. In the wake of the Cambridge Analytica scandal, Facebook CEO Mark Zuckerberg told Wired that the feedback it received was that "having the data locked down is more important to people than having different kinds of experiences".

The public uproar clearly underscores how users' data was poorly handled, but a lockdown is hardly the solution to a problem rooted in the weaponisation of social networks, where people use Facebook, Twitter and so on to spread disinformation.

The Cambridge Analytica scandal has created a worrying side effect:restricting access to data is likely to facilitate further weaponisation, by turning Facebook into a de facto black box that is largely unaccountable to external oversight.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.