science >> Wetenschap >  >> Elektronica

Cambridge Analytica – de data-analyse-industrie is al in volle gang

Krediet:Shutterstock

Onthullingen over Cambridge Analytica hebben het schijnbare gebrek aan controle over onze eigen gegevens blootgelegd. Plotseling, met al het gepraat over "psychografische gegevens" en manipulatie van kiezers, de kracht van data-analyse is de bron van enige zorg geworden.

Maar het risico is dat als we het geval van Cambridge Analytica afzonderlijk bekijken, we kunnen een veel breder debat over het gebruik en de controle van onze gegevens voorkomen. Door te focussen op de meldingen van extreme praktijken, we missen misschien de vele alledaagse manieren waarop data-analyse ons leven nu vormgeeft.

De data-analyse-industrie is veel diverser en verstrekkender dan de huidige berichtgeving ons doet vermoeden. Tijdens een recent project, Ik vond iets heel anders dan de rapporten die we nu over Cambridge Analytica zien.

Ondanks zijn oorsprong in de jaren 70, toen computerwetenschappers en verwerkingsexperts zich begonnen voor te stellen hoe een data-geïnformeerde organisatie eruit zou kunnen zien, pas in de jaren negentig begon de data-analyse-industrie zich echt te ontwikkelen. Enkele van de bekendste vroege voorbeelden van de organisatorische en individuele toepassing van data-analyse waren in de sport, en vooral in het voetbal, waar gegevens werden verzameld om de prestatieniveaus te verbeteren, om verborgen patronen in games te vinden of om potentieel talent te spotten.

Achter dit, het gebruik van data in verschillende sectoren is de afgelopen 20 jaar drastisch toegenomen, vooral op het gebied van prestatiebeheer, adverteren en marketing, evenals enkele opmerkelijke ontwikkelingen op het gebied van veiligheid en risico. Dit omvatte zaken als talentstatistieken op de werkplek en classificaties op postcodeniveau, tot het gebruik van gegevens over levensstijlen om verzekeringspremies vast te stellen of bij kredietscores. Het toenemende verzamelen van gegevens – mogelijk gemaakt door de nieuwe infrastructuren van GPS, RFID-sensoren, internet winkelen, smartphones en sociale media – heeft een reeks nieuwe mogelijkheden gecreëerd voor het verzamelen van gegevens. Toen de gegevens zich begonnen op te stapelen, er ontstond een bloeiende industrie.

Jij als data analist

Zoals verwacht kan worden, sommige van deze aanbieders van gegevensanalyse bieden advies- en analysediensten, helpen bij het volgen van klanten, merken, publieke opinie en dergelijke. Wat mij veel belangrijker leek, Hoewel, was dat een groot deel van deze industrie in plaats daarvan gericht was op het leveren van software en tools om, zoals ze het zeggen, maken van ons onze eigen data-analisten.

Veel van deze tools maken gebruik van en passen het open-source Hadoop-project van The Apache Software Foundation aan, waardoor grote clusters van computers kunnen worden gebruikt om gegevens te verwerken. Deze tools worden meestal gepresenteerd als toegankelijke technologieën in dashboardstijl die weinig technische vaardigheden of knowhow van de gebruiker vereisen. Het resultaat is dat gegevens in veel verschillende contexten en door een veel groter aantal mensen kunnen worden verzameld en gebruikt dan we ons misschien kunnen voorstellen.

Een breed scala aan dingen meten, van gevoel, ophef, versterking en invloed op sociale media, profilering proeven, sociale netwerkformaties enzovoort, deze tools worden geleverd met enkele glanzende beloften. Het punt hier is dat de praktijk van data-analyse niet beperkt is tot gekwalificeerde technische experts. De data-analyse-industrie is er eigenlijk op gericht om van iedereen een data-analist te maken en alle organisaties data-savvy te maken.

Natuurlijk, data-analyse komt met een aantal krachtige beloften die zijn ontworpen om ons steeds meer data-gericht te maken. Deze industrie zegt ons herhaaldelijk dat data ons kan versnellen, maak ons ​​slimmer, ons in staat stellen om in de verborgen diepten van organisaties te kijken, ons in staat stellen om in realtime te handelen of ons in staat stellen de toekomst te voorspellen. Dit betekent dat we ook voorzichtig moeten zijn met het accepteren van claims die worden gemaakt over de mogelijkheden van data-analyse, en die zijn belegd met een agenda gericht op uitbreiding van het datagebruik.

Als we een volledig en alomvattend debat willen over de rol van data in ons leven, we moeten eerst beseffen dat de analyse en het gebruik van onze gegevens niet beperkt is tot het soort cijfers waarover we in deze recente verhalen hebben gelezen - het is diep verankerd in de structuren waarin we leven.

Dit vraagt ​​van ons om na te denken over hoe onze gegevens worden gebruikt en hoe gegevensanalyse, geboden door deze nieuwe instrumenten, gaat ons leven op veel manieren vormgeven. Data-analyse is nu een ingebedde aanwezigheid die vertakt naar alles van lokale overheden, grote bedrijven en het MKB, aan politieke partijen, schoolbestuur, PR- en managementadvies.

De Cambridge Analytica-zaak is cruciaal om te begrijpen hoe onze gegevens worden gebruikt, maar de mogelijkheid die deze onthullingen bieden voor reflectie mag niet beperkt blijven tot dit soort gemeld misbruik. We moeten verder kijken om te proberen te begrijpen hoe datagestuurde benaderingen ons leven op veel verschillende fronten beïnvloeden, vooral omdat de instrumenten voor gegevensanalyse in tal van verschillende sectoren worden gebruikt. Alleen omdat de rest van de industrie misschien niet zo extreem is als Cambridge Analytica, het betekent niet dat we moeten nalaten vragen te stellen over de vele manieren waarop onze gegevens worden gebruikt om te oordelen, rangschikken en ordenen van ons leven.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.