science >> Wetenschap >  >> anders

Er zit goud in big data, maar er zijn niet genoeg goudzoekers

De belofte van big data gloort al jaren aan de horizon van de sociale wetenschappen, maar tot nu toe heeft niemand deze belofte kunnen waarmaken. In zijn oratie op 22 maart Hoogleraar en onderzoeksmethodoloog Bernard Veldkamp legt uit waarom en biedt oplossingen. Zijn belangrijkste punt:we moeten verschillende manieren vinden om met dit soort data om te gaan. "De waarom-vraag moet worden vervangen door patrooninterpretatie."

Er is momenteel een revolutie gaande op het gebied van de hoeveelheid data. Door de opkomst van internet, sociale media, mobiele telefoons en allerlei sensoren, de hoeveelheid data stijgt jaarlijks met maar liefst veertig procent. Voor sociale wetenschappers, die zich bezighouden met het gedrag van individuen en groepen, deze enorme hoeveelheden data kunnen een goudmijn zijn. Echter, hoewel de belofte van big data al vele jaren in het verschiet ligt voor de sociale wetenschappen, de analyse heeft niet de resultaten opgeleverd die iedereen had verwacht. Bijgevolg, enthousiasme slaat langzaam om in scepsis. Ondertussen, computerwetenschappers die methoden ontwikkelen om de gegevens te analyseren, gaan er met de goederen vandoor. Een belangrijk nadeel, echter, is dat computerwetenschappers, gezien hun achtergrond, kunnen onvoldoende rekening houden met de context en de informatie die ze bestuderen. Als resultaat, het nut van hun bevindingen is beperkt.

De kloof dichten

Volgens prof. Veldkamp het is tijd voor een paradigmaverschuiving. Als een van de belangrijkste redenen waarom sociale wetenschappers de eerste slag verloren, hij vermeldt dat ze veel te lang hebben geprobeerd de gegevens met traditionele methoden te verwerken en te analyseren. Voor traditionele methoden, de hoeveelheid data is simpelweg te groot. Bovendien, en misschien nog wel belangrijker, is het type data dat erbij betrokken is totaal anders dan de data die voorheen beschikbaar waren. Omdat de gegevens, in tegenstelling tot gegevens uit traditionele steekproeven, observaties of vragenlijsten—is niet specifiek verzameld voor wetenschappelijke analyse, de herkomst en kwaliteit zijn niet altijd duidelijk. Of, zoals Veldkamp het eenvoudig stelt:"Er zit veel witte ruis in." Daarom vindt hij het heel belangrijk om voor een andere aanpak te kiezen. Het gebied van onderzoeksmethodologie, Veldkamps veld, is bij uitstek geschikt om de kloof tussen big data en de sociale wetenschappen te dichten. "De gegevens zijn hun spreekwoordelijke gewicht in goud waard, maar er zijn momenteel niet genoeg gekwalificeerde goudzoekers voor de baan."

Patronen

Professor Veldkamp is van mening dat het feit dat de herkomst van de data soms onbekend is en dat er veel witte ruis kan zijn niet per se een probleem hoeft te zijn, maar het is iets dat u in uw analyse moet meenemen. Grote gegevens, juist door de grote hoeveelheid, biedt de mogelijkheid om onzekerheden statistisch te corrigeren. In aanvulling, Professor Veldkamp vindt het essentieel om te "modelleren in de witte ruis". Dit betekent dat je voorzichtiger moet zijn met aannames en dat eventuele conclusies die je trekt minder hard moeten zijn. Professor Veldkamp:"Om deze reden het wordt belangrijker verbanden te interpreteren dan naar causaliteit te kijken. Of, om het simpeler te zeggen, patrooninterpretatie zou de waarom-vraag moeten vervangen."