Wetenschap
Tegoed:Unsplash/CC0 Publiek domein
Een nieuwe discussiepaper gepubliceerd in Beleidswetenschappen door twee Leidse onderzoekers claimt dat overheden met één hand te maken hebben als het gaat om data over kwetsbare groepen. De kern van dit artikel is het idee dat, hoewel de hoeveelheid gegevens de afgelopen jaren is toegenomen, de kwaliteit van de gegevens in combinatie met mogelijke bekende of onbekende gegevenslacunes beperkt het vermogen van de overheid om inclusief beleid te creëren. Simpel gezegd, het hebben van veel data betekent niet per se dat de data representatief en betrouwbaar zijn of dat overheden er gebruik van kunnen maken.
De primaire datakloof beschrijft een scenario waarin overheden zich bewust zijn van het feit dat er gegevens ontbreken, maar er zijn beperkte mogelijkheden om deze leemte op te vullen vanwege het gebrek aan geschikte gegevens. De paper geeft hiervoor voorbeelden door aan te tonen dat de output van machine learning en andere analyses van kunstmatige intelligentie beperkt zijn tot de nauwkeurigheid van de beschikbare gegevens, die levensechte effecten kunnen hebben bij de besluitvorming en de openbare dienstverlening.
De secundaire gegevenskloof markeert een kloof waar gegevens in verschillende formaten beschikbaar zijn, zoals social media data. Giest en Samuels wijzen op problemen met datakwaliteit en representativiteit van de bevolking met behulp van deze datasets, potentiële vooroordelen verergeren.
Eindelijk, verborgen lacunes in de gegevens treden op wanneer datasets die worden gebruikt voor beleidsvorming een verkeerde voorstelling van zaken bevatten, vooringenomenheid of ontbrekende gegevens zonder dat de overheid hiervan op de hoogte is. Dit is vooral relevant in de context van machine learning-outputs en kunstmatige intelligentieanalyses. Aangezien kwetsbare groepen, zoals etnische minderheden en ouderen, hebben de neiging minder gegevens te produceren en blijken moeilijker toegankelijk te zijn, ze worden vooral getroffen door onwetendheid over lacunes in de gegevens in de beleidsvorming.
Op basis hiervan, de paper benadrukt het feit dat het gevaar bestaat dat big data-architecturen bestaande vooroordelen kunnen reproduceren, gezien de aard van de hiaten en het bewustzijnsniveau van de overheid jegens hen. Dit houdt in dat om inclusieve beleidsvorming te bevorderen, overheden moeten bestaande lacunes in de gegevens begrijpen, evenals wat ze verdoezelen en waarom, om oplossingen te vinden voor het toevoegen van aanvullende kennis via innovatieve en traditionele manieren van gegevensverzameling.
Wetenschap © https://nl.scienceaq.com