Wetenschap
Krediet:Shutterstock
De term 'big data' kan doen denken aan delen van privé-informatie die in het bezit is van technologiebedrijven. Maar veel big data is, in feite, zichtbaar voor iedereen - we beschouwen het misschien niet als 'gegevens'.
Als je onlangs naar de bioscoop bent geweest, je hebt een dataset met credits gezien - met een lijst van de cast en crewleden naast hun rollen. Hoewel de aftiteling van een bepaalde film misschien niet zo nuttig is, de aftiteling van elke film kan een grote dataset vormen. Bij Nesta en het PEC (een nieuw beleids- en bewijscentrum voor de creatieve industrie) we hebben onderzocht hoe dit soort niet-vertrouwelijke big datasets nieuw licht kunnen werpen op genderrepresentatie in de creatieve industrie.
Gendervertegenwoordiging wordt traditioneel gemeten aan de hand van enquêtes onder werknemers. Maar de meeste enquêtes lopen nog niet zo lang en het kan enkele jaren duren (na het lanceren van een nieuwe enquête) voordat we kunnen zien hoe de gendermix verandert. Ook, enquêtes gaan vaak niet verder dan het tellen van het aantal vrouwen en mannen - en kunnen dus geen licht werpen op hoe prominent elke groep was in het creatieve proces, of hoe ze werden afgebeeld in een bepaalde kunstvorm.
Diep graven
We hebben onlangs gekeken naar de berichtgeving in de media over vrouwen in de creatieve industrie met behulp van meer dan een half miljoen artikelen uit de krant The Guardian, gepubliceerd tussen 2000 en 2018, uit delen van de krant die betrekking hebben op de creatieve industrie (zoals boeken, Film, Mode en Spelen).
In de afgelopen vijf jaar, er is een grote toename van verwijzingen naar vrouwen. Van 2000 tot 2013 minder dan een derde van de geslachtsgebonden voornaamwoorden in lidwoorden (bijvoorbeeld "hij" en "zij") verwezen naar vrouwen. Maar dit begon te veranderen in 2014 - en in 2018 had het percentage vrouwelijke geslachtsvoornaamwoorden 40% bereikt. Daarentegen, de gendermix onder werknemers in de creatieve industrie in het VK is de afgelopen jaren stabiel gebleven, en zit rond de 37%.
We bestudeerden ook de woorden die volgden op de voornaamwoorden "hij" en "zij", inzicht krijgen in het beeld dat de media van creatieve werkers geven. Dit bracht ons ertoe te ontdekken dat, vergeleken met mannen, er was meer aandacht voor bepaalde geluiden gemaakt door vrouwen, zoals "lacht", "huilt", "giechelt", en "koes", en non-verbale reacties, zoals "glimlachen", "grijnst" en "knikt". Deze woorden werden nooit vaak gebruikt, maar toen ze gebruikt werden, ze hadden meer kans om naar vrouwen te verwijzen dan naar mannen (vergeleken met andere woorden).
In tegenstelling tot, woorden met betrekking tot vroegere creatieve prestaties en leiderschapsactiviteiten verwezen vaker naar mannen. Bijvoorbeeld, je hebt veel meer kans om "hij regisseerde" te zien dan "zij regisseerde", en op dezelfde manier "hij presteerde", "hij ontwierp", "hij beheerde" en "hij stichtte". Deze bevinding komt overeen met de al lang bestaande genderongelijkheid in de creatieve industrie.
Big data van The Guardian biedt een waardevol inzicht in gendergelijkheid in de media. Krediet:Shutterstock
In een andere studie, we gebruikten een dataset van het British Film Institute (BFI) die de credits bevatte van elke Britse speelfilm die in de bioscoop werd uitgebracht.
Nadat de BFI het geslacht van mensen had afgeleid uit hun voornamen, we ontdekten dat de gendermix op het scherm sinds het einde van de Tweede Wereldoorlog niet wezenlijk is veranderd - en in 2017 vormden vrouwen nog steeds slechts ongeveer 30% van de castleden en 34% van de bemanningsleden.
Deze dataset toonde ook op geslacht gebaseerde verschillen in de banen van personages op het scherm. Sinds 2005, bijvoorbeeld, slechts 16% van de "dokters" op het scherm (in niet nader genoemde rollen) is gespeeld door vrouwen, wat strookt met het feit dat vrouwen 46% uitmaken van de artsen in het VK.
Creatieve eerlijkheid
We zijn zeker niet de enige onderzoekers die het potentieel van niet-vertrouwelijke bronnen van big data laten zien om genderstatistieken in de creatieve industrie te informeren. Onderzoekers bij Google, in samenwerking met het Geena Davis Instituut, gebruikte gezichts- en spraakherkenningstechnologie om aan te tonen dat in de 100 meest winstgevende live-actionfilms in de VS, in elk jaar van 2014 tot 2016, vrouwen namen slechts 36% van de schermtijd in beslag en 35% van de spreektijd.
Hoewel big data-onderzoeken diversiteitsmaatregelen kunnen verrijken, er zijn twee belangrijke bronnen van mogelijke vertekening. Eerst, we leiden bijna altijd het geslacht af - uit een gezicht, een voornaam of een enkel voornaamwoord - en dus kunnen we het geslacht van een persoon verkeerd zien. Tweede, deze inferentiemethoden detecteren meestal alleen "mannelijk" en "vrouwelijk", het uitsluiten of verkeerd classificeren van iedereen die zich identificeert met een niet-binair geslacht. Om deze redenen, big data-methoden zijn geen vervanging voor enquêtes, omdat enquêtes mensen in staat stellen zichzelf te identificeren en zich volledig af te melden.
Zelfs rekening houdend met deze mogelijke vooroordelen, er zijn nog steeds veel big data-bronnen die een nieuw licht kunnen werpen op genderongelijkheid, als ze maar ter beschikking zouden worden gesteld aan onderzoekers. Bijvoorbeeld, toegang tot foto's en ondertitels van films en televisieprogramma's zou kunnen worden gebruikt om diversiteitsregelingen te evalueren, terwijl toegang tot de inhoud van meer kranten een bredere studie mogelijk zou maken naar de berichtgeving in de media over creatieve werkers.
Om het potentieel van deze nieuwe methoden te benutten, we moeten creatieve organisaties aanmoedigen en ondersteunen om hun niet-vertrouwelijke gegevens veilig te delen. Dat zal onderzoekers hopelijk in staat stellen wat creatiever te worden in het meten van gendergelijkheid in de creatieve industrieën van het VK.
Dit artikel is opnieuw gepubliceerd vanuit The Conversation onder een Creative Commons-licentie. Lees het originele artikel.
Wetenschap © https://nl.scienceaq.com