Wetenschap
Je zou inmiddels denken dat we ondubbelzinnig kunnen zeggen wat de oorzaak is van wat. Maar de kwestie van causaliteit versus correlatie , dat de wetenschap en de filosofie vanaf het allereerste begin heeft achtervolgd, zit ons om tal van redenen nog steeds op de hielen.
Mensen zijn evolutionair voorbestemd om patronen te zien, en psychologisch geneigd om informatie te verzamelen die reeds bestaande opvattingen ondersteunt, een eigenschap die bekend staat als de voorkeur voor bevestiging. We verwarren toeval met correlatie, en correlatie met causaliteit.
Het verschil tussen causaliteit en correlatie is dat in een causaal verband de ene gebeurtenis direct verantwoordelijk is voor de andere, terwijl bij een correlatie twee gebeurtenissen tegelijkertijd voorkomen, maar dat hun relatie te wijten kan zijn aan een derde variabele.
Het is onjuist om te zeggen dat correlatie causaliteit impliceert. Als A de oorzaak is van B, hebben we de neiging om op zijn minst het volgende te zeggen:
Op zichzelf genomen kunnen deze drie vereisten echter geen oorzaak bewijzen; ze zijn, zoals filosofen zeggen, noodzakelijk maar niet voldoende. In ieder geval is niet iedereen het met hen eens.
Over filosofen gesproken, David Hume betoogde dat causaliteit in geen enkele aantoonbare zin bestaat [bron:Cook]. Karl Popper en de falsificationisten beweerden dat we een verband niet kunnen bewijzen, maar alleen kunnen weerleggen, wat verklaart waarom statistische analyses niet proberen een verband te bewijzen; in plaats daarvan trekken ze een dubbele ontkenning en weerleggen ze dat de gegevens niet gecorreleerd zijn, een proces dat bekend staat als het verwerpen van de nulhypothese [bron:McLeod].
Met dergelijke overwegingen in het achterhoofd moeten wetenschappers hun experimenten zorgvuldig ontwerpen en controleren om vooringenomenheid, cirkelredeneringen, zichzelf vervullende profetieën en verwarrende variabelen uit te bannen. Ze moeten de vereisten en beperkingen van de gebruikte methoden respecteren, waar mogelijk gebruik maken van representatieve monsters en hun resultaten niet overdrijven.
In plaats van de moeilijke (en misschien onmogelijke) taak op zich te nemen om causaliteit vast te stellen, richt het meeste wetenschappelijke onderzoek zich op de kracht van correlaties. Correlaties kunnen positief of negatief, zwak of sterk zijn. De statistische correlatiecoëfficiënt, die varieert van -1 tot 1, geeft de sterkte en richting van de correlatie weer.
Als u gegevenspunten in een grafiek plot waarbij de ene variabele de X-as beslaat en de andere de Y-as, correleren de variabelen als ze een lineair verband hebben.
Omdat het menselijk brein de neiging heeft om causale verbanden op te sporen, zijn wetenschappers extra voorzichtig met het opzetten van zeer gecontroleerde experimenten – maar ze maken nog steeds fouten. Hier zijn tien voorbeelden die illustreren hoe moeilijk het is om een oorzakelijk verband te identificeren.
Mensen zijn lastig om te onderzoeken. Ze reageren niet alleen op de stimulus die wordt bestudeerd, maar ook op het experiment zelf. Onderzoekers proberen tegenwoordig experimenten te ontwerpen om dergelijke factoren te controleren, maar dat was niet altijd het geval.
Neem de Hawthorne Works in Cicero, Illinois. In een reeks experimenten van 1924 tot 1932 bestudeerden onderzoekers de productiviteitseffecten van werknemers die verband hielden met het veranderen van de omgeving van de fabriek in Illinois, waaronder veranderende lichtniveaus, het opruimen van de werkplek en het verplaatsen van werkstations.
Net toen ze dachten dat ze iets op het spoor waren, merkten ze een probleem op:de waargenomen productiviteitsstijgingen daalden vrijwel zodra de onderzoekers de fabriek verlieten, wat erop wijst dat de kennis van de arbeiders over het experiment – en niet de veranderingen van de onderzoekers – de drijvende kracht was geweest achter de ontwikkeling van het experiment. boost. Onderzoekers noemen dit fenomeen nog steeds het Hawthorne-effect [bron:Obrenović].
Een verwant concept, het John Henry-effect, doet zich voor wanneer leden van een controlegroep de experimentele groep proberen te verslaan door hun inspanningen in overdrive te brengen. Ze hoeven niets van het experiment af te weten; ze hoeven slechts één groep nieuwe hulpmiddelen of aanvullende instructies te zien krijgen. Net als de legendarische staalrijder willen ze hun capaciteiten bewijzen en respect verdienen [bronnen:Saretsky; Vogt].
De titulaire karakters van Tom Stoppards film "Rosencrantz and Guildenstern Are Dead" beginnen de film verbijsterd en uiteindelijk bang als elk van de 157 opeenvolgende opgooien van een munt de kop opsteekt. Guildensterns verklaringen voor dit fenomeen variëren van tijdlussen tot "een spectaculaire rechtvaardiging van het principe dat elke individuele munt, individueel gesponnen, evenveel kans heeft om met kop als munt naar beneden te komen..."
De evolutie heeft mensen ertoe aangezet om patronen te zien, en ons vermogen om die drang op de juiste manier te verwerken lijkt te kort te sluiten naarmate we langer gokken. We kunnen rationeel accepteren dat onafhankelijke gebeurtenissen zoals het opgooien van munten dezelfde kansen behouden, ongeacht hoe vaak je ze uitvoert.
Maar we beschouwen deze gebeurtenissen ook, minder rationeel, als strepen, waardoor er valse mentale correlaties ontstaan tussen willekeurige gebeurtenissen. Als we het verleden als een opmaat beschouwen, blijven we denken dat de volgende salto een staart zou moeten zijn.
Statistici noemen dit de denkfout van de gokker, ook wel de denkfout van Monte Carlo genoemd, naar een bijzonder illustratief voorbeeld dat zich voordeed in de beroemde badplaats Monaco.
Tijdens de zomer van 1913 keken gokkers met toenemende verbazing toe hoe het roulettewiel van een casino 26 keer achter elkaar op zwart belandde. Ontstoken door de zekerheid dat rood 'op tijd was', bleven de gokkers hun fiches neerleggen. Het casino maakte een munt [bronnen:Lehrer; Oppenheimer en Monin; Vogt].
Geen enkele discussie over streaks, magisch denken of valse oorzakelijk verbanden zou compleet zijn zonder de sportpagina's door te bladeren. Geweldige sportseizoenen komen voort uit zo’n mysterieus samenspel van factoren – natuurlijk vermogen, training, zelfvertrouwen, zo nu en dan een X-factor – dat we ons patronen in de prestaties voorstellen, ook al wijzen onderzoeken herhaaldelijk streak shooting en ‘succesvol’ bijgeloof af als meer dan denkbeeldig. /P>
Het geloof in mislukkingen of inzinkingen houdt in dat succes succes ‘veroorzaakt’ en mislukking ‘veroorzaakt’ mislukking, of, misschien redelijker, dat variatie in een gemeenschappelijke factor, zoals vertrouwen, beide veroorzaakt. Maar studie na studie bevestigt dit niet [bron:Gilovich, et al].
Hetzelfde geldt voor bijgeloof, hoewel dat de gepensioneerde NBA-speler en Dallas Mavericks er nooit van heeft weerhouden om Jason Terry te beschermen tegen het slapen in de wedstrijdshorts van de tegenstanders voor elke wedstrijd, of het NHL-centrum en de gepensioneerde Ottawa Senators-speler Bruce Gardiner ervan zijn hockeystick in de wedstrijd te dompelen. toilet om de occasionele inzinking te doorbreken [bron:Exact Sports].
Ook de inzinking in het tweede jaar komt doorgaans voort uit een te goed eerste jaar. Prestatieschommelingen hebben de neiging om op de lange termijn gelijk te worden, een fenomeen dat statistici regressie naar het gemiddelde noemen [bron:Barnett, et al.]. In de sport wordt deze uitmiddeling geholpen door de tegenstand, die zich aanpast om de succesvolle vaardigheden van de nieuwe speler tegen te gaan.
Gerandomiseerde gecontroleerde onderzoeken zijn de gouden standaard in de statistiek, maar soms (bijvoorbeeld in de epidemiologie) dwingen ethische en praktische overwegingen onderzoekers om beschikbare gevallen te analyseren.
Helaas riskeren dergelijke observationele onderzoeken bias, verborgen variabelen en, het ergste van alles, studiegroepen die de populatie mogelijk niet accuraat weerspiegelen. Het bestuderen van een representatieve steekproef is van cruciaal belang; het stelt onderzoekers in staat resultaten toe te passen op mensen buiten het onderzoek, zoals wij allemaal.
Een voorbeeld:hormoonsubstitutietherapie (HRT) voor vrouwen. Naast het behandelen van symptomen die verband houden met de menopauze, werd het ooit geprezen vanwege het potentieel verminderen van het risico op coronaire hartziekten (CHZ), dankzij een veelbesproken observationeel onderzoek uit 1991 [bron:Stampfer en Colditz].
Maar latere gerandomiseerde gecontroleerde onderzoeken, waaronder het grootschalige Women's Health Initiative, onthulden een negatieve relatie, of een statistisch onbeduidende relatie, tussen HST en CHD [bron:Lawlor, et al.].
Waarom het verschil? Om te beginnen komen vrouwen die HST gebruiken vaak uit hogere sociaal-economische lagen en krijgen ze een betere kwaliteit van voeding en lichaamsbeweging – een verborgen verklarende relatie waarvoor het observationele onderzoek niet volledig rekening heeft gehouden [bron:Lawlor, et al].
In 1978 maakte sportverslaggever en columnist Leonard Koppett de spot met de verwarring over causaliteit en correlatie door op wrange wijze te suggereren dat de uitkomsten van de Super Bowl de aandelenmarkt zouden kunnen voorspellen. Het werkte averechts:niet alleen geloofden mensen hem, maar het werkte ook – met een angstaanjagende frequentie.
Het voorstel, nu algemeen bekend als de Super Bowl Indicator, luidde als volgt:als een van de zestien oorspronkelijke National Football League-teams – die bestonden vóór de fusie van de NFL in 1966 met de American Football League – de Super Bowl zou winnen, zou de aandelenmarkt gedurende de rest van het jaar stijgen. Als een voormalig AFL-team zou winnen, zou het ten onder gaan [bron:Bonsal].
Van 1967 tot 1978 ging Koppetts systeem 12 voor 12; tot en met 1997 had het een succespercentage van 95 procent. Het struikelde tijdens het dotcom-tijdperk (1998-2001) en vooral in 2008, toen de Grote Recessie toesloeg, ondanks een overwinning van de New York Giants (NFC). Toch had de indicator vanaf 2022 een succespercentage van 73 procent [bron:Chen].
Sommigen hebben betoogd dat het patroon bestaat, gedreven door geloof; het werkt, zeggen ze, omdat investeerders geloven dat het werkt, of omdat ze geloven dat andere investeerders het geloven.
Dit idee, hoewel slim op een regressieve manier, verklaart nauwelijks de twaalf jaar van succesvolle correlaties die dateren van vóór Koppetts artikel. Anderen beweren dat een relevanter patroon ligt in de grootschalige opwaartse trend van de aandelenmarkt, behoudens enkele grote en kleine schommelingen op de korte termijn [bron:Johnson].
Big data – het proces van het zoeken naar patronen in datasets die zo groot zijn dat ze weerstand bieden aan traditionele analysemethoden – zorgt voor veel buzz in de bestuurskamer [bron:Arthur]. Maar is groter altijd beter?
Het is een regel die de meeste onderzoekers in hun eerste statistiekles is ingeprent:als je een zee aan gegevens tegenkomt, weersta dan de drang om op visexpeditie te gaan. Gegeven voldoende gegevens, geduld en methodologische speelruimte zijn correlaties bijna onvermijdelijk, ook al zijn ze onethisch en grotendeels nutteloos.
De loutere correlatie tussen twee variabelen impliceert immers geen oorzakelijk verband; in veel gevallen wijst het ook niet op een grote relatie.
Om te beginnen kunnen onderzoekers niet zomaar statistische metingen van correlatie gebruiken; elk ervan bevat bepaalde aannames en beperkingen die vissersexpedities maar al te vaak negeren, om maar te zwijgen van de verborgen variabelen, bemonsteringsproblemen en interpretatiefouten die een slecht ontworpen onderzoek kunnen verpesten.
Maar big data worden steeds vaker gebruikt en geprezen vanwege hun onschatbare bijdrage aan gebieden als het creëren van op maat gemaakte leerprogramma’s; draagbare apparaten die realtime feed leveren aan uw elektronische medische dossiers; en muziekstreamingdiensten die u gerichte aanbevelingen geven [bron:IntelliPaat]. Verwacht alleen niet te veel van big data op het gebied van causaliteit.
Elke kwestie die met geld te maken heeft, zal ongetwijfeld grote verdeeldheid zaaien en sterk gepolitiseerd zijn, en verhogingen van de minimumlonen vormen daarop geen uitzondering. De argumenten zijn gevarieerd en complex, maar in wezen beweert één kant dat een hoger minimumloon bedrijven schaadt, waardoor de beschikbaarheid van banen afneemt, wat de armen schaadt.
De andere kant antwoordt dat er weinig bewijs is voor deze bewering, en dat de 76 miljoen Amerikanen die op of onder het minimumloon werken, wat volgens sommigen geen leefbaar loon is, zouden profiteren van een dergelijke verhoging. Ze beweren dat het federale minimumloon voor gedekte, niet-vrijgestelde werknemers ($7,25 per uur in september 2023) de koopkracht van de Amerikanen met meer dan 20 procent heeft verlaagd [bronnen:U.S. Department of Labor; Cooper, et al.
Zoals literair criticus George Shaw naar verluidt grapte:"Als alle economen achter elkaar zouden worden gelegd, zouden ze nooit tot een conclusie komen", en het debat over het minimumloon lijkt dat te bevestigen [bron:Quote Investigator]. Voor elke analist die zegt dat verhogingen van het minimumloon banen verdrijven, is er een ander die tegen een dergelijke correlatie pleit.
Uiteindelijk delen beide partijen een fundamenteel probleem:namelijk de overvloed aan anekdotisch bewijsmateriaal waar veel van hun pratende hoofden op vertrouwen voor steun. Tweedehandsverhalen en uitgekozen gegevens zorgen voor zwakke thee op elk feest, zelfs als ze in mooie staafdiagrammen worden gepresenteerd.
Tussen fitness-apps, medicijnen en operaties is gewichtsverlies in de Verenigde Staten een industrie van $ 78 miljard per jaar, waarbij miljoenen Amerikanen jaarlijks de lat voor gewichtsverlies opzij schuiven [bron:Research and Markets]. Het is niet verrassend dat onderzoeken naar gewichtsverlies – goed, slecht of lelijk – veel aandacht krijgen in de VS.
Neem het populaire idee dat ontbijten verslaat zwaarlijvigheid, een suikerklontje dat is afgeleid van twee hoofdonderzoeken:Eén, een gerandomiseerde gecontroleerde studie van de Vanderbilt University uit 1992, toonde aan dat het omkeren van normale ontbijtgewoonten, al dan niet eten, correleerde met gewichtsverlies; de andere, een observationeel onderzoek uit 2002 door de National Weight Control Registry, correleerde het ontbijten met succesvolle afslankers – wat niet hetzelfde is als het correleren met gewichtsverlies [bronnen:Brown, et al.; Schlundt, et al.; Wyatt, et al.].
Helaas slaagde de NWCR-studie er niet in om voor andere factoren te controleren – of zelfs maar enig causaal verband vast te stellen op basis van de correlatie ervan. Een persoon die wil afvallen kan bijvoorbeeld meer gaan sporten, ontbijten of hele varkenseiwitten eten, maar zonder een experimenteel ontwerp dat in staat is causale verbanden te leggen, komt dergelijk gedrag neer op niets meer dan vaak voorkomende kenmerken [bron :Brown, et al.
Een soortgelijk probleem plaagt de talrijke onderzoeken die familiediners koppelen aan een verminderd risico op drugsverslaving voor tieners. Hoewel ze aantrekkelijk zijn vanwege hun eenvoudige, aansprekende strategie, slagen deze onderzoeken er vaak niet in om te controleren op gerelateerde factoren, zoals sterke familiebanden of een diepe betrokkenheid van ouders bij het leven van een kind [bron:Miller, et al].
We horen vaak dat mannen, vooral jonge mannen, een grotere kans hebben om zelfmoord te plegen dan vrouwen. In werkelijkheid maken dergelijke uitspraken deel uit van empirische generalisatie – het doen van een brede uitspraak over een gemeenschappelijk patroon zonder te proberen het te verklaren – en maskeren ze verschillende bekende en potentiële verstorende factoren.
Neem bijvoorbeeld een Youth Risk Behaviors Survey uit 2021 waaruit bleek dat meisjes in de groepen 9 tot en met 12 bijna twee keer zo vaak zelfmoord probeerden te plegen als mannelijke studenten (13 procent versus 7 procent) [bron:American Foundation for Suicide Prevention].
Hoe kan er dan een hogere correlatie bestaan tussen het andere geslacht en zelfmoord? Het antwoord ligt in zelfmoordpogingen per methodologie:hoewel de meest gebruikelijke zelfmoordmethode voor beide geslachten in 2020 het gebruik van een vuurwapen was (57,9 procent voor mannen en 33,0 procent voor vrouwen), hadden vrouwen bijna evenveel kans om te sterven door vergiftiging of verstikking [bron:Nationaal Instituut voor Geestelijke Gezondheid].
Zelfs als we dergelijke verstorende factoren zouden kunnen wegnemen, zou het feit blijven bestaan dat mannelijkheid op zichzelf geen oorzaak is. Om de trend te verklaren moeten we in plaats daarvan factoren identificeren die mannen gemeen hebben, of op zijn minst suïcidale factoren.
Hetzelfde geldt voor de relatief hoge zelfmoordcijfers onder gescheiden mannen. Echtscheiding zorgt er niet voor dat mannen zelfmoord plegen; Het is eerder indicatief voor een onderliggend causaal verband met factoren als de inflexibiliteit van mannelijke rollen, hun sociale netwerken, het toenemende belang van kinderopvang en het verlangen van mannen naar controle in relaties [bron:Scourfield en Evans].
Geen enkele lijst met correlaties/oorzaken zou compleet zijn zonder de zorgen van ouders over de veiligheid van vaccinaties te bespreken. Voordat de COVID-19-pandemie in 2020 de wereld trof, was het belangrijkste probleem bij sommige ouders de angst dat de vaccinatie tegen mazelen, bof en rubella causaal verband hield met autismespectrumstoornissen. Dit idee werd gepopulariseerd door beroemdheden als Jenny McCarthy.
Ondanks dat de medische gemeenschap het artikel van Andrew Wakefield uit 1998 heeft ontkracht dat de onwaarheid inspireerde, en ondanks latere onderzoeken die geen causaal verband aantonen, blijven sommige ouders bang voor een verband met autisme of andere vaccingerelateerde gevaren [bronnen:Park; Sifferlin; Szabo].
Toen kwam COVID-19 en heeft tot nu toe miljoenen mensen over de hele wereld gedood. Wetenschappers haastten zich om een effectief vaccin te creëren en dat is gelukt; het eerste Amerikaanse COVID-19-vaccin was in december 2020 beschikbaar onder de toestemming voor noodgebruik van de FDA [bron:FDA]. Maar het raakte ook al snel verweven met de extreme polarisatie van de Amerikaanse politiek en desinformatie.
Veel ouders, vooral Republikeinen, vreesden dat de vaccins onveilig waren omdat ze zo snel werden ontwikkeld en omdat er mogelijk nog onbekende bijwerkingen op de lange termijn zouden kunnen optreden. Er waren ook onjuiste zorgen dat het vaccin de toekomstige vruchtbaarheid zou beïnvloeden. Deze zijn nu vals gebleken [bron:Kelen en Maragakis].
Vanaf januari 2022 had slechts 28 procent van de 5- tot 11-jarigen minstens één dosis van het vaccin gekregen, wat velen op medisch gebied teleurstelde [bronnen:Hamel, Kates]. Het aantal gevaccineerde kinderen groeit; in mei 2023 had 40 procent van de 5- tot 11-jarigen ten minste een dosis gekregen [bron:CDC].
Dit zijn geen onschuldige misverstanden. Ondanks dat het verband tussen autisme en vaccins voor kinderen wordt ontkracht, blijven veel ouders wantrouwig tegenover de vaccinaties. In 2019 waren er 1.282 gevallen van mazelen in 31 staten, het hoogste aantal in de VS sinds 1992. De meerderheid van deze gevallen behoorde tot de niet-gevaccineerde [bron:CDC].
Of die overeenkomst toevallig, correlatief of causaal is, is de moeite waard om te overwegen. En de gevolgen van de huidige aarzeling om te vaccineren tegen COVID-19 moeten nog blijken.
Hoe kleurveranderend ijs werkt
Waarom elektrocuteerde Thomas Edison een olifant?
Meer >
Wetenschap © https://nl.scienceaq.com