Wetenschap
Je zou nu denken dat we ondubbelzinnig kunnen zeggen wat de oorzaak is van wat. Maar de kwestie van de oorzaak, die wetenschap en filosofie vanaf hun vroegste dagen heeft achtervolgd, nog steeds achtervolgt onze hielen om tal van redenen. Mensen zijn evolutionair vatbaar voor het zien van patronen en psychologisch geneigd om informatie te verzamelen die reeds bestaande opvattingen ondersteunt, een eigenschap die bekend staat als voorkeur voor bevestiging . We verwarren toeval met correlatie en correlatie met causaliteit.
Voor A om B te veroorzaken, we zijn geneigd te zeggen dat ten minste, A moet voorafgaan aan B, de twee moeten covariëren (samen variëren), en geen concurrerende verklaring kan de covariantie van A en B beter verklaren. echter, deze drie vereisten kunnen geen oorzaak bewijzen; zij zijn, zoals filosofen zeggen, noodzakelijk maar niet voldoende. In elk geval, niet iedereen is het met hen eens.
Over filosofen gesproken, David Hume betoogde dat oorzakelijk verband in geen enkele aanwijsbare zin bestaat. Karl Popper en de falsificationisten beweerden dat we een relatie niet kunnen bewijzen, ontkracht het alleen, wat verklaart waarom statistische analyses geen correlatie proberen te bewijzen; in plaats daarvan, ze trekken een dubbele ontkenning en weerleggen dat de gegevens niet gecorreleerd zijn, een proces dat bekend staat als verwerpen van de nulhypothese .
Met dergelijke overwegingen in het achterhoofd, wetenschappers moeten hun experimenten zorgvuldig ontwerpen en controleren om vooroordelen uit te bannen, cirkelredenering, self-fulfilling prophecies en verborgen variabelen. Ze moeten de vereisten en beperkingen van de gebruikte methoden respecteren, waar mogelijk uit representatieve steekproeven trekken, en hun resultaten niet overdrijven.
Klaar om te lezen over 10 gevallen waarin dat niet zo eenvoudig was?
InhoudMensen zijn vervelend om te onderzoeken. Ze reageren niet alleen op de stimulus die je bestudeert, maar ook op het experiment zelf. Onderzoekers proberen tegenwoordig experimenten te ontwerpen om voor dergelijke factoren te controleren, maar dat was niet altijd het geval.
Neem de Hawthorne Works in Cicero, Ill. In een reeks experimenten van 1924-1932, onderzoekers bestudeerden de productiviteitseffecten van werknemers die verband houden met het veranderen van de omgeving van de fabriek in Illinois, inclusief veranderende lichtniveaus, het opruimen van de plaats en het verplaatsen van werkplekken. Net toen ze dachten dat ze iets op het spoor waren, ze merkten een probleem op:de waargenomen productiviteitsstijgingen markeerden bijna zodra de onderzoekers het werk verlieten, wat aangeeft dat de kennis van de werknemers van het experiment, niet de veranderingen van de onderzoekers, de boost had gegeven. Onderzoekers noemen dit fenomeen nog steeds de Hawthorne-effect .
Een verwant begrip, de John Henry-effect , treedt op wanneer leden van een controlegroep proberen de experimentele groep te verslaan door hun inspanningen in overdrive te trappen. Ze hoeven niets van het experiment af te weten; ze hoeven maar één groep nieuwe tools of aanvullende instructies te zien krijgen. Zoals de staalrijdende man van de legende, ze willen hun capaciteiten bewijzen en respect verdienen [bronnen:Saretsky; Vogt].
De titulaire karakters van Tom Stoppard's film "Rosencrantz and Guildenstern Are Dead" beginnen de film verbijsterd, verward en ten slotte bang als elk van de 157 opeenvolgende keer dat een munt wordt opgedraaid, met de kop omhoog komt. Guildenstern's verklaringen van dit fenomeen variëren van tijdlussen tot "een spectaculaire rechtvaardiging van het principe dat elke individuele munt, individueel gesponnen, komt net zo goed met kop als staart naar beneden..."
Evolutie bedraadde mensen om patronen te zien, en ons vermogen om die drang goed te verwerken lijkt te kortsluiten naarmate we langer gokken. We kunnen rationeel accepteren dat onafhankelijke evenementen zoals het opgooien van munten dezelfde kansen behouden, ongeacht hoe vaak je ze uitvoert. Maar we kijken ook naar die gebeurtenissen, minder rationeel, als strepen, het maken van valse mentale correlaties tussen gerandomiseerde gebeurtenissen. Het verleden als prelude beschouwen, we blijven denken dat de volgende salto staarten zou moeten zijn.
Statistici noemen dit de denkfout van de gokker , oftewel de Monte Carlo drogreden , naar een bijzonder illustratief voorbeeld dat zich voordeed in die beroemde badplaats in Monaco. In de zomer van 1913, Gokkers keken met toenemende verbazing toe hoe het roulettewiel van een casino 26 keer achter elkaar op zwart belandde. Ontstoken door de zekerheid dat rood was "te wijten, " de gokkers bleven hun chips naar beneden storten. Het casino maakte een munt [bronnen:Lehrer; Oppenheimer en Monin; Vogt].
Geen discussie over strepen, magisch denken of valse oorzakelijkheid zou compleet zijn zonder een blader door de sportpagina's. Stellaire sportseizoenen komen voort uit zo'n mysterieus samenspel van factoren - natuurlijk vermogen, opleiding, vertrouwen, af en toe een X-factor -- dat we ons patronen in prestaties voorstellen, ook al verwerpen studies herhaaldelijk streak shooting en "succesvol" bijgeloof als iets meer dan denkbeeldig.
Het geloof in strepen of inzinkingen houdt in dat succes succes 'veroorzaakt' en falen 'veroorzaakt' falen of, misschien redelijker, die variatie in een gemeenschappelijke factor, zoals vertrouwen, veroorzaakt beide. Maar studie na studie kan dit niet bevestigen [bronnen:Gilovich et al.; Tversky en Gilovich]. Hetzelfde geldt voor bijgeloof, hoewel dat de Cleveland Indians' Kevin Rhomberg er niet van weerhield om te weigeren rechtsaf te slaan terwijl hij op het veld stond, of voorkomen dat Bruce Gardiner, het centrum van Ottawa Senators, zijn hockeystick in het toilet dompelt om af en toe een inzinking te doorbreken [bron:Trex].
De tweedejaars inzinking, te, komt meestal voort uit een te goed eerste jaar. Prestatieschommelingen hebben de neiging om op de lange termijn gelijk te worden, een fenomeen dat statistici noemen regressie naar het gemiddelde . bij sport, deze uitmiddeling wordt geholpen door de oppositie, die zich aanpast om de succesvolle vaardigheden van de nieuwe speler tegen te gaan.
Gerandomiseerde gecontroleerde onderzoeken zijn de gouden standaard in statistieken, maar soms -- in de epidemiologie, bijvoorbeeld -- ethische en praktische overwegingen dwingen onderzoekers om beschikbare gevallen te analyseren. Helaas, zo een observatie studies risico vooringenomenheid, verborgen variabelen en, het ergste van alles, een studiegroep die mogelijk niet de populatie als geheel weerspiegelt. Het bestuderen van een representatieve steekproef is van vitaal belang; het stelt onderzoekers in staat resultaten toe te passen op mensen buiten het onderzoek, net als de rest van ons.
Een voorbeeld:hormoonvervangende therapie (HST). Naast het behandelen van symptomen die gepaard gaan met de menopauze, het werd ooit geprezen voor het mogelijk verminderen van het risico op coronaire hartziekten (CHD), dankzij een veelbesproken observatieonderzoek uit 1991 [bron:Stampfer en Colditz]. Maar later gerandomiseerde gecontroleerde studies, waaronder het grootschalige Women's Health Initiative, onthulde ofwel een negatieve relatie, of een statistisch onbeduidende, tussen HRT en CHD [bronnen:Lawlor et al.; New York Times].
Waarom het verschil? Voor een ding, vrouwen die HST gebruiken, komen meestal uit hogere sociaaleconomische lagen en krijgen een betere kwaliteit van voeding en lichaamsbeweging - een verborgen verklarende relatie waarvoor de observationele studie niet volledig rekening hield [bron:Lawlor et al.].
1978, sportverslaggever en columnist Leonard Koppett bespotte de verwarring tussen oorzakelijk verband door wrang te suggereren dat de resultaten van de Super Bowl de aandelenmarkt zouden kunnen voorspellen. Het werkte averechts:niet alleen geloofden mensen hem, maar het werkte - met angstaanjagende frequentie.
Het voorstel ging als volgt:als een van de 16 originele National Football League-teams - die bestonden vóór de fusie van de NFL in 1966 met de American Football League - de Super Bowl zou winnen, de aandelenmarkt zou het volgende jaar hoger sluiten dan op 31 december. Als een voormalig AFL-team won, het zou naar beneden gaan [bronnen:Koppett; Koppett; Koppett; Koppett; Zweig].
Van 1967 tot 1978, Het systeem van Koppett werd 12 voor 12; tot 1997, het pochte een succespercentage van 95 procent. Het struikelde in 1998 en 1999, toen AFL alums won de Denver Broncos en de markt steeg [bronnen:Koppett; Koppett; Koppett; Koppett].
Sommigen hebben beweerd dat het patroon bestaat, gedreven door geloof; het werkt, ze zeggen, omdat beleggers denken van wel, of omdat ze denken dat andere investeerders het geloven. dit idee, hoewel slim op een regressieve manier, verklaart nauwelijks de 12 jaar succesvolle correlaties die voorafgingen aan het artikel van Koppett. Anderen beweren dat een relevanter patroon ligt in de grootschalige opwaartse trend van de aandelenmarkt, behoudens enkele grote en kleine schommelingen op korte termijn, en het feit dat een origineel NFL-team van 1984 tot 1998 elke Super Bowl won [bron:Norris].
Big data - het proces van het zoeken naar patronen in datasets die zo groot zijn dat ze weerstand bieden aan traditionele analysemethoden - zorgt tegenwoordig voor veel geroezemoes in de bestuurskamer [bron:Arthur]. Maar is groter altijd beter?
Het is een regel die in de meeste onderzoekers in hun eerste stats-klasse is ingeprent:wanneer ze een zee van gegevens tegenkomen, weersta de drang om verder te gaan vis expeditie . Bij voldoende gegevens, geduld en methodologische speelruimte, correlaties zijn bijna onvermijdelijk, als het onethisch en grotendeels nutteloos is.
Ten slotte, de loutere correlatie tussen twee variabelen impliceert geen oorzakelijk verband; ook niet, vaak, wijzen op veel van een relatie. Voor een ding, onderzoekers kunnen niet willekeurig statistische maatstaven voor correlatie gebruiken; elk bevat bepaalde aannames en beperkingen die visexpedities maar al te vaak negeren, om nog maar te zwijgen van de verborgen variabelen, steekproefproblemen en interpretatiefouten die een slecht opgezet onderzoek kunnen verpesten.
Toegekend, big data heeft zijn nut. Voorraadbeheer gedijt bij het ontdekken van aankooppatronen, hoe mysterieus hun onderliggende oorzaken ook zijn. Om een enigszins griezelig voorbeeld te nemen, Target heeft aankooppatronen gebruikt om zwangere klanten te identificeren en hen vervolgens gerichte kortingsbonnen te sturen [bronnen:Duhigg; Heuvel; Taylor]. Dus geniet van die beloningskaart - en 10 procent korting op je prenatale vitamines - maar verwacht niet te veel van big data in de causaliteitsafdeling.
Elke kwestie die met geld te maken heeft, zal ongetwijfeld zeer verdeeldheid zaaien en sterk gepolitiseerd zijn, en minimumloonverhogingen zijn geen uitzondering. De argumenten zijn gevarieerd en complex, maar in wezen beweert één kant dat een hoger minimumloon bedrijven schaadt, waardoor de beschikbaarheid van banen afneemt, wat de armen pijn doet. De andere kant antwoordt dat er weinig bewijs is voor deze bewering, en dat de 3,6 miljoen Amerikanen die op of onder het minimumloon werken, waarvan sommigen beweren dat het geen leefbaar loon is, zou profiteren van een dergelijke verhoging. Ze stellen dat, aangepast voor inflatie, het federale minimumloon ($ 7,25 per uur in december 2013) is de afgelopen 40 jaar bergafwaarts gegaan [bronnen:Bureau of Labor Statistics; Irwin].
Zoals George Bernard Shaw naar verluidt grapte, "Als alle economen van begin tot eind zouden worden gelegd, ze zouden nooit tot een conclusie komen, " en het debat over het minimumloon lijkt dat te bevestigen [bron:Ridgers. Voor elke analist die zegt dat verhogingen van het minimumloon banen wegjagen, is er een ander die tegen een dergelijke correlatie pleit [bronnen:Baskaya en Rubinstein; Card en Krueger].
Uiteindelijk, beide partijen delen een fundamenteel probleem, namelijk, de overvloed aan anekdotisch bewijs waar veel van hun pratende hoofden op vertrouwen voor ondersteuning. Tweedehands verhalen en door kers geplukte gegevens zorgen voor slappe thee op elk feest, zelfs wanneer gepresenteerd in mooie staafdiagrammen.
Tussen boeken, medicijnen en operaties, gewichtsverlies in de Verenigde Staten is een industrie van $ 20 miljard per jaar, met 108 miljoen Amerikanen die elk jaar naar de afslankbalk gaan [bron:ABC News]. Niet verrassend, onderzoek naar gewichtsverlies -- goed, slecht of lelijk -- krijg veel pers in de V.S.
Neem het populaire idee dat ontbijten beter is dan obesitas, een met suiker berijpte goudklomp die is afgeleid van twee hoofdonderzoeken:een, een gerandomiseerde gecontroleerde studie van Vanderbilt University uit 1992, toonde aan dat het omkeren van normale ontbijtgewoonten, al dan niet door te eten, gecorreleerd met gewichtsverlies; de andere, een observatieonderzoek uit 2002 door de National Weight Control Registry, gecorreleerd ontbijt-eten met succesvolle afslankers - wat niet hetzelfde is als het correleren met gewichtsverlies [bronnen:Brown et al.; O'Connor; Schlundt et al.; Wyatt et al.].
Helaas, de NWCR-studie kon niet controleren voor andere factoren - of, inderdaad, een causaal verband vaststellen op basis van de correlatie. Bijvoorbeeld, een persoon die wil afvallen, kan meer trainen, of ontbijten, of ga voor volkoren proteïne, maar zonder een experimenteel ontwerp dat causale verbanden kan inbellen, dergelijk gedrag komt neer op niets meer dan algemeen voorkomende kenmerken [bronnen:Brown et al.; O'Connor].
Een soortgelijk probleem plaagt de talrijke onderzoeken die familiediners koppelen aan een verminderd risico op drugsverslaving voor tieners. Hoewel aantrekkelijk vanwege hun eenvoudige, aansprekende strategie, deze studies slagen er vaak niet in om te controleren voor gerelateerde factoren, zoals sterke familiebanden of diepe ouderlijke betrokkenheid bij het leven van een kind [bron:Bialik].
We horen het vaak over die mannen, vooral jonge mannen, plegen vaker zelfmoord dan vrouwen. in waarheid, dergelijke uitspraken maken deel uit van empirische generalisatie -- de handeling van het maken van een algemene uitspraak over een gemeenschappelijk patroon zonder te proberen het uit te leggen -- en een aantal bekende en potentiële verstorende factoren te maskeren.
Nemen, bijvoorbeeld, het feit dat vrouwen drie keer zoveel zelfmoordpogingen doen als mannen. Hoe kan er dan een hogere correlatie bestaan tussen het andere geslacht en zelfmoord? Het antwoord ligt in het slagingspercentage, beïnvloed door verschillen in methodologie:vrouwen nemen hun toevlucht tot pillen, terwijl mannen de voorkeur geven aan wapens [bron:O'Connell].
Zelfs als we over zulke verstorende factoren zouden kunnen beschikken, het feit zou blijven dat mannelijkheid, per se, is geen oorzaak. Om de trend te verklaren, we moeten in plaats daarvan factoren identificeren die mannen gemeen hebben, of in ieder geval zelfmoordneigingen. Hetzelfde geldt voor de relatief hoge zelfmoordcijfers onder gescheiden mannen. Echtscheiding zorgt er niet voor dat mannen zelfmoord plegen; als iets, de causale variabele verbergt zich tussen gerelateerde factoren, zoals isolatie, depressie, een gevoel van machteloosheid, financiële stress of verlies van bewaring [bronnen:Kposowa; Kposowa; Reuters].
Geen lijst met correlaties/oorzaken zou compleet zijn zonder de bezorgdheid van ouders over vaccinatieveiligheid te bespreken, geworteld in het idee, gepopulariseerd door beroemdheden als Jenny McCarthy, die mazelen, vaccinaties tegen bof en rubella (BMR) zijn causaal verbonden met autismespectrumstoornissen. Ondanks dat de medische gemeenschap het artikel van Andrew Wakefield uit 1998 ontkrachtte dat het idee inspireerde, en ondanks latere studies die geen causaal verband aantonen, zelfs met meerdere vaccinaties, sommige ouders blijven bang voor een autisme-verbinding of andere vaccingerelateerde gevaren [bronnen:The Lancet; Park; Sifferlin; Szabo].
Hoewel het waar is dat geen enkel vaccin 100 procent onschadelijk is, het geloof in dit oorzakelijk verband komt voornamelijk voort uit natuurlijke ouderlijke zorg, gebukt onder verwarring, gevoed door anekdotisch bewijs en beïnvloed door voorkeur voor bevestiging , of "als ik het niet had geloofd, had ik het niet gezien." De verwarring wordt verder aangewakkerd door het feit dat ouders en artsen de neiging hebben om autismesymptomen laat te herkennen, rond de leeftijd dat kinderen veel vaccinaties krijgen. Eigenlijk, Het begin van autisme is vrij complex en volgt meer dan één patroon. Inderdaad, studies tonen nu aan dat het begin al na 6-12 maanden kan beginnen [bronnen:CDC; Johnson en Schultz; Mandell et al.; NIH; Ozonoff et al.].
Het is geen onschuldig misverstand. In 2011, Time Magazine meldde dat 13 procent van de ouders de vaccinaties van hun kinderen uitgesteld of opgesplitst; in sommige landelijke gebieden, dat aantal schoot omhoog tot tussen de 20 en 50 procent. In de tussentijd, 15 jaar nadat deze paniek begon, medische centra meldden uitbraken van kinkhoest en mazelen. Of die correspondentie toevallig is, correlatief of causaal is het overwegen waard [bronnen:O'Connor; Park; Park].
Oorspronkelijk gepubliceerd:23 december, 2013
Hoezeer ik een slecht experimenteel ontwerp ook verafschuw, blind vertrouwen op statistieken en sensationele wetenschappelijke rapportage, het is vermeldenswaard dat sterke correlaties, hoewel niet alleen voldoende om de oorzaak te bewijzen, wijzen vaak op gebieden die het onderzoeken waard zijn. Duidelijk, met "correlaties" bedoel ik niet autocorrelaties, verwarrende variabelen of andere artefacten van slecht ontwerp of slecht begrepen methodologische vereisten en beperkingen; hoe dan ook, misschien kan het internet de slogan "correlatie impliceert geen oorzakelijk verband" een beetje afschaffen, of op zijn minst een beetje selectiever worden in de toepassing ervan.
Wetenschap © https://nl.scienceaq.com