Science >> Wetenschap >  >> Fysica

Wat zijn betrouwbaarheidsintervallen in statistieken?

Als je een munt opgooit, zijn 10 muntjes op rij misschien heel onwaarschijnlijk. Maar na 10 worpen is de kans op munt bij de volgende salto nog steeds 50 procent. Monty Rakusen/Getty Images

Statistiek is een beetje een mix tussen wiskunde en waarschijnlijkheid. Het doel van statistieken is het beschrijven van processen die je in de wereld kunt observeren – de hoogte van eikenbomen of de waarschijnlijkheid dat een vaccin zal werken om ziekten af ​​te weren – zonder dat je elke eik ter wereld hoeft te meten of elke persoon hoeft te vaccineren voordat je besluit hoe. effectief een medicijn is.

Omdat waarschijnlijkheid dingen beschrijft die met toeval te maken hebben, moeten we accepteren dat welk proces we ook met behulp van statistieken meten, we nooit het volledige beeld zullen krijgen.

Inhoud
  1. Waarom statistieken gebruiken?
  2. Betrouwbaarheidsintervallen
  3. De grenzen van de statistiek

Waarom statistieken gebruiken?

Stel dat je vier keer een munt opgooit. Je krijgt drie koppen en één staart. Zonder gebruik te maken van statistieken zouden we kunnen concluderen dat de kans op kop 75 procent is, terwijl de werkelijke kans op kop bij het opgooien van munten 1:1 is, oftewel een kans van 50-50. Als we in plaats daarvan veertig muntjes zouden opgooien, zouden we zeker veel dichter bij een verhouding van kop tot munt van 1:1 komen, en het gebruik van statistieken zou dit weerspiegelen.

“Veel statistieken hebben te maken met het redeneren vanuit een steekproef – de feitelijke waarnemingen – naar kenmerken van de bevolking – allemaal mogelijke waarnemingen”, zegt John Drake, onderzoeksprofessor bij het Center for the Ecology of Infectious Diseases van de Universiteit van Georgia. in een e-mail. "We zijn bijvoorbeeld misschien geïnteresseerd in de hoogte van eikenbomen. We kunnen niet alle eikenbomen ter wereld meten, maar we kunnen er wel enkele meten. We kunnen de gemiddelde hoogte van eikenbomen in het monster berekenen, maar dit zal niet lukken." Het hoeft niet noodzakelijkerwijs hetzelfde te zijn als het gemiddelde van alle eikenbomen."

Betrouwbaarheidsintervallen

Omdat we niet alle eikenbomen ter wereld kunnen meten, komen statistici met een geschat bereik van hoogten op basis van waarschijnlijkheid en alle gegevens waarover ze beschikken. Dit bereik wordt een betrouwbaarheidsinterval genoemd en bestaat uit twee getallen:een getal dat waarschijnlijk kleiner is dan de werkelijke waarde en een getal dat waarschijnlijk groter is. De werkelijke waarde ligt waarschijnlijk ergens tussen.

"Een '95 procent betrouwbaarheidsinterval' betekent dat 95 van de 100 keer dat het betrouwbaarheidsinterval op deze manier wordt geconstrueerd, het interval de werkelijke waarde zal omvatten", zegt Drake. "Als we monsters van eikenbomen 100 keer zouden meten, zou het betrouwbaarheidsinterval op basis van de gegevens verzameld in 95 van die experimenten het populatiegemiddelde omvatten, of de gemiddelde hoogte van alle eiken. Een betrouwbaarheidsinterval is dus een maatstaf voor de nauwkeurigheid van een schatting. De schatting wordt steeds nauwkeuriger naarmate u meer gegevens verzamelt. Daarom worden de betrouwbaarheidsintervallen kleiner naarmate er meer gegevens beschikbaar komen."

Een betrouwbaarheidsinterval helpt dus om aan te geven hoe goed of slecht de schatting is. Als we slechts vier keer een muntje opgooien, heeft onze schatting van 75 procent een breed betrouwbaarheidsinterval, omdat onze steekproefomvang erg klein is. Onze schatting met 40 opgooien zou een veel kleiner betrouwbaarheidsinterval hebben.

De werkelijke betekenis van een betrouwbaarheidsinterval heeft te maken met het keer op keer herhalen van een experiment. In het geval van de vier muntopgooien betekent een betrouwbaarheidsinterval van 95 procent dat als we het muntopgooi-experiment 100 keer herhalen, in 95 daarvan de kans dat we kop krijgen binnen dat betrouwbaarheidsinterval zal vallen.

De grenzen van de statistiek

Er zijn grenzen aan statistieken. Je moet een goed onderzoek opzetten. Statistieken kunnen je niets vertellen wat je niet hebt gevraagd.

Stel dat u de werkzaamheid van een vaccin bestudeert, maar dat u geen kinderen bij uw onderzoek heeft betrokken. Je kunt een betrouwbaarheidsinterval bedenken op basis van de gegevens die je hebt verzameld, maar dat zegt niets over hoe goed het vaccin kinderen beschermt.

“Naast voldoende data moet de steekproef ook representatief zijn”, zegt Drake. “Meestal betekent dit dat je een willekeurige steekproef of een gestratificeerde willekeurige steekproef hebt. Ervan uitgaande dat de 1.000 deelnemers aan je hypothetische vaccinproef representatief zijn voor de populatie, dan is het redelijk om te concluderen dat de werkelijke werkzaamheid van het vaccin binnen het gerapporteerde betrouwbaarheidsinterval ligt. Als de steekproef niet representatief is – als er geen kinderen in zitten – dan is er geen statistische basis om conclusies te trekken over het niet-vertegenwoordigde deel van de bevolking."

Dat is interessant:

Florence Nightingale was een van de belangrijkste statistici in de geschiedenis en gebruikte de wetenschap waarmee zij pionierde om de levens van soldaten te redden tijdens de Krimoorlog.