Science >> Wetenschap & Ontdekkingen >  >> Wiskunde

Waarom grotere steekproeven de wetenschappelijke bevindingen versterken

Door Jon Zamboni | Bijgewerkt op 30 augustus 2022

ALFSnaiper/iStock/GettyImages

In onderzoek is dit het aantal waarnemingen, vaak aangeduid als n – is cruciaal voor betrouwbare resultaten. Een grotere steekproef geeft een duidelijker beeld van de populatie, verkleint de invloed van afwijkende gegevens en verkleint de foutmarge.

TL;DR

Grote steekproeven leveren nauwkeurigere gemiddelden op, benadrukken echte uitschieters en verkleinen de betrouwbaarheidsintervallen, waardoor de bevindingen betrouwbaarder worden.

Steekproefgrootte

Steekproefgrootte verwijst naar het aantal gegevenspunten dat in een enquête of experiment is verzameld. Het testen van 100 zeewatermonsters op olieresiduen betekent bijvoorbeeld een monstergrootte van 100; het ondervragen van 20.000 personen over angst levert een steekproefomvang van 20.000 op. Hoewel grotere steekproeven meer bronnen vergen, zijn de resultaten rijkere en robuustere gegevens.

Gemiddelde waarde en uitschieters

Het berekenen van het gemiddelde (het rekenkundig gemiddelde) wordt nauwkeuriger naarmate n groeit. Overweeg het meten van de lengte:bij 40 deelnemers kan het gemiddelde 1,80 meter zijn, maar bij 100 deelnemers kan dit verschuiven naar 1,80 meter, wat een meer representatieve schatting oplevert. Een grotere dataset legt ook echte uitschieters bloot (waarden die aanzienlijk afwijken van het gemiddelde), wat waardevolle inzichten oplevert voor verder onderzoek.

Het gevaar van kleine monsters

Kleine steekproeven zijn kwetsbaar voor scheve resultaten. Het ondervragen van slechts vier mensen over politieke overtuiging en het vinden van één onafhankelijke kiezer zou ten onrechte suggereren dat 25% van de bevolking onafhankelijk is. Door de steekproef uit te breiden wordt de impact van dergelijke afwijkingen kleiner, waardoor de statistieken de werkelijkheid weerspiegelen.

Foutmarge

De steekproefgrootte heeft rechtstreeks invloed op de foutmarge van een statistiek. Voor binaire vragen (bijvoorbeeld autobezit) is de foutmarge grofweg 100÷√n . Een steekproef van 100 levert een marge van 10% op. Voor continue meetgegevens (bijvoorbeeld hoogte) vermenigvuldigt u dit cijfer met tweemaal de standaardafwijking om de variabiliteit vast te leggen. In elk geval groter n verkleint de marge en vergroot het vertrouwen in de resultaten.