Wetenschap
Statistieken gaan over het trekken van conclusies in het licht van onzekerheid. Wanneer u een steekproef neemt, kunt u er niet helemaal zeker van zijn dat uw steekproef echt de populatie weerspiegelt waaruit deze is getrokken. Statistici gaan met deze onzekerheid om door rekening te houden met de factoren die van invloed kunnen zijn op de schatting, door hun onzekerheid te kwantificeren en door statistische tests te doen om conclusies te trekken uit deze onzekere gegevens.
Statistici gebruiken betrouwbaarheidsintervallen om een reeks waarden te specificeren die waarschijnlijk de "echte" populatiegemiddelde bevatten op basis van een steekproef, en hun mate van zekerheid hierin uitdrukken via betrouwbaarheidsniveaus. Hoewel het berekenen van betrouwbaarheidsniveaus niet vaak nuttig is, is het berekenen van betrouwbaarheidsintervallen voor een bepaald betrouwbaarheidsniveau een zeer nuttige vaardigheid.
TL; DR (te lang; niet gelezen)
Bereken een betrouwbaarheidsinterval voor een bepaald betrouwbaarheidsniveau door de standaardfout te vermenigvuldigen met de Z Herhaal hetzelfde proces maar met de t Zoek een betrouwbaarheidsniveau voor een gegevensset door de helft van de grootte van het betrouwbaarheidsinterval te nemen, dit te vermenigvuldigen met de vierkantswortel van de steekproefgrootte en vervolgens te delen door de standaarddeviatie van de steekproef. Zoek de resulterende score Z Wanneer u een geciteerde statistiek, er wordt soms een bereik achter gegeven, met de afkorting "CI" (voor "betrouwbaarheidsinterval") of gewoon een plus-min-symbool gevolgd door een cijfer. Bijvoorbeeld: "het gemiddelde gewicht van een volwassen man is 180 pond (CI: 178.14 tot 181.86)" of "het gemiddelde gewicht van een volwassen man is 180 ± 1,86 pond." Beide vertellen u dezelfde informatie: op basis van het monster gebruikt, valt het gemiddelde gewicht van een man waarschijnlijk binnen een bepaald bereik. Het bereik zelf wordt het betrouwbaarheidsinterval genoemd. Als u er zeker van wilt zijn dat het bereik de echte waarde bevat, kunt u het bereik verbreden. Dit zou uw "betrouwbaarheidsniveau" in de schatting verhogen, maar het bereik zou meer potentiële gewichten dekken. De meeste statistieken (inclusief die hierboven geciteerd) worden gegeven als betrouwbaarheidsintervallen van 95 procent, wat betekent dat er een kans van 95 procent is dat de werkelijke gemiddelde waarde binnen het bereik ligt. U kunt ook een betrouwbaarheidsniveau van 99 procent of een betrouwbaarheidsniveau van 90 procent gebruiken, afhankelijk van uw behoeften. Als u een betrouwbaarheidsniveau in statistieken gebruikt, hebt u meestal nodig het om een betrouwbaarheidsinterval te berekenen. Dit is een beetje gemakkelijker om te doen als je een grote steekproef hebt, bijvoorbeeld meer dan 30 mensen, omdat je de Z Neem uw onbewerkte gegevens en bereken het steekproefgemiddelde (tel de individuele resultaten op en deel door het aantal resultaten). Bereken de standaarddeviatie door het gemiddelde van elk individueel resultaat af te trekken om het verschil te vinden en dit verschil vervolgens te kwadrateren. Tel al deze verschillen op en deel het resultaat door de steekproefgrootte min 1. Neem de vierkantswortel van dit resultaat om de standaarddeviatie van de steekproef te vinden (zie bronnen). Bepaal het betrouwbaarheidsinterval door eerst de standaardfout: SE Waar s SE Om het betrouwbaarheidsinterval hiervan te vinden, zoekt u het betrouwbaarheidsniveau op waarvoor u het interval wilt berekenen in een Z Gemiddelde ± Z Hier, ± 1,86 pond is het betrouwbaarheidsinterval van 95 procent. Als u in plaats daarvan dit stukje informatie hebt, samen met de steekproefgrootte en de standaardafwijking, kunt u het betrouwbaarheidsniveau berekenen met behulp van de volgende formule: Z De grootte van de betrouwbaarheidsinterval is slechts tweemaal de waarde ±, dus in het bovenstaande voorbeeld weten we 0,5 keer dat dit 1,86 is. Dit geeft: Z Dit geeft ons een waarde voor Z Voor kleine monsters is er een vergelijkbaar proces voor het betrouwbaarheidsinterval berekenen. Trek eerst 1 af van uw steekproefomvang om uw "vrijheidsgraden" te vinden. In symbolen: df Voor een voorbeeld n Vind uw alfawaarde door de decimale versie van het betrouwbaarheidsniveau af te trekken ( dat wil zeggen uw percentage betrouwbaarheidsniveau gedeeld door 100) van 1 en het resultaat gedeeld door 2, of in symbolen: α α Zoek uw alfawaarde en vrijheidsgraden op in een (één staart) t Bereken, net als in de vorige stap, het betrouwbaarheidsinterval door dit getal te vermenigvuldigen met de standaardfout, die op dezelfde manier wordt bepaald met uw standaarddeviatie van de steekproef en de steekproefgrootte. Het enige verschil is dat u in plaats van de score Z
-score voor het door u gekozen betrouwbaarheidsniveau. Trek dit resultaat af van uw steekproefgemiddelde om de ondergrens te krijgen en voeg het toe aan het steekproefgemiddelde om de bovengrens te vinden. (Zie bronnen)
score in plaats van de Z
score voor kleinere monsters ( n
<30 ).
of t
op in een tabel om het niveau te vinden.
Het verschil tussen betrouwbaarheidsniveau versus betrouwbaarheidsinterval
Vertrouwensintervallen of niveaus berekenen voor grote monsters
-score kunt gebruiken voor je schatting in plaats van meer gecompliceerde t
-scores.
\u003d s
/√ n
is de standaarddeviatie van uw steekproef en n
is uw steekproefgrootte. Als u bijvoorbeeld een steekproef van 1000 mannen nam om het gemiddelde gewicht van een man te berekenen en een standaardafwijking van 30 kreeg, zou dit het volgende opleveren:
\u003d 30 /√1000 \u003d 30 /31.62 \u003d 0.95
-score tabel en vermenigvuldig deze waarde met de score Z
. Voor een betrouwbaarheidsniveau van 95 procent is de Z
-score 1,96. In het voorbeeld betekent dit:
× SE
\u003d 180 pond ± 1,96 × 0,95 \u003d 180 ± 1,86 pond
\u003d 0,5 × grootte van betrouwbaarheidsinterval × √ n
/ s
\u003d 1,86 × √1000 /30 \u003d 1,96
, die u kunt opzoeken in een Z
-score-tabel om het overeenkomstige betrouwbaarheidsniveau te vinden.
Berekening van betrouwbaarheidsintervallen voor kleine monsters
\u003d n
−1
\u003d 10, geeft dit df
\u003d 9.
\u003d (1 - decimaal betrouwbaarheidsniveau) /2
Dus voor een betrouwbaarheidsniveau van 95 procent (0,95):
\u003d (1 - 0.95) /2 \u003d 0.05 /2 \u003d 0.025
distributietabel en noteer het resultaat. U kunt ook de deling met 2 hierboven weglaten en een t
-waarde met twee staarten gebruiken. In dit voorbeeld is het resultaat 2.262.
de score t
gebruikt.
Wetenschap © https://nl.scienceaq.com