science >> Wetenschap >  >> anders

Voorbeeldafwijking vinden

Statistische tests zoals de t
-test zijn intrinsiek afhankelijk van het concept van een standaarddeviatie. Elke student in statistiek of wetenschap zal regelmatig standaardafwijkingen gebruiken en moet begrijpen wat het betekent en hoe het te vinden uit een set gegevens. Gelukkig is het enige dat je nodig hebt de originele gegevens, en hoewel de berekeningen vervelend kunnen zijn als je veel gegevens hebt, moet je in deze gevallen functies of spreadsheetgegevens gebruiken om dit automatisch te doen. Het enige dat u hoeft te doen om het sleutelconcept te begrijpen, is om een eenvoudig voorbeeld te zien dat u eenvoudig met de hand kunt uitwerken. In de kern meet de standaarddeviatie van de steekproef hoeveel de door u gekozen hoeveelheid varieert over de hele populatie op basis van uw steekproef.

TL; DR (te lang; niet gelezen)

Gebruik n
om de steekproefgrootte te betekenen, μ
voor het gemiddelde van de gegevens, x
i voor elk afzonderlijk gegevenspunt (van i
\u003d 1 tot i
\u003d n
), en Σ als een sommatieteken, de steekproefvariantie ( s
2) is:

s

2 \u003d (Σ x
i - μ
) 2 /( n
- 1)

En de standaarddeviatie van het voorbeeld is:

s

\u003d √ s

2
Standaardafwijking versus steekproef Standaardafwijking

Statistieken draaien om het maken van schattingen voor hele populaties op basis van kleinere steekproeven uit de populatie, en het verklaren van eventuele onzekerheid in de schatting in het proces. Standaardafwijkingen kwantificeren de hoeveelheid variatie in de populatie die u bestudeert. Als u de gemiddelde hoogte probeert te vinden, krijgt u een cluster met resultaten rond de gemiddelde (gemiddelde) waarde en beschrijft de standaarddeviatie de breedte van de cluster en de hoogteverdeling over de populatie.

De standaarddeviatie van de "steekproef" schat de werkelijke standaarddeviatie voor de hele populatie op basis van een kleine steekproef uit de populatie. Meestal zult u niet in staat zijn om de hele populatie in kwestie te bemonsteren, dus de standaarddeviatie van de steekproef is vaak de juiste versie om te gebruiken.
De standaardafwijking van de steekproef vinden

U hebt uw resultaten nodig en het aantal ( n
) mensen in uw steekproef. Bereken eerst het gemiddelde van de resultaten ( μ
) door alle individuele resultaten op te tellen en dit vervolgens te delen door het aantal metingen.

Als voorbeeld, de hartslag (in slagen per minuut) van vijf mannen en vijf vrouwen zijn:

71, 83, 63, 70, 75, 69, 62, 75, 66, 68

Dat leidt tot een gemiddelde van:

μ

\u003d (71 + 83 + 63 + 70 + 75 + 69 + 62 + 75 + 66 + 68) ÷ 10

\u003d 702 ÷ 10 \u003d 70.2

De volgende stap is om het gemiddelde van elke afzonderlijke meting af te trekken en vervolgens het resultaat te kwadrateren. Als voorbeeld, voor het eerste gegevenspunt:

(71 - 70.2) 2 \u003d 0.8 2 \u003d 0.64

En voor de tweede:

(83 - 70.2) 2 \u003d 12.8 2 \u003d 163.84

Ga door op deze manier door de gegevens en tel deze resultaten op. Dus voor de voorbeeldgegevens is de som van deze waarden:

0,64 + 163,84 +51,84 + 0,04 + 23,04 + 1,44 + 67,24 +23,04 + 17,64 + 4,84 \u003d 353,6

De volgende fase onderscheidt tussen de standaarddeviatie van de steekproef en de standaarddeviatie van de populatie. Voor de steekproefafwijking deelt u dit resultaat door de steekproefgrootte min één ( n
-1). In ons voorbeeld is n
\u003d 10, dus n
- 1 \u003d 9.

Dit resultaat geeft de steekproefvariantie, aangegeven met s
< sup> 2, die bijvoorbeeld is:

s

2 \u003d 353.6 ÷ 9 \u003d 39.289

De standaarddeviatie van het monster ( s
) is gewoon de positieve vierkantswortel van dit getal:

s

\u003d √39.289 \u003d 6.268

Als u berekenden de populatiestandaarddeviatie ( σ
) het enige verschil is dat u deelt door n
in plaats van n
−1.

Het geheel formule voor standaarddeviatie van het monster kan worden uitgedrukt met behulp van het sommatiesymbool Σ, waarbij de som het hele monster is en x
i het i_de resultaat uit _n
voorstelt. De steekproefvariantie is:

s

2 \u003d (Σ x
i - μ
) 2 /( n
- 1)

En de standaarddeviatie van het voorbeeld is eenvoudig:

s

\u003d √ s

2
Gemiddelde afwijking versus standaardafwijking

De gemiddelde afwijking wijkt enigszins af van de standaardafwijking. In plaats van de verschillen tussen het gemiddelde en elke waarde te kwadrateren, neemt u in plaats daarvan het absolute verschil (negeert eventuele mintekens) en zoekt u vervolgens het gemiddelde daarvan. Voor het voorbeeld in de vorige sectie geven de eerste en tweede gegevenspunten (71 en 83):

x

1 - μ
\u003d 71 - 70.2 \u003d 0.8

x
2 - μ
\u003d 83 - 70.2 \u003d 12.8

Het derde gegevenspunt geeft een negatief resultaat

x

3 - μ
\u003d 63 - 70.2 \u003d −7.2

Maar u gewoon verwijder het minteken en neem dit als 7.2.

De som van al deze geeft gedeeld door n
geeft de gemiddelde afwijking. In het voorbeeld:

(0.8 + 12.8 + 7.2 + 0.2 + 4.8 + 1.2 + 8.2 + 4.8 + 4.2 + 2.2) ÷ 10 \u003d 46 ÷ 10 \u003d 4.64

Dit verschilt aanzienlijk van de standaardafwijking eerder berekend, omdat het geen vierkanten en wortels betreft.