science >> Wetenschap >  >> Wiskunde

Chi-Squared interpreteren

Chi-kwadraat, beter bekend als Pearson's chikwadraattest, is een middel om gegevens statistisch te evalueren. Het wordt gebruikt wanneer categoriegegevens van een steekproef worden vergeleken met verwachte of "echte" resultaten. Als we bijvoorbeeld geloven dat 50 procent van alle jelly beans in een bak rood is, moet een monster van 100 bonen uit die bak ongeveer 50 bevatten die rood zijn. Als ons aantal verschilt van 50, vertelt de Pearson-test ons of onze 50 procent-aanname verdacht is, of dat we het verschil kunnen toeschrijven dat we hebben gezien voor normale willekeurige variatie.

Chi-kwadraatwaarden interpreteren

Bepaal de vrijheidsgraden van uw chikwadraatwaarde. Als u resultaten voor één steekproef met meerdere categorieën vergelijkt, is de vrijheidsgraden het aantal categorieën minus 1. Als u bijvoorbeeld de verdeling van kleuren in een pot met jellybeans evalueerde en er vier kleuren waren, waren de graden van vrijheid zou zijn 3. Als u tabelgegevens vergelijkt, is de vrijheidsgraad gelijk aan het aantal rijen min 1 vermenigvuldigd met het aantal kolommen minus 1.

Bepaal de kritieke p-waarde die u zult gebruiken om uw gegevens te evalueren . Dit is de procentuele waarschijnlijkheid (gedeeld door 100) dat een specifieke chikwadraatwaarde alleen door toeval is verkregen. Een andere manier om aan p te denken, is dat het de waarschijnlijkheid is dat uw waargenomen resultaten afwijken van de verwachte resultaten met de hoeveelheid die ze alleen hebben veroorzaakt door willekeurige variatie in het bemonsteringsproces.

Zoek de p-waarde op die is gekoppeld aan uw chikwadraat-teststatistiek met behulp van de chi-square distributietabel. Bekijk hiervoor de rij die overeenkomt met uw berekende vrijheidsgraden. Zoek de waarde in deze rij die het dichtst bij uw teststatistiek ligt. Volg de kolom die die waarde naar boven bevat naar de bovenste rij en lees de p-waarde af. Als uw teststatistiek tussen twee waarden in de eerste rij ligt, kunt u een geschatte p-waarde tussenliggen tussen twee p-waarden in de bovenste rij.

Vergelijk de van de tabel verkregen p-waarde met de kritieke p waarde eerder bepaald. Als uw tabelwaarde p boven de kritieke waarde ligt, concludeert u dat elke afwijking tussen de waarden van de steekproefcategorie en de verwachte waarden het gevolg was van willekeurige variatie en niet significant was. Als u bijvoorbeeld een kritieke p-waarde van 0,05 (of 5%) hebt gekozen en een tabelwaarde van 0,20 hebt gevonden, concludeert u dat er geen significante variatie was.

Tip

Vergeet niet dat De conclusie die op basis van deze test wordt getrokken, heeft nog steeds een kans verkeerd te zijn, evenredig met de verkregen p-waarde.

Waarschuwingstest

De verkregen waarde voor elke categorie in de steekproef moet ten minste 5 zijn voor resultaten zijn geldig.