science >> Wetenschap >  >> anders

Wat is de Tukey HSD-test?

De Tukey HSD-test ("eerlijk significant verschil" of "eerlijk significant verschil") is een statistisch hulpmiddel dat wordt gebruikt om te bepalen of de relatie tussen twee gegevenssets statistisch significant is, dat wil zeggen, of er een grote kans is dat een waargenomen numerieke verandering in de ene waarde causaal verband houdt met een waargenomen verandering in een andere waarde. Met andere woorden, de Tukey-test is een manier om een experimentele hypothese te testen.

De Tukey-test wordt gebruikt wanneer u moet bepalen of de interactie tussen drie of meer variabelen statistisch significant is, wat helaas niet eenvoudig is een som of product van de afzonderlijke significantieniveaus.
Waarom geen t-test?

Eenvoudige statistische problemen houden in dat wordt gekeken naar de effecten van één (onafhankelijke) variabele, zoals het aantal uren dat door elk van hen is bestudeerd student in een klas voor een bepaalde test, op een tweede (afhankelijke) variabele, zoals de scores van de student op de test. In dergelijke gevallen stelt u meestal uw grenswaarde voor statistische significantie in op P <0,05, waarbij het experiment een kans van meer dan 95 procent laat zien dat de variabelen in kwestie echt verband houden. Vervolgens verwijst u naar een t-tabel die rekening houdt met het aantal gegevensparen in uw experiment om te zien of uw hypothese correct was.

Soms kijkt het experiment echter tegelijkertijd naar meerdere onafhankelijke of afhankelijke variabelen. In het bovenstaande voorbeeld kunnen bijvoorbeeld de uren slaap die elke student de nacht vóór de test heeft gekregen en zijn of haar klasclassificatie worden opgenomen. Dergelijke multivariate problemen vereisen iets anders dan een t-test vanwege het grote aantal als onafhankelijk variërende relaties.
De ANOVA

ANOVA staat voor "variantieanalyse" en lost precies het zojuist beschreven probleem op. Het verklaart de snel toenemende vrijheidsgraden in een steekproef wanneer variabelen worden toegevoegd. Bijvoorbeeld, kijken naar uren versus scores is één paar, slaap versus scores is een andere, cijfers versus scores is een derde en ondertussen werken al die onafhankelijke variabelen ook met elkaar samen.

In een ANOVA-test, de variabele van belang nadat berekeningen zijn uitgevoerd, is F, wat de gevonden variatie is van de gemiddelden van alle paren of groepen, gedeeld door de verwachte variatie van deze gemiddelden. Hoe hoger dit getal, hoe sterker de relatie en "significantie" wordt meestal ingesteld op 0,95. Het rapporteren van ANOVA-resultaten vereist meestal het gebruik van een ingebouwde rekenmachine zoals die gevonden in Microsoft Excel, evenals speciale statistische programma's zoals SPSS.
De Tukey HSD-test

John Tukey kwam met de test dat draagt zijn naam toen hij de wiskundige valkuilen realiseerde van het proberen om onafhankelijke P-waarden te gebruiken om het nut van een hypothese met meerdere variabelen als geheel te bepalen. Destijds werden t-tests toegepast op drie of meer groepen, en hij beschouwde dit als oneerlijk - vandaar "eerlijk significant verschil".

Wat zijn test doet, is de verschillen tussen waarden vergelijken in plaats van vergelijken paren van waarden. De waarde van de Tukey-test wordt gegeven door de absolute waarde van het verschil tussen gemiddeldenparen te nemen en deze te delen door de standaardfout van het gemiddelde (SE) zoals bepaald door een eenrichtings-ANOVA-test. De SE is op zijn beurt de vierkantswortel van (variantie gedeeld door steekproefgrootte). Een voorbeeld van een online rekenmachine is te vinden in de sectie Bronnen.

De Tukey-test is een post-hoc test omdat de vergelijkingen tussen variabelen worden gemaakt nadat de gegevens al zijn verzameld. Dit verschilt van een a-priori test, waarbij deze vergelijkingen vooraf worden gemaakt. In het eerste geval zou je eens kunnen kijken naar de mijllooptijden van studenten in drie verschillende fysieke klassen één jaar. In het laatste geval kunt u studenten toewijzen aan een van de drie docenten en ze vervolgens een getimede mijl laten uitvoeren.