Wetenschap
De sterkste manier om te laten zien hoe twee variabelen geassocieerd zijn - zoals studietijd en natuurlijk succes - is de correlatie. Variërend van +1,0 tot -1,0, laat de correlatie precies zien hoe de ene variabele verandert als de andere.
Voor sommige onderzoeksvragen is een van de variabelen continu, zoals het aantal uren dat een student studeert voor een onderzoek, dat wekelijks kan variëren van 0 tot meer dan 90 uur. De andere variabele is dichotoom, zoals: is deze student geslaagd voor het examen, of niet? In dergelijke situaties moet u de punt-biseriële correlatie berekenen.
Voorbereiding
Schik uw gegevens in een tabel met drie kolommen, hetzij op papier of op een computerwerkblad: zaaknummer (zoals als 'Student # 1', 'Student # 2', enzovoort), variabele X (zoals 'Totaal aantal uren studie') en variabele Y (zoals 'geslaagd examen'). Voor een bepaald geval is variabele Y gelijk aan 1 (deze student slaagde voor het examen) of 0 (de student is mislukt). U kunt deze stap gebruiken.
Uitsluitingsgegevens verwijderen. Als viervijfde van de studenten tussen de 3 en 10 uur voor het examen heeft gestudeerd, gooit bijvoorbeeld gegevens weg van studenten die helemaal niet hebben gestudeerd of die meer dan 20 uur hebben gestudeerd.
Tel uw cases om te verifiëren dat je genoeg hebt om een statistisch significante en voldoende krachtige correlatie te berekenen. Als je niet minstens 25 tot 70 gevallen hebt, is het niet de moeite waard om een correlatie te berekenen.
Laat twee verschillende mensen dezelfde gegevenstabel onafhankelijk maken en kijk of er verschillen zijn. Los eventuele discrepanties op voordat u verder gaat met de berekeningen.
Berekening
Bereken het gemiddelde van de waarden van Variabele X waar Y = 1. Dat wil zeggen, voor alle gevallen waarin Y = 1, tel de waarden van Variabele X, en deel door het aantal van die gevallen. In ons voorbeeld zijn dit de gemiddelde totaal bestudeerde uren voor studenten die geslaagd zijn voor het examen; laten we zeggen dat het 10. is.
Bereken het gemiddelde van de waarden van variabele X waar Y = 0. Dat is, voor alle gevallen waarin Y = 0, optellen van de waarden van variabele X, en deel door het aantal die gevallen. Hier is dit het gemiddelde totaal aantal uren dat is bestudeerd voor studenten die faalden; laten we zeggen dat het 3. is.
Trek het resultaat van stap 2 van stap 1 af. Hier, 10 - 3 = 7.
Vermenigvuldig het aantal gevallen dat je in stap 1 maal het aantal gevallen hebt gebruikt die je in stap 2 hebt gebruikt. Als 40 studenten geslaagd zijn voor het examen en 20 mislukt, is dit 40 x 20 = 800.
Vermenigvuldig het totale aantal cases met één minder dan dat aantal. Hier hebben 60 studenten in totaal het examen afgelegd, dus dit cijfer is 60 x 59 = 3.540.
Splits het resultaat van stap 4 en het resultaat van stap 5. Hier 800/3540 = 0.226.
Bereken de vierkantswortel van het resultaat van stap 6 met behulp van een rekenmachine of een computerwerkblad. Hier zou dat 0,475 zijn.
Vier elke waarde van variabele X en tel alle vierkanten op.
Vermenigvuldig het resultaat van stap 8 met het aantal van alle gevallen. Hier zou je het resultaat van stap 8 met 60 vermenigvuldigen.
Tel de som van variabele X op in alle gevallen. U zou dus alle totaal bestudeerde uren in de hele steekproef optellen.
Vier het resultaat van stap 10.
Trek het resultaat van stap 11 af van het resultaat van stap 9.
Verdeel het resultaat van stap 12 op het resultaat van stap 5.
Bereken de vierkantswortel van het resultaat van stap 13 met een rekenmachine of een computerpreadsheet.
Deel de resultaat van Stap 3 door het resultaat van Stap 14.
Vermenigvuldig het resultaat van Stap 15 met het resultaat van Stap 7. Dit is de waarde van de punt-biseriële correlatie.
Tip
Print al deze stappen uit. Noteer de waarde van elk resultaat dat u krijgt bij elke stap in het gedeelte "Berekenen" direct naast de stap.
Bereken dit een keer, neem dan een pauze en bereken opnieuw de correlatie. Als je een ernstig verschil hebt, is er ergens een fout gemaakt.
Zie Cohen's "Power Primer" voor informatie over statistisch significante en voldoende krachtige correlatie (zie referenties).
Waarschuwing
Je resultaat moet in het bereik van +1.0 tot -1.0 vallen. Waarden zoals +0,45 of -0,22 zijn prima. Waarden zoals 16.4 of -32.6 zijn wiskundig onmogelijk; als je zoiets krijgt, heb je ergens een fout gemaakt.
Volg stap 3 precies. Trek het resultaat van stap 1 niet af van het resultaat van stap 2.
Wetenschap © https://nl.scienceaq.com