science >> Wetenschap >  >> Wiskunde

Hoe de correlatie tussen twee variabelen te berekenen

De correlatie tussen twee variabelen beschrijft de waarschijnlijkheid dat een verandering in een variabele een evenredige verandering in de andere variabele zal veroorzaken. Een hoge correlatie tussen twee variabelen suggereert dat ze een gemeenschappelijke oorzaak delen of dat een verandering in een van de variabelen rechtstreeks verantwoordelijk is voor een verandering in de andere variabele. De r-waarde van Pearson wordt gebruikt om de correlatie tussen twee afzonderlijke variabelen te kwantificeren.

Geef de variabele aan waarvan u denkt dat deze de wijziging in de andere variabele als x (de onafhankelijke variabele) en de andere variabele y (de afhankelijke variabele veroorzaakt ).

Construeer een tabel met vijf kolommen en zoveel rijen als er gegevenspunten zijn voor x en y. Label de kolommen A tot en met E van links naar rechts.

Vul elke rij in met de volgende waarden voor elk (x, y) gegevenspunt in de eerste kolom - de waarde van x in kolom A, de waarde van x in kolom B, de waarde van y in kolom C, de waarde van y in kolom D en de waarde x keer y in kolom E.

Maak een laatste rij helemaal onderaan de tabel en zet de som van alle waarden van elke kolom in de bijbehorende cel.

Bereken het product van de uiteindelijke cellen in kolom A en C.

Vermenigvuldig de laatste cel in kolom E met de aantal gegevenspunten.

Trek de in stap 5 verkregen waarde af van de waarde die is verkregen in stap 6 en onderstreep het antwoord.

Vermenigvuldig de laatste cel van kolom B met het aantal gegevenspunten. Trek van deze waarde het kwadraat van de waarde van de laatste cel van kolom A af.

Vermenigvuldig de laatste cel van kolom D met het aantal gegevenspunten en trek het kwadraat van de waarde van de laatste cel van kolom C af .

Vermenigvuldig de waarden in stap 8 en 9 samen en neem vervolgens de vierkantswortel van het resultaat.

Verdeel de waarde verkregen in stap 7 (moet onderstreept worden) met de verkregen waarde in stap 10. Dit is Pearson's r, ook bekend als de correlatiecoëfficiënt. Als r dichtbij 1 ligt, is er een sterke positieve correlatie. Als r dichtbij -1 is, is er een sterke negatieve correlatie. Als r dichtbij 0 ligt, is er een zwakke correlatie.