science >> Wetenschap >  >> Wiskunde

Hoe de correlatiecoëfficiënt voor R in een spreidingsplot te vinden

Het vinden van de sterkte van de associatie tussen twee variabelen is een belangrijke vaardigheid voor alle soorten wetenschappers. Als twee variabelen met elkaar gecorreleerd zijn, laat dit zien dat er een verband tussen bestaat. Een positieve correlatie betekent dat wanneer een variabele toeneemt, de andere ook doet, en een negatieve correlatie betekent dat wanneer een variabele toeneemt, de andere afneemt. Correlaties bewijzen geen oorzaak, hoewel het mogelijk is dat verdere tests een causaal verband tussen de variabelen aantonen. De correlatiecoëfficiënt R toont de sterkte van de relatie tussen de twee variabelen en of deze een positieve of een negatieve correlatie is.

TL; DR (te lang; niet gelezen)

Oproep één variabele x en één variabele y. Bereken de waarde van R met behulp van de formule:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2- (Σx) 2] [ ,null,null,3],n Σy 2- (Σy) 2]}

Waarbij n jouw steekproefomvang is.

Maak een tabel met je gegevens -

Maak een tafel van uw gegevens. Dit moet een kolom bevatten voor het deelnemernummer, een kolom voor de eerste variabele (gelabeld x) en een kolom voor de tweede variabele (aangeduid met y). Als u bijvoorbeeld wilt zien of er een verband is tussen de hoogte en de schoenmaat, identificeert een kolom elke persoon die u meet, één kolom geeft de hoogte van elke persoon weer en een andere kolom geeft de schoenmaat aan. Maak drie extra kolommen, één voor xy, één voor x 2 en één voor y 2.

Bereken de waarden voor de lege kolommen

Gebruik uw gegevens om in te vullen de drie extra kolommen. Stel je bijvoorbeeld voor dat je eerste persoon 75 centimeter lang is en een afmeting van 12 voet heeft. De kolom x (hoogte) zou 75 tonen en de kolom y (schoenmaat) zou 12 tonen. U moet xy, x 2 en y 2 vinden. Dus met dit voorbeeld:

xy = 75 × 12 = 900

x 2 = 75 2 = 5.625

y 2 = 12 2 = 144

Voer deze berekeningen uit voor iedereen voor wie u gegevens gebruikt.

Zoek de som van elke kolom

Maak een nieuwe rij onderaan op uw tabel voor de sommen van elke kolom. Tel bij alle x-waarden, alle y-waarden, alle xy-waarden, alle x 2-waarden en alle y 2-waarden bij elkaar en zet de resultaten onderaan op de overeenkomstige kolom in uw nieuwe rij. U kunt uw nieuwe rij "sum" labelen of een sigma (Σ) -symbool gebruiken.

Bereken R met de formule

U vindt R uit uw gegevens met behulp van de formule:

R = [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2- (Σx) 2] [nΣy 2- (Σy) 2]}

Dit ziet er een beetje angstaanjagend uit, dus je kunt het opsplitsen in twee delen, die we s en t noemen.

s = n (Σxy) - (Σx) (Σy)

t = √ {[n Σx 2- (Σx) 2] [n Σy 2- (Σy) 2]}

In deze vergelijkingen, n is het aantal deelnemers dat je hebt (je steekproefomvang). De rest van de delen van de vergelijking zijn de sommen die u in de laatste stap hebt berekend. Dus voor s, vermenigvuldig de grootte van uw steekproef met de som van de xy-kolom en trek vervolgens de som van de x-kolom vermenigvuldigd met de som van de y-kolom hieruit af.

Voor t zijn er vier hoofdstappen. Bereken eerst n vermenigvuldigd met de som van uw x 2 kolom en trek vervolgens de som van uw x kolomvierkant (vermenigvuldigd met zichzelf) van deze waarde af. Ten tweede, doe precies hetzelfde maar met de som van de y 2 kolom en de som van de y-kolom in plaats van de x-delen (dwz, n × Σy 2 - [Σy × Σy]) . Ten derde, vermenigvuldig deze twee resultaten (voor de xs en ys) samen. Ten vierde, neem de wortel van dit antwoord.

Als je in delen hebt gewerkt, kun je R berekenen als eenvoudigweg R = s ÷ t. U krijgt een antwoord tussen -1 en 1. Een positief antwoord laat een positieve correlatie zien, waarbij iets meer dan 0.7 in het algemeen als een sterke relatie wordt beschouwd. Een negatief antwoord toont een negatieve correlatie, waarbij alles dat groter is dan -0,7 een sterke negatieve relatie beschouwt. Evenzo wordt ± 0,5 als een matige relatie beschouwd en wordt ± 0,3 als een zwakke relatie beschouwd. Alles in de buurt van 0 toont een gebrek aan correlatie.