science >> Wetenschap >  >> anders

Hoe vindt u de correlatiecoëfficiënt voor R in een spreidingsdiagram

Het vinden van de sterkte van de associatie tussen twee variabelen is een belangrijke vaardigheid voor alle soorten wetenschappers. Als twee variabelen met elkaar zijn gecorreleerd, geeft dit aan dat er een verband tussen is. Een positieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere dat ook doet, en een negatieve correlatie betekent dat wanneer de ene variabele toeneemt, de andere afneemt. Correlaties bewijzen geen oorzakelijk verband, hoewel het mogelijk is dat verdere tests een oorzakelijk verband tussen de variabelen zullen aantonen. De correlatiecoëfficiënt R toont de sterkte van de relatie tussen de twee variabelen, en of het een positieve of een negatieve correlatie is.

TL; DR (te lang; niet gelezen)

Oproep een variabele x en een variabele y. Bereken de waarde van R met behulp van de formule:

R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[n Σx 2− (Σx) 2] [ , 3, [[n Σy 2− (Σy) 2]}

Waar n de steekproefgrootte is.

  1. Maak een tabel met uw gegevens

    Maak een tabel met uw gegevens. Dit moet één kolom bevatten voor het deelnemersnummer, één kolom voor de eerste variabele (aangeduid met x) en één kolom voor de tweede variabele (aangeduid met y). Als u bijvoorbeeld wilt kijken of er een verband is tussen lengte en schoenmaat, identificeert één kolom elke persoon die u meet, één kolom toont de lengte van elke persoon en een andere toont hun schoenmaat. Maak drie extra kolommen, een voor xy, een voor x 2 en een voor y 2.

  2. Bereken de waarden voor de lege kolommen

    Gebruik uw gegevens om de drie extra kolommen in te vullen. Stel je bijvoorbeeld voor dat je eerste persoon 75 centimeter lang is en maat 12 voet heeft. De kolom x (hoogte) zou 75 weergeven en de kolom y (schoenmaat) 12. U moet xy, x 2 en y 2 vinden. Dus met dit voorbeeld:

    xy \u003d 75 × 12 \u003d 900

    x 2 \u003d 75 2 \u003d 5.625

    y 2 \u003d 12 2 \u003d 144

    Voer deze berekeningen uit voor elke persoon voor wie u gegevens hebt.

  3. Zoek de som van elke kolom

    Maak een nieuwe rij op de onderkant van uw tabel voor de bedragen van elke kolom. Tel alle x-waarden, alle y-waarden, alle xy-waarden, alle x 2-waarden en alle y 2-waarden bij elkaar op en plaats de resultaten onderaan de overeenkomstige kolom in uw nieuwe rij. U kunt uw nieuwe rij 'som' noemen of een sigma (Σ) symbool gebruiken.

  4. Bereken R met de formule

    U vindt R uit uw gegevens met de formule:

    R \u003d [n (Σxy) - (Σx) (Σy)] ÷ √ {[nΣx 2− (Σx) 2] [nΣy 2− (Σy) 2]}

    Dit ziet er een beetje ontmoedigend uit, dus je kunt het in twee delen splitsen, die we s en t zullen noemen.

    s \u003d n (Σxy) - (Σx) ( Σy)

    t \u003d √ {[n Σx 2− (Σx) 2] [n Σy 2− (Σy) 2]}

    In deze vergelijkingen is n het aantal deelnemers dat u heeft (uw steekproefomvang). De rest van de delen van de vergelijking zijn de bedragen die u in de laatste stap hebt berekend. Dus voor s vermenigvuldigt u de grootte van uw steekproef met de som van de xy-kolom en trekt u hier de som van de x-kolom vermenigvuldigd met de som van de y-kolom af.

    Voor t zijn er vier hoofdstappen. Bereken eerst n vermenigvuldigd met de som van uw x 2-kolom en trek vervolgens de som van uw x-kolom in het kwadraat (vermenigvuldigd met zichzelf) af van deze waarde. Ten tweede, doe precies hetzelfde, maar met de som van de kolom y 2 en de som van de kolom y in plaats van de x-delen (bijv. N × iey 2 - [Σy × Σy]) . Ten derde, vermenigvuldig deze twee resultaten (voor de xs en ys) samen. Ten vierde, neem de vierkantswortel van dit antwoord.

    Als je in delen hebt gewerkt, kun je R eenvoudig berekenen als R \u003d s ÷ t. U krijgt een antwoord tussen −1 en 1. Een positief antwoord vertoont een positieve correlatie, waarbij iets meer dan 0,7 over het algemeen als een sterke relatie wordt beschouwd. Een negatief antwoord vertoont een negatieve correlatie, waarbij alles boven -0.7 als een sterke negatieve relatie wordt beschouwd. Evenzo wordt ± 0,5 als een gematigde relatie beschouwd en wordt ± 0,3 als een zwakke relatie beschouwd. Alles in de buurt van 0 vertoont een gebrek aan correlatie.