Wetenschap
De regressielijn met minste vierkanten (LSRL) is een regel die dient als voorspellingsfunctie voor een fenomeen dat niet algemeen bekend is. De wiskundige statistiekdefinitie van een kleinste kwadratenregressielijn is de lijn die het punt (0,0) passeert en een helling heeft die gelijk is aan de correlatiecoëfficiënt van de gegevens, nadat de gegevens gestandaardiseerd zijn. Dus, het berekenen van de kleinste kwadratenregressielijn omvat het standaardiseren van de gegevens en het vinden van de correlatiecoëfficiënt.
Zoek de correlatiecoëfficiënt
Schik uw gegevens zodat het gemakkelijk is om mee te werken. Gebruik een spreadsheet of matrix om uw gegevens te scheiden in de x-waarden en y-waarden, door ze gekoppeld te houden (dwz zorg ervoor dat de x-waarde en y-waarde van elk datapunt zich in dezelfde rij of kolom bevinden). > Zoek de kruisproducten van de x-waarden en y-waarden. Vermenigvuldig de x-waarde en de y-waarde voor elk punt samen. Som deze resulterende waarden bij elkaar op. Noem het resultaat "sxy."
Tel de x-waarden en y-waarden apart op. Noem deze twee resulterende waarden "sx" en "sy" respectievelijk.
Tel het aantal gegevenspunten. Noem deze waarde "n."
Neem de som van vierkanten voor uw gegevens. Vier alle waarden. Vermenigvuldig elke x-waarde en elke y-waarde afzonderlijk. Roep de nieuwe sets met gegevens "x2" en "y2" op voor de x-waarden en y-waarden. Tel alle x2-waarden bij elkaar en roep het resultaat "sx2" op. Tel alle y2-waarden bij elkaar en roep het resultaat "sy2."
Trek sx * sy /n van sxy af. Noem het resultaat "num."
Bereken de waarde sx2- (sx ^ 2) /n. Noem het resultaat "A."
Bereken de waarde sy2- (sy ^ 2) /n. Noem het resultaat "B."
Neem de vierkantswortel van A keer B, die kan worden weergegeven als (A * B) ^ (1/2). Label het resultaat "denom."
Bereken de correlatiecoëfficiënt, "r." De waarde van "r" staat voor "num" gedeeld door "denom," die kan worden geschreven als num /denom.
Standaardiseer de gegevens en schrijf de LSRL-indeling
Zoek naar de gemiddelden van de x-waarden en y-waarden. Voeg alle x-waarden samen toe en deel het resultaat met "n". Noem dit "mx." Doe hetzelfde voor de y-waarden, noem het resultaat "mijn".
Vind de standaardafwijkingen voor de x-waarden en y-waarden. Maak nieuwe sets met gegevens voor de x's en y's door het gemiddelde voor elke dataset af te trekken van de bijbehorende gegevens. Elk gegevenspunt voor x, "xdat" wordt bijvoorbeeld "xdat - mx". Vier de resulterende gegevenspunten. Voeg de resultaten voor elke groep (x en y) afzonderlijk toe en deel door "n" voor elke groep. Neem de vierkantswortel van deze twee eindresultaten om de standaardafwijking voor elke groep op te leveren. Noem de standaarddeviatie voor de x-waarden "sdx" en die voor de y-waarden "sdy."
Standaardiseer de gegevens. Trek het gemiddelde voor de x-waarden af van elke x-waarde. Deel de resultaten in met "sdx." De overige gegevens zijn gestandaardiseerd. Noem deze gegevens "x_". Doe hetzelfde voor de y-waarden: trek "mijn" af van elke y-waarde en deel door "sdy" terwijl u doorgaat. Noem deze gegevens "y_".
Schrijf de regressielijn. Schrijf "y_ ^ = rx_", waarbij "^" representatief is voor "hat" - een voorspelde waarde - en "r" gelijk is aan de eerder gevonden correlatiecoëfficiënt.
Wetenschap © https://nl.scienceaq.com