Science >> Wetenschap & Ontdekkingen >  >> Wiskunde

Berekening van de som van residuen in regressieanalyse

Door Ariel Balter, Ph.D. Bijgewerkt op 30 augustus 2022

DragonImages/iStock/Getty Images

Residuen

Bij regressieanalyse wijzen we de ene variabele aan als de verklarende variabele (x) en de andere als de responsvariabele (y). Het regressiemodel produceert een functie y =f(x) die y het beste voorspelt op basis van x. Voor elke waarneming i is het residu het verschil tussen de waargenomen respons y[i] en de voorspelde waarde f(x[i]):

Residu =y[i] – f(x[i])

Voorbeeld

Beschouw vijf individuen met de volgende paren van lengte (cm) en gewicht (kg):(152, 54), (165, 65), (175, 100), (170, 80) en (140, 45). Een kwadratische aanpassing voor gewicht als functie van de lengte levert de vergelijking op:

w =f(h) =1160 – 15,5 uur + 0,054 uur²

Met dit model zijn de residuen (in kilogram) [2,38, 7,65, 1,25, 5,60, 3,40]. De som van de reststoffen bedraagt 15,5 kg.

Lineaire regressie

Het eenvoudigste regressiemodel is lineair, weergegeven door y =m x + b. Door de constructie is de som van de residuen voor een lineaire regressie nul, omdat de lijn is aangepast om de totale verticale afwijking te minimaliseren.