science >> Wetenschap >  >> Wiskunde

Hoe de som van residuen te vinden

Wanneer een set gegevens twee variabelen bevat die betrekking kunnen hebben, zoals de hoogte en het gewicht van individuen, vindt regressieanalyse een wiskundige functie die de relatie het beste benadert. De som van de restwaarden is een maatstaf voor hoe goed een functie de functie doet.

Residuen

In regressieanalyse kiezen we een variabele als de "verklarende variabele", die we x noemen en de andere als de "antwoordvariabele" die we y zullen noemen. Regressieanalyse creëert de functie y = f (x) die de responsvariabele van de bijbehorende verklarende variabele het best voorspelt. Als x [i] een van de verklarende variabelen is en y [i] de responsvariabele ervan, dan is de rest de fout of het verschil tussen de werkelijke waarde van y [i] en de voorspelde waarde van y [i]. Met andere woorden, residueel = y [i] - f (x [i]).

Voorbeeld

Een set gegevens bevat de hoogten in centimeters en gewichten in kilogram van 5 personen: [ ,null,null,3],(152,54), (165,65), (175,100), (170,80), (140, 45)]. Een kwadratische fit van het gewicht, w, voor de hoogte, h, is w = f (h) = 1160 -15.5_h + 0.054_h ^ 2. De residuen zijn (in kg): [2.38, 7.65, 1.25, 5.60, 3.40]. De som van de resten is 15,5 kg.

Lineaire regressie

De eenvoudigste regressie is lineaire regressie, waarbij de wiskundige functie een rechte lijn is van de vorm y = m * x + b . In dit geval is de som van de residuen per definitie 0