science >> Wetenschap >  >> Wiskunde

Hoe SSE te berekenen

Wanneer u een rechte lijn op een gegevensset aanbrengt, is het wellicht interessant om te bepalen hoe goed de resulterende lijn past bij de gegevens. Een manier om dit te doen is om de som van de kwadratenfout (SSE) te berekenen. Deze waarde geeft een indicatie van hoe goed de best passende lijn de gegevensset benadert. De SSE is belangrijk voor de analyse van experimentele gegevens en wordt slechts in enkele korte stappen bepaald.

Zoek een lijn met de beste fit om de gegevens te modelleren met behulp van regressie. De beste lijn heeft de vorm y = ax + b, waarbij a en b parameters zijn die u moet bepalen. U kunt deze parameters vinden met behulp van een eenvoudige lineaire regressieanalyse. Neem bijvoorbeeld aan dat de lijn met de beste passing de vorm y = 0.8x + 7 heeft.

Gebruik de vergelijking om de waarde van elke y-waarde te bepalen die wordt voorspeld door de lijn met de beste passing. U kunt dit doen door elke x-waarde in de vergelijking van de regel te plaatsen. Als x bijvoorbeeld gelijk is aan 1, geeft het vervangen van die in de vergelijking y = 0.8x + 7 7.8 voor de y-waarde.

Bepaal het gemiddelde van de voorspelde waarden in de lijn van de best-fit-vergelijking. U kunt dit doen door alle y-waarden op te tellen die zijn voorspeld uit de vergelijkingen en het resulterende getal te delen door het aantal waarden. Als de waarden bijvoorbeeld 7,8, 8,6 en 9,4 zijn, geeft het optellen van deze waarden 25,8, en het delen van dit getal met het aantal waarden, 3 geeft in dit geval 8.6.

Trek elk van de afzonderlijke waarden af ​​van het gemiddelde en regel het resulterende getal. In ons voorbeeld, als we de waarde 7.8 aftrekken van het gemiddelde 8.6, is het resulterende getal 0.8. Squaring van deze waarde levert 0,64 op.

Tel alle vierkante waarden uit stap 4 op. Als u de instructies in stap 4 toepast op alle drie de waarden in ons voorbeeld, vindt u waarden van 0,64, 0 en 0,64. Het optellen van deze waarden geeft 1,28. Dit is de som van vierkantenfouten.

Waarschuwing

De getallen uit de gegevens worden alleen gebruikt om de vergelijking voor de best passende lijn te bepalen. Gebruik waarden uit de beste lijn voor het berekenen van de som van vierkantenfouten.