science >> Wetenschap >  >> Wiskunde

Hoe Regressiecoëfficiënt

berekenen

Een van de meest basale hulpmiddelen voor engineering of wetenschappelijke analyse is lineaire regressie. Deze techniek begint met een gegevensverzameling in twee variabelen. De onafhankelijke variabele wordt gewoonlijk "x" genoemd en de afhankelijke variabele wordt gewoonlijk "y" genoemd. Het doel van de techniek is om de lijn te identificeren, y = mx + b, die de gegevensreeks benadert. Deze trendlijn kan grafisch en numeriek de relaties tussen de afhankelijke en onafhankelijke variabelen weergeven. Uit deze regressieanalyse wordt ook een waarde voor correlatie berekend.

Identificeer en scheid de x- en y-waarden van uw datapunten. Als u een spreadsheet gebruikt, voert u deze in de aangrenzende kolommen in. Er moet hetzelfde aantal x- en y-waarden zijn. Als dit niet het geval is, is de berekening onnauwkeurig of retourneert de spreadsheetfunctie een fout. x = (6, 5, 11, 7, 5, 4, 4) y = (2, 3, 9, 1, 8, 7, 5)

Bereken de gemiddelde waarde voor de x-waarden en de y-waarden door de som van alle waarden te delen door het totale aantal waarden in de set. Deze gemiddelden worden "x_avg" en y_avg. "X_avg = (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 = 6 y_avg = (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 = 5

Maak twee nieuwe gegevenssets door de x_avg-waarde af te trekken van elke x-waarde en de y_avg-waarde van elke y-waarde. X1 = (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 = (0, -1, 5, 1, -1, -2, -2) y1 = (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 = (-3, -2, 4, -4, 3, 2, 0)

Vermenigvuldig elke x1-waarde met elke y1-waarde, in volgorde. x1y1 = (0 * -3, -1 * -2, 5 * 4, ...) x1y1 = (0, 2, 20, -4, -3, -4, 0)

Vier elke x1-waarde. X1 ^ 2 = (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 = (0, 1, 25, 1, 1, 4, 4)

Bereken de sommen van de x1y1-waarden en x1 ^ 2 waarden. sum_x1y1 = 0 + 2 + 20 - 4 - 3 - 4 + 0 = 11 sum_x1 ^ 2 = 0 + 1+ 25 + 1 + 1 + 4 + 4 = 36

Splits "sum_x1y1" door " sum_x1 ^ 2 "om de regressiecoëfficiënt te krijgen sum_x1y1 /sum_x1 ^ 2 = 11/36 = 0.306

TL; DR (te lang; niet gelezen)

Voor degenen die de voorkeur geven aan werk direct met de vergelijking, i t is m = som [(x_i - x_avg) (y_i - y_avg)] /sum [(x_i - x_avg) ^ 2].

Veel spreadsheets hebben verschillende lineaire regressiefuncties. In Microsoft Excel kunt u de functie "Helling" gebruiken om het gemiddelde van de x- en y-kolommen te nemen en voert het werkblad automatisch alle resterende berekeningen uit.