science >> Wetenschap >  >> anders

Hoe regressiecoëfficiënt te berekenen

Een van de meest basale hulpmiddelen voor engineering of wetenschappelijke analyse is lineaire regressie. Deze techniek begint met een gegevensset in twee variabelen. De onafhankelijke variabele wordt meestal "x" genoemd en de afhankelijke variabele wordt meestal "y" genoemd. Het doel van de techniek is om de lijn, y \u003d mx + b, te identificeren die de gegevensset benadert. Deze trendlijn kan, grafisch en numeriek, relaties tonen tussen de afhankelijke en onafhankelijke variabelen. Uit deze regressieanalyse wordt ook een correlatiewaarde berekend.

    Identificeer en scheid de x- en y-waarden van uw gegevenspunten. Als u een spreadsheet gebruikt, voert u deze in aangrenzende kolommen in. Er moet hetzelfde aantal x- en y-waarden zijn. Als dit niet het geval is, is de berekening onnauwkeurig of geeft de spreadsheetfunctie een foutmelding. x \u003d (6, 5, 11, 7, 5, 4, 4) y \u003d (2, 3, 9, 1, 8, 7, 5)

    Bereken de gemiddelde waarde voor de x-waarden en de y-waarden door de som van alle waarden te delen door het totale aantal waarden in de set. " en y_avg genoemd. "X_avg \u003d (6 + 5 + 11 + 7 + 5 + 4 + 4) /7 \u003d 6 y_avg \u003d (2 + 3 + 9 + 1 + 8 + 7 + 5) /7 \u003d 5

    Maak twee nieuwe gegevenssets door de x_avg-waarde af te trekken van elke x-waarde en de y_avg-waarde van elke y-waarde. X1 \u003d (6 - 6, 5 - 6, 11 - 6, 7 - 6 ...) x1 \u003d (0, -1, 5, 1, -1, -2, -2) y1 \u003d (2 - 5, 3 - 5, 9 - 5, 1 - 5, ... ) y1 \u003d (-3, -2, 4, -4, 3, 2, 0)

    Vermenigvuldig elke x1-waarde met elke y1-waarde, in volgorde. x1y1 \u003d (0 * -3, -1 * -2, 5 * 4, ...) x1y1 \u003d (0, 2, 20, -4, -3, -4, 0)

    Vierkant elke x1 waarde. X1 ^ 2 \u003d (0 ^ 2 , 1 ^ 2, -5 ^ 2, ...) x1 ^ 2 \u003d (0, 1, 25, 1, 1, 4, 4)

    Bereken de bedragen van de x1y1-waarden en x1 ^ 2 waarden sum_x1y1 \u003d 0 + 2 + 20 - 4 - 3 - 4 + 0 \u003d 11 sum_x1 ^ 2 \u003d 0 + 1+ 25 + 1 + 1 + 4 + 4 \u003d 36

    "sum_x1y1" delen door " sum_x1 ^ 2 "om de regressiecoëfficiënt te krijgen. sum_x1y1 /sum_x1 ^ 2 \u003d 11/36 \u003d 0.306


    Tips

  1. Voor degenen die liever direct werken met de eq uation, het is m \u003d sum [(x_i - x_avg) (y_i - y_avg)] /sum [(x_i - x_avg) ^ 2].

    Veel spreadsheets hebben verschillende lineaire regressiefuncties. In Microsoft Excel kunt u de "Helling" -functie gebruiken om het gemiddelde van de x- en y-kolommen te nemen, en de spreadsheet zal automatisch alle resterende berekeningen uitvoeren.