science >> Wetenschap >  >> Fysica

Hoe MSE

te berekenen

Wanneer wetenschappers, economen of statistici voorspellingen doen op basis van theorie en dan echte gegevens verzamelen, hebben ze een manier nodig om de variatie tussen voorspelde en gemeten waarden te meten. Ze vertrouwen meestal op de gemiddelde vierkante fout (MSE), die de som is van de variaties van de afzonderlijke gegevenspunten in het kwadraat en gedeeld door het aantal gegevenspunten minus 2. Wanneer de gegevens in een grafiek worden weergegeven, bepaalt u de MSE op optellen van de variaties in de gegevenspunten van de verticale as. Op een x-y-grafiek zouden dat de y-waarden zijn.

Waarom de variaties verdelen?

Het vermenigvuldigen van de variatie tussen voorspelde en waargenomen waarden heeft twee wenselijke effecten. De eerste is om ervoor te zorgen dat alle waarden positief zijn. Als een of meer waarden negatief waren, zou de som van alle waarden onrealistisch klein kunnen zijn en een slechte weergave van de werkelijke variatie tussen voorspelde en waargenomen waarden. Het tweede voordeel van kwadreren is om meer gewicht toe te kennen aan grotere verschillen, wat ervoor zorgt dat een grote waarde voor MSE grote gegevensvariaties betekent.

Voorbeeldberekeningsvoorraadalgoritme

Stel dat u een algoritme hebt dat voorspelt de prijzen van een bepaalde voorraad op een dagelijkse basis. Op maandag voorspelt het dat de aandelenkoers $ 5,50 is, op dinsdag $ 6,00, woensdag $ 6,00, donderdag $ 7,50 en vrijdag $ 8,00. Als u maandag als dag 1 beschouwt, hebt u een set gegevenspunten die als volgt wordt weergegeven: (1, 5.50), (2, 6.00), (3, 6.00), (4, 7.50) en (5, 8.00). De werkelijke prijzen zijn als volgt: maandag $ 4,75 (1, 4,75); Dinsdag $ 5,35 (2, 5,35); Woensdag $ 6.25 (3, 6.25); Donderdag $ 7,25 (4, 7,25); en vrijdag: $ 8,50 (5, 8,50).

De variaties tussen de y-waarden van deze punten zijn respectievelijk 0,75, 0,65, -0,25, 0,25 en -0,50, waarbij het negatieve teken een voorspelde waarde aangeeft die kleiner is dan de waargenomen. Als u MSE wilt berekenen, moet u eerst elke variatiewaarde verdelen, waardoor de mintekens worden geëlimineerd en 0,55625, 0,4225, 0,0625, 0,0625 en 0,25 worden weergegeven. Het optellen van deze waarden geeft 1,36 en gedeeld door het aantal metingen minus 2, dat is 3, levert de MSE op, die 0,45 blijkt te zijn.

MSE en RMSE

Kleinere waarden voor MSE geven aan nauwere overeenkomst tussen voorspelde en waargenomen resultaten, en een MSE van 0,0 geeft een perfecte overeenkomst aan. Het is echter belangrijk om te onthouden dat de variatiewaarden in het kwadraat zijn. Wanneer een foutmeting vereist is die in dezelfde eenheden is als de gegevenspunten, nemen statistici de root mean square error (RMSE). Ze verkrijgen dit door de vierkantswortel van de gemiddelde vierkante fout te nemen. Voor het bovenstaande voorbeeld zou de RSME 0.671 of ongeveer 67 cent zijn.