science >> Wetenschap >  >> anders

Bias berekenen

Bias is de fout in schattingen als gevolg van systematische fouten die leiden tot consistent hoge of lage resultaten in vergelijking met de werkelijke waarden. De individuele afwijking van een schatting waarvan bekend is dat deze vooringenomen is, is het verschil tussen de geschatte en de werkelijke waarden. Als het niet bekend is dat de schatting bevooroordeeld is, kan het verschil ook te wijten zijn aan willekeurige fouten of andere onnauwkeurigheden. In tegenstelling tot vooringenomenheid, die altijd in één richting werkt, kunnen deze fouten positief of negatief zijn.

Voor het berekenen van de bias van een methode die voor veel schattingen wordt gebruikt, zoekt u de fouten door elke schatting van de werkelijke of waargenomen waarde af te trekken. . Tel alle fouten bij elkaar op en deel deze door het aantal schattingen om de bias te krijgen. Als de fouten optellen tot nul, waren de schattingen onbevooroordeeld en levert de methode onbevooroordeelde resultaten op. Als de schattingen vertekend zijn, kan het mogelijk zijn de bron van de bias te vinden en deze te elimineren om de methode te verbeteren.

TL; DR (te lang; niet gelezen)

Bereken bias door het verschil te vinden tussen een schatting en de werkelijke waarde. Om de bias van een methode te vinden, voert u vele schattingen uit en telt u de fouten in elke schatting op in vergelijking met de reële waarde. Het delen door het aantal schattingen geeft de bias van de methode. In statistieken kunnen er veel schattingen zijn om een ​​enkele waarde te vinden. Bias is het verschil tussen het gemiddelde van deze schattingen en de werkelijke waarde.

Hoe Bias werkt

Als schattingen vooringenomen zijn, zijn ze consistent verkeerd in één richting als gevolg van fouten in het systeem dat wordt gebruikt voor de schat. Een weersvoorspelling kan bijvoorbeeld consequent temperaturen voorspellen die hoger zijn dan de werkelijk waargenomen waarden. De voorspelling is bevooroordeeld, en ergens in het systeem is er een fout die een te hoge schatting geeft. Als de voorspellingsmethode onbevooroordeeld is, kan deze nog steeds temperaturen voorspellen die niet correct zijn, maar de onjuiste temperaturen zijn soms hoger en soms lager dan de waargenomen temperaturen.

Statistische bias werkt op dezelfde manier maar is meestal gebaseerd op een groot aantal schattingen, enquêtes of voorspellingen. Deze resultaten kunnen grafisch worden weergegeven in een verdelingscurve en de afwijking is het verschil tussen het gemiddelde van de verdeling en de werkelijke waarde. Als er sprake is van vertekening, zal er altijd een verschil zijn, hoewel sommige individuele schattingen aan weerszijden van de werkelijke waarde kunnen vallen.

Bias in enquêtes

Een voorbeeld van bias is een enquêtebureau dat wordt uitgevoerd peilingen tijdens verkiezingscampagnes, maar hun stemresultaten overschatten consequent de resultaten voor één politieke partij in vergelijking met de daadwerkelijke verkiezingsresultaten. De bias kan voor elke verkiezing worden berekend door het feitelijke resultaat van de poll-voorspelling af te trekken. De gemiddelde bias van de gebruikte pollingmethode kan worden berekend door het gemiddelde van de individuele fouten te vinden. Als de bias groot en consistent is, kan het enquêteproduct proberen uit te zoeken waarom hun methode vooringenomen is.

Bias kan uit twee hoofdbronnen komen. Of de selectie van deelnemers voor de peiling is vertekend of de vertekening komt voort uit de interpretatie van de informatie die van de deelnemers is ontvangen. Internet polls zijn bijvoorbeeld inherent beïnvloed omdat de deelnemers aan de enquête die de internetformulieren invullen niet representatief zijn voor de hele populatie. Dit is een selectiebias.

Pollingbedrijven zijn zich bewust van deze selectiebias en compenseren door de aantallen aan te passen. Als de resultaten nog steeds vertekend zijn, is dit een vooroordeel voor de informatie omdat de bedrijven de informatie niet correct interpreteerden. In al deze gevallen toont een biasberekening in welke mate de geschatte waarden nuttig zijn en wanneer de methoden moeten worden aangepast.