science >> Wetenschap >  >> anders

Residu in Statistieken

Wanneer u modellen in statistieken bouwt, test u ze meestal en zorgt u ervoor dat de modellen overeenkomen met situaties uit de praktijk. De rest is een getal dat u helpt te bepalen hoe dicht uw theoretisch model is voor het fenomeen in de echte wereld. Residuen zijn niet zo moeilijk te begrijpen: het zijn maar cijfers die weergeven hoe ver een datapunt verwijderd is van wat het zou moeten zijn volgens het voorspelde model.
Mathematical Definition

Wiskundig gezien is een restant het verschil tussen een waargenomen datapunt en de verwachte of geschatte waarde voor dat datapunt had moeten zijn. De formule voor een residu is R = O - E, waarbij "O" de waargenomen waarde betekent en "E" de verwachte waarde betekent. Dit betekent dat positieve waarden van R waarden hoger weergeven dan verwacht, terwijl negatieve waarden waarden lager weergeven dan verwacht. U kunt bijvoorbeeld een statistisch model hebben dat zegt wanneer het gewicht van een man 140 pond is, zijn hoogte moet 6 voet of 72 inch zijn. Wanneer u uitgaat en gegevens verzamelt, vindt u mogelijk iemand die 140 kilo weegt maar wel 5 voet 9 inch of 69 inch is. Het restant is dan 69 inch minus 72 inch, waardoor je een waarde krijgt van min. 3 inches. Met andere woorden, het waargenomen gegevenspunt ligt 3 inch onder de verwachte waarde.
Modellen controleren

Residuen zijn met name handig als u wilt controleren of uw theoretisch model in de echte wereld werkt. Wanneer je een model maakt en de verwachte waarden berekent, ben je aan het theoretiseren. Maar wanneer u gegevens gaat verzamelen, kan het zijn dat de gegevens niet overeenkomen met het model. Een manier om deze mismatch tussen uw model en de echte wereld te vinden, is het berekenen van residuen. Als u bijvoorbeeld constateert dat uw residuen allemaal consistent ver van uw geschatte waarden liggen, heeft uw model mogelijk geen sterke onderliggende theorie. Een gemakkelijke manier om residuen op deze manier te gebruiken, is om ze te plotten.
Sciencing Video Vault
Maak de (bijna) perfecte haak: Hier is hoe
Maak de (bijna) perfecte haak: Hier is hoe te plotten Residuen

Wanneer u de residuen berekent, heeft u een handvol getallen, wat moeilijk voor mensen is om te interpreteren. Het plotten van de residuen kan je vaak patronen laten zien. Deze patronen kunnen ertoe leiden dat u vaststelt of het model goed past. Twee aspecten van residuen kunnen u helpen bij het analyseren van een plot van residuen. Ten eerste moeten resten voor een goed model aan beide zijden van nul worden verspreid. Dat wil zeggen, een plot van residuen zou ongeveer dezelfde hoeveelheid negatieve resten moeten hebben als positieve residuen. Ten tweede moeten resten willekeurig lijken. Als u een patroon in uw resterende plot ziet, zoals deze met een duidelijk lineair of gebogen patroon, kan uw oorspronkelijke model een fout bevatten.
Special Residuals: Uitbijters

Uitschieters of restwaarden van extreem grote waarden , lijken ongewoon ver weg van de andere punten op uw plot van residuen. Wanneer u een rest vindt die een uitbijter is in uw gegevensverzameling, moet u er goed over nadenken. Sommige wetenschappers raden aan uitscheiders te verwijderen, omdat het "anomalieën" of speciale gevallen zijn. Anderen bevelen verder onderzoek aan waarom u zo'n grote rest heeft. Je zou bijvoorbeeld een model kunnen maken van hoe stress schoolkwaliteiten beïnvloedt en theoretiseren dat meer stress meestal slechtere cijfers betekent. Als uit uw gegevens blijkt dat dit waar is, behalve voor één persoon, die erg weinig stress heeft en heel weinig punten, vraag je je misschien af ​​waarom. Zo iemand kan eenvoudigweg nergens om geven, inclusief school, en de grote resten uitleggen. In dit geval kunt u overwegen om het resterende deel van uw gegevensset weg te halen omdat u alleen leerlingen wilt modelleren die om school geven.