science >> Wetenschap >  >> Wiskunde

De relatie tussen standaardafwijkingen en percentielen

Veel universiteitsprogramma's vereisen statistieken. Een sleutelconcept dat wordt gepresenteerd in een typische statistiekklasse is de normale verdeling van gegevens of een belcurve. Inzicht in het interpreteren van een set gegevens die in een natuurlijke verdeling valt, maakt het begrijpen van wetenschappelijke studies mogelijk. Zorg voor een goed begrip van de belkromme, het gemiddelde, standaarddeviaties en hun relatie tot percentielen om vertrouwd te raken in de taal van wetenschappelijk onderzoek.

Normale verdeling en de belkromme

Bij veel typen van natuurlijk voorkomende gegevens zoals hoogte, intelligentiequotiënten en bloeddruk worden uitgezet op een histogram, waarbij de scores op de horizontale as liggen en de occurrences of het aantal scores op de verticale as liggen, vallen de gegevens in een klokvormig patroon genaamd een belcurve. Dit patroon, bekend als een normale verdeling, leent zich voor statistische analyse.

De gemiddelde en mediaan grafiek

Het gemiddelde gemiddelde van alle scores zal ongeveer in het midden van de belcurve vallen. Het gemiddelde staat voor het 50e percentiel, waarbij de helft van alle scores boven die maat ligt en de helft lager is. In normaal gedistribueerde gegevens valt de mediane score ook in het midden van de belcurve, wat de meeste occurrences vertegenwoordigt.

Standaarddeviaties en -variantie

Hoe ver weg van het gemiddelde is een maat? In normaal verdeelde datasets kan een maatregel worden omschreven als een bepaald aantal standaardafwijkingen van het gemiddelde. Een standaarddeviatie is een maat voor de variantie, of hoe verspreid of verspreid de gegevens van het gemiddelde zijn. Als maatregelen veel variantie hebben, wordt de belcurve verspreid; als ze weinig variantie hebben, is de belcurve smal. Hoe meer standaardafwijkingen de score is, hoe kleiner de kans dat de score in de natuur voorkomt.

Percentielen en de regel Empirale regel

Als je naar een belkromme kijkt, ligt 68% van de maatregelen binnen een standaardafwijking van het gemiddelde. 95% van de verdeling ligt binnen twee standaarddeviaties van het gemiddelde. Maar liefst 99,7% van de maatregelen valt binnen drie standaardafwijkingen ervan. Deze percentages, de empirische regel genoemd, vormen de basis voor statistische analyse van natuurlijk voorkomende verschijnselen. Als een medisch onderzoeker bijvoorbeeld vaststelt dat een groep die een bepaald medicijn heeft genomen om cholesterol te reguleren, nu metingen van cholesterol heeft, twee standaardafwijkingen van het gemiddelde, is het onwaarschijnlijk dat dit door toeval gebeurt.