science >> Wetenschap >  >> anders

Het interkwartielbereik berekenen

Het interkwartielbereik, vaak afgekort als de IQR, vertegenwoordigt het bereik van het 25e percentiel tot het 75e percentiel, of de middelste 50 procent, van een gegeven gegevensset. Het interkwartielbereik kan worden gebruikt om te bepalen wat het gemiddelde prestatiebereik van een test zou zijn: u kunt het gebruiken om te zien waar de scores van de meeste mensen op een bepaalde test vallen, of om te bepalen hoeveel geld de gemiddelde werknemer bij een bedrijf elke maand verdient. . Het interkwartielbereik kan een effectiever hulpmiddel voor gegevensanalyse zijn dan het gemiddelde of de mediaan van een gegevensset, omdat u hiermee het spreidingsbereik kunt identificeren in plaats van slechts een enkel nummer.

TL; DR (te lang) ; Niet gelezen)

Het interkwartielbereik (IQR) vertegenwoordigt de middelste 50 procent van een gegevensset. Om dit te berekenen, bestelt u eerst uw gegevenspunten van minste naar grootste, en bepaalt u vervolgens uw eerste en derde kwartielposities met behulp van respectievelijk de formules (N + 1) /4 en 3 * (N + 1) /4, waarbij N het nummer is "of points in the data set.", 3, [[Trek ten slotte het eerste kwartiel af van het derde kwartiel om het interkwartielbereik voor de gegevensset te bepalen.
Bestel datapunten

Berekening van het interkwartielbereik is een eenvoudige taak, maar voordat u berekent, moet u de verschillende punten van uw gegevensset. Om dit te doen, begint u met het bestellen van uw datapunten van de minste naar de grootste. Als uw gegevenspunten bijvoorbeeld 10, 19, 8, 4, 9, 12, 15, 11 en 20 waren, zou u ze als volgt herschikken: {4, 8, 9, 10, 11, 12, 15, 19, 20}. Nadat uw gegevenspunten op deze manier zijn geordend, kunt u doorgaan naar de volgende stap.
Bepaal positie van het eerste kwartiel

Bepaal vervolgens de positie van het eerste kwartiel met behulp van de volgende formule: (N + 1 ) /4, waarbij N het aantal punten in de gegevensset is. Als het eerste kwartiel tussen twee nummers valt, neem dan het gemiddelde van de twee nummers als je eerste kwartielscore. In het bovenstaande voorbeeld, omdat er negen gegevenspunten zijn, zou u 1 tot 9 toevoegen om 10 te krijgen en vervolgens delen door 4 om 2,5 te krijgen. Omdat het eerste kwartiel tussen de tweede en derde waarde valt, zou je het gemiddelde van 8 en 9 nemen om een eerste kwartielpositie van 8,5 te krijgen.
Bepaal de positie van het derde kwartiel

Zodra je je eerste hebt bepaald kwartiel, bepaal de positie van het derde kwartiel met behulp van de volgende formule: 3 * (N + 1) /4 waarbij N opnieuw het aantal punten in de gegevensset is. Evenzo, als het derde kwartiel tussen twee getallen valt, neem dan gewoon het gemiddelde zoals u zou doen bij het berekenen van de eerste kwartielscore. In het bovenstaande voorbeeld, omdat er negen gegevenspunten zijn, zou u 1 tot 9 toevoegen om 10 te krijgen, vermenigvuldigen met 3 om 30 te krijgen en vervolgens delen door 4 om 7,5 te krijgen. Omdat het eerste kwartiel tussen de zevende en achtste waarde valt, zou je het gemiddelde van 15 en 19 nemen om een derde kwartielscore van 17 te krijgen. Bereken interkwartielbereik

Zodra je je eerste en derde kwartielen, bereken het interkwartielbereik door de waarde van het eerste kwartiel af te trekken van de waarde van het derde kwartiel. Om het voorbeeld af te werken dat in de loop van dit artikel wordt gebruikt, zou je 8,5 van 17 aftrekken om te ontdekken dat het interkwartielbereik van de gegevensset gelijk is aan 8,5.
Voor- en nadelen van IQR

Het interkwartielbereik heeft een voordeel van het kunnen identificeren en elimineren van uitbijters aan beide uiteinden van een gegevensset. IQR is ook een goede maat voor variatie in gevallen van scheve gegevensdistributie, en deze methode voor het berekenen van IQR kan werken voor gegroepeerde gegevenssets, zolang u een cumulatieve frequentiedistributie gebruikt om uw gegevenspunten te organiseren. De interkwartielbereikformule voor gegroepeerde gegevens is hetzelfde als bij niet-gegroepeerde gegevens, waarbij IQR gelijk is aan de waarde van het eerste kwartiel afgetrokken van de waarde van het derde kwartiel. Het heeft echter verschillende nadelen ten opzichte van de standaarddeviatie: minder gevoeligheid voor enkele extreme scores en een bemonsteringsstabiliteit die niet zo sterk is als de standaarddeviatie.