science >> Wetenschap >  >> Fysica

De bin-breedte voor een histogram

bepalen

Als u met statistieken werkt, kunt u histogrammen gebruiken om een visuele samenvatting van een verzameling getallen te geven. Een histogram lijkt op een staafdiagram dat een reeks verticale kolommen naast elkaar gebruikt om de verdeling van gegevens weer te geven. Om een histogram te maken, sorteert u eerst uw gegevens in "opslaglocaties" en telt u vervolgens het aantal gegevenspunten in elke opslaglocatie. De hoogte van elke kolom in het histogram is vervolgens evenredig met het aantal gegevenspunten in de prullenbak. Als u het juiste aantal bins kiest, krijgt u een optimaal histogram.

    Bereken de waarde van de kubuswortel van het aantal gegevenspunten waaruit uw histogram bestaat. Als u bijvoorbeeld een histogram maakt van de lengte van 200 personen, neemt u de kubuswortel van 200, wat 5.848 is. De meeste wetenschappelijke rekenmachines hebben een kubuswortelfunctie die u kunt gebruiken om deze berekening uit te voeren.

    Neem het omgekeerde van de waarde die u zojuist hebt berekend. Om dit te doen, kunt u de waarde in 1 verdelen of de "1 /x" -toets op een wetenschappelijke rekenmachine gebruiken. Het omgekeerde van 5.848 is 1 /5.848 \u003d 0.171.

    Vermenigvuldig uw nieuwe waarde met de standaardafwijking van uw gegevensset. De standaarddeviatie is een maat voor de hoeveelheid variatie in een reeks getallen. U kunt een rekenmachine met statistische functies gebruiken om dit aantal voor uw gegevens te berekenen of handmatig te berekenen. Om het laatste te doen, bepaalt u het gemiddelde van uw gegevenspunten; erachter te komen hoe ver elk gegevenspunt verwijderd is van het gemiddelde; vierkant elk van deze verschillen en neem ze dan gemiddeld; neem dan de vierkantswortel van dit nummer. Als de standaardafwijking van uw lengtegegevens bijvoorbeeld 2,8 inch was, zou u 2,8 x 0,171 \u003d 0,479 berekenen.

    Vermenigvuldig het getal dat u zojuist hebt afgeleid met 3,49. De waarde 3,49 is een constante afgeleid van de statistische theorie en het resultaat van deze berekening is de bin-breedte die u moet gebruiken om een histogram van uw gegevens te construeren. In het geval van het hoogtevoorbeeld zou u 3,49 x 0,479 \u003d 1,7 inch berekenen. Dit betekent dat als uw laagste hoogte 5 voet was, uw eerste afvalbak 5 voet tot 5 voet 1,7 inch zou zijn. De hoogte van de kolom voor deze bak hangt af van hoeveel van uw 200 gemeten hoogten binnen dit bereik lagen. De volgende prullenbak is van 5 voet 1,7 inch tot 5 voet 3,4 inch, enzovoort.


    Tips

  1. Sommige mensen nemen liever veel meer informele benadering en kies eenvoudig willekeurige bin-breedtes die een passend gedefinieerd histogram opleveren.