science >> Wetenschap >  >> Fysica

De breedte van een lade bepalen voor een Histogram

Als u met statistieken werkt, kunt u histogrammen gebruiken om een ​​visuele samenvatting van een verzameling getallen te geven. Een histogram lijkt een beetje op een staafdiagram dat een reeks verticale kolommen naast elkaar gebruikt om de distributie van gegevens te tonen. Als u een histogram wilt maken, sorteert u eerst uw gegevens in "bins" en telt u vervolgens het aantal gegevenspunten in elke bak. De hoogte van elke kolom in het histogram is dan evenredig met het aantal gegevenspunten in de bijbehorende prullenbak. Als u het juiste aantal bins kiest, krijgt u een optimaal histogram.

Bereken de waarde van de kubuswortel van het aantal gegevenspunten waaruit uw histogram bestaat. Als u bijvoorbeeld een histogram maakt van de hoogte van 200 personen, neemt u de kubuswortel van 200, oftewel 5.848. De meeste wetenschappelijke rekenmachines hebben een kubuswortelfunctie die u kunt gebruiken om deze berekening uit te voeren.

Neem de inverse van de waarde die u net hebt berekend. Om dit te doen, kunt u de waarde in 1 verdelen of de "1 /x" -toets op een wetenschappelijke rekenmachine gebruiken. De inverse van 5.848 is 1 /5.848 = 0.171.

Vermenigvuldig uw nieuwe waarde met de standaarddeviatie van uw gegevensset. De standaarddeviatie is een maat voor de hoeveelheid variatie in een reeks getallen. U kunt een rekenmachine met statistische functies gebruiken om dit aantal voor uw gegevens te berekenen of het handmatig te berekenen. Om dit te doen, bepaalt u het gemiddelde van uw datapunten; erachter te komen hoe ver elk gegevenspunt van het gemiddelde is; regel elk van deze verschillen en vervolgens gemiddeld; neem dan de vierkantswortel van dit nummer. Als de standaarddeviatie van uw hoogtegegevens bijvoorbeeld 2,8 inch was, zou u 2,8 x 0,171 = 0,479 berekenen.

Vermenigvuldig het nummer dat u zojuist hebt afgeleid met 3,49. De waarde 3,49 is een constante afgeleid van de statistische theorie, en het resultaat van deze berekening is de breedte van de bak die u moet gebruiken om een ​​histogram van uw gegevens te construeren. In het geval van het hoogte-voorbeeld zou je 3,49 x 0,479 = 1,7 inch berekenen. Dit betekent dat als uw laagste hoogte 5 voet was, uw eerste bak 5 voet tot 5 voet 1.7 duim zou overspannen. De hoogte van de kolom voor deze bak hangt af van hoeveel van uw 200 gemeten hoogten binnen dit bereik lagen. De volgende bin zou zijn van 5 feet 1,7 inch tot 5 feet 3,4 inches, enzovoort.

TL; DR (Too Long; Did not Read)

Sommige mensen nemen liever een veel meer informele benadering en kies eenvoudig willekeurige binbreedten die een geschikt gedefinieerd histogram produceren.