science >> Wetenschap >  >> anders

Het genie van Guinness en zijn statistische erfenis

Statistieken hebben Guinness te danken aan de Student's t-test. Krediet:Flickr/Scott Thompson, CC BY

Deze St. Patrick's Day, feestvierders over de hele wereld zullen de straten afdwalen op zoek naar een van de nationale drankjes van Ierland:een pint Guinness. Maar naast deze lekkere stout, een van de meest fundamentele en meest gebruikte wetenschappelijke instrumenten vindt ook zijn oorsprong in de Guinness-brouwerij.

Tegen het einde van de 19e eeuw, Guinness was zijn activiteiten aan het opschalen, en was geïnteresseerd in het toepassen van een wetenschappelijke benadering van alle aspecten van de Guinness-productie:van de groei van gerst tot de Guinness-smaak.

Alvorens tot een wetenschappelijke benadering over te gaan, brouwers van Guinness vertrouwden op subjectieve methoden, zoals het uiterlijk en de geur van hop, productkwaliteit te beoordelen.

Wetenschap in het brouwsel

Nadat wetenschappelijke brouwers waren aangeworven, er is gekozen voor een meer objectieve benadering. De eerste wetenschappelijke brouwer, Thomas Bennett-zaak, werd aangenomen in 1893 en hij geloofde dat de hoeveelheid zachte harsen in hop verband hield met de kwaliteit van Guinness. Daarom wilde hij graag een schatting maken van de hoeveelheid zachte hars in bepaalde hopgewassen.

De uitdaging voor Case was dat hij, zoals elke wetenschapper, kon niet alles tegelijk meten. Het was voor hem niet mogelijk om de hoeveelheid zachte hars te beoordelen in elk van de talloze hopbloemen (bij duizenden toegevoegd aan enorme vaten met binnenkort te verschijnen Guinness) die hij onder zijn hoede had.

In plaats daarvan, hij nam een ​​hopmonster (11 maten van elk 50 gram) en berekende het gemiddelde gehalte aan zachte hars. Hij hoopte dat het gemiddelde gehalte aan zachte hars van zijn kleine monster zou kunnen worden gebruikt om het gehalte aan zachte hars van de hele oogst (wat statistici "de populatie" zouden noemen) van hop te schatten.

Ter vergelijking, een collega deed nog eens 14 metingen van elk 50 gram uit dezelfde partij hop. Case vond een klein verschil in de gemiddelde hoeveelheid zachte harsen tussen deze monsters.

Hij was stomverbaasd. Waren deze verschillen in hopgehalte te wijten aan echte verschillen over de hele hopoogst, of waren ze te wijten aan willekeurige fouten die werden geïntroduceerd door kleine steekproefomvang te gebruiken?

Grootte doet er toe

Destijds, statistieken vertrouwden op wat de "grote steekproeftheorie" wordt genoemd, wat niet verwonderlijk is dat grote monsters (150 of meer) nodig zijn om te werken. Het was moeilijk om het toe te passen op problemen met kleine steekproeven (zoals die waarmee Case at Guinness te maken had).

Dit was het probleem dat William Sealy Gosset, recent afgestudeerd in scheikunde en wiskunde aan de Universiteit van Oxford, graag wilde aanpakken. Gosset begon in 1899 als leerling-brouwer in de Guinness-fabriek in Dublin.

1906, Gosset, nu een autodidactische statisticus, ging studeren bij Karl Pearson, een leidende figuur in de statistiek, aan het University College London.

Gosset wilde Pearsons methoden voor grote steekproeven graag aanpassen aan de kleine steekproeven die ze bij Guinness gebruikten. Daar, hij ontwikkelde zijn ideeën en maakte ze klaar voor publicatie.

Echter, tot het einde van de jaren dertig, Guinness zou niet toestaan ​​dat werknemers onder hun eigen naam publiceren uit angst dat andere brouwers zouden leren van hun wetenschappelijke benadering van bier. Als resultaat, Gosset publiceerde zijn belangrijkste paper, De waarschijnlijke fout van een gemiddelde, onder het pseudoniem "Student" in het tijdschrift Biometrika in 1908.

Dit was de oorsprong van Student's t-test, een fundamentele statistische methode die tot op de dag van vandaag veel wordt gebruikt.

Student's t-test

Het probleem waarmee Case werd geconfronteerd, was dat het gebruik van kleine hopmonsters een nieuwe bron van onzekerheid in de analyse introduceert, waardoor hij minder goed in staat is onderscheid te maken tussen echte, echte verschillen tussen twee partijen hop en verschillen als gevolg van deze onzekerheid.

Het geniale van Gosset was om een ​​manier te bedenken om dit te verklaren:de t-verdeling. Dit definieert wiskundig de relatie tussen de grootte van de steekproef en de hoeveelheid onzekerheid die dit met zich meebrengt.

In principe, bij het uitvoeren van experimenten, de t-verdeling (en de beroemde t-test die ervan afhangt) stelt zowel bierbrouwers als wetenschappers in staat om rekening te houden met de grootte van het monster dat ze in hun werk hebben gebruikt, en definieer vervolgens hoe zeker ze zijn in hun bevindingen.

Vasthouden aan de zaak van de brouwers, u zou informatie hebben van de twee monsters, zoals het gemiddelde zachte harsgehalte van de hop en de spreiding van elke meting rond het gemiddelde van elk monster.

Zonder al te veel in detail te treden, de t-test helpt om te bepalen of er bewijs is van een verschil tussen de twee gemiddelden op basis van de steekproefomvang (dat wil zeggen, het aantal metingen van een bepaald hopgewas). In het geval van de brouwers zochten ze naar nul verschil tussen hun twee monsters.

Een blijvende erfenis

De methode van Gosset trok niet de aandacht van de statistische gemeenschap tot een ander toonaangevend statistisch cijfer, Ronald Aylmer Visser, omarmde de methode enthousiast en leverde een wiskundig bewijs.

Sinds die tijd, de t-test is gebruikt om een ​​groot aantal wetenschappelijke problemen aan te pakken, van de beoordeling van de hersenfunctie bij patiënten met een beroerte, voor het meten van het koolstof- en stikstofgehalte in bacteriën die in de oceaan aan de kust leven, hoe het gedrag van mijnwerkers al dan niet tot ongelukken kan leiden (de consumptie van Guinness door deze mijnwerkers was, misschien niet verwonderlijk, niet de focus van de studie).

In feite, Student's t-test is gebruikt in vrijwel elk gebied van wetenschappelijke inspanningen:biologie, natuurkunde, psychologie, biometrie, economie en geneeskunde.

Het is een hoofdbestanddeel van niet-gegradueerde statistiek die in deze disciplines wordt onderwezen, maar weinigen zijn zich misschien bewust van de rol van Gosset bij het maken van de t-test en zijn bierige redenen om dit te doen.

Gosset bleef zijn hele leven bij Guinness als Head Experimental Brewer, toen hoofd van de afdeling Statistiek die hij in Guinness vormde, voor zijn promotie tot Head Brewer voor de nieuwe Guinness-brouwerij in Londen in 1935. Hij publiceerde verschillende kranten als "Student", maar zijn ware identiteit werd pas publiekelijk onthuld na zijn dood in 1937.

Dus, als je een Guinness drinkt deze St. Patrick's Day, het glas heffen op het weinig bekende personage dat een centrale rol speelde in bier, statistieken en inderdaad, moderne wetenschap:William Sealy Gosset.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.