science >> Wetenschap >  >> anders

Wiskundigen ontwikkelen nieuwe statistische indicator

Krediet:CC0 Publiek Domein

De meesten van ons kennen dit fenomeen maar al te goed:als het buiten warm is, je voelt de drang naar een verkoelend ijsje. Maar had je gedacht dat er wiskunde bij betrokken zou kunnen zijn?

Laten we het uitleggen:de stijgende temperaturen en het stijgende ijsverbruik zijn twee statistische variabelen in lineaire afhankelijkheid; ze zijn gecorreleerd.

In statistieken, correlaties zijn belangrijk voor het voorspellen van het toekomstige gedrag van variabelen. Dergelijke wetenschappelijke voorspellingen worden vaak gevraagd door de media, of het nu voor voetbal of verkiezingsresultaten is.

Om lineaire afhankelijkheid te meten, wetenschappers gebruiken de zogenaamde correlatiecoëfficiënt, die voor het eerst werd geïntroduceerd door de Britse natuurwetenschapper Sir Francis Galton (1822-1911) in de jaren 1870. Kort daarna, de wiskundige Karl Pearson gaf een formele wiskundige rechtvaardiging voor de correlatiecoëfficiënt. Daarom, wiskundigen spreken ook van de 'Pearson-product-momentcorrelatie' of de 'Pearson-correlatie'.

Indien, echter, de afhankelijkheid tussen de variabelen is niet-lineair, de correlatiecoëfficiënt is niet langer een geschikte maatstaf voor hun afhankelijkheid.

René Schilling, Hoogleraar Kansrekening aan de TU Dresden, benadrukt "Tot nu toe, het heeft veel rekenkracht gekost om afhankelijkheden tussen meer dan twee hoogdimensionale variabelen te detecteren, in het bijzonder als het om gecompliceerde niet-lineaire relaties gaat. We hebben nu een efficiënte en praktische oplossing voor dit probleem gevonden."

Dr. Björn Böttcher, Prof. Martin Keller-Ressel en Prof. René Schilling van het Instituut voor Wiskundige Stochastiek van de TU Dresden hebben een afhankelijkheidsmaat ontwikkeld die 'afstandsmultivariantie' wordt genoemd. De definitie van deze nieuwe maatstaf en de onderliggende wiskundige theorie zijn gepubliceerd in het toonaangevende internationale tijdschrift Annalen van de statistiek onder de titel "Distance Multivariantie:Nieuw"
Afhankelijkheidsmaten voor willekeurige vectoren."

Martin Keller-Ressel legt uit:"Om de afhankelijkheidsmaat te berekenen, niet alleen de waarden van de waargenomen variabelen zelf, maar ook hun onderlinge afstanden worden geregistreerd en van deze afstandsmatrices, de afstandsmultivariantie wordt berekend. Deze tussenstap zorgt voor de detectie van complexe afhankelijkheden, die de gebruikelijke correlatiecoëfficiënt gewoon zou negeren. Onze methode kan worden toegepast op vragen in de bioinformatica, waar big datasets geanalyseerd moeten worden."

In een vervolgonderzoek is er werd aangetoond dat de klassieke correlatiecoëfficiënt en andere bekende afhankelijkheidsmaten kunnen worden herwonnen als grensgevallen uit de afstandsmultivariantie.

Björn Böttcher sluit af met de opmerking:"We bieden alle noodzakelijke functies in het pakket 'multivariantie' voor de gratis statistieksoftware R, zodat alle belanghebbenden de toepassing van de nieuwe afhankelijkheidsmaatregel kunnen testen."