science >> Wetenschap >  >> anders

Statistische methode maakt de detectie van afhankelijkheden van hogere orde mogelijk

Volledige afhankelijkheidsstructuur. Krediet:Björn Böttcher

In december, de wetenschappelijke uitgeverij De Gruyter lanceerde zijn nieuwe tijdschrift Statistieken openen met een openingsartikel van de wiskundige Dr. Björn Böttcher van de TU Dresden. Het artikel presenteert de uitbreiding van de statistische maatstaf voor multivariantie op afstand, ontwikkeld door Böttcher en zijn collega's van de TU Dresden.

Afstandsmultivariantie is een multivariate afhankelijkheidsmaat die afhankelijkheden kan detecteren tussen een willekeurig aantal willekeurige vectoren die elk een verschillende dimensie kunnen hebben. In zijn nieuwe artikel Böttcher presenteert het concept nu als een verenigende theorie die verschillende klassieke afhankelijkheidsmaten combineert. Verbindingen tussen twee of meer hoogdimensionale variabelen kunnen worden vastgelegd en zelfs gecompliceerde niet-lineaire afhankelijkheden en afhankelijkheden van hogere orde kunnen worden gedetecteerd. Voor tal van wetenschappelijke disciplines, deze methode opent nieuwe benaderingen om afhankelijkheden te detecteren en te evalueren.

Kan het aantal gemiste schooldagen worden gekoppeld aan de leeftijd, geslacht of afkomst van scholieren? In een enquête onder 146 scholieren, sociale wetenschappers analyseerden verschillende beïnvloedende variabelen op gemiste schooldagen en onderzochten deze op afhankelijkheden om een ​​voorspellingsmodel af te leiden. Deze klassieke vraag is al uitgebreid besproken en geanalyseerd met verschillende statistische benaderingen.

De statistische maat voor multivariantie op afstand biedt een nieuwe benadering van deze vraag:Dr. Björn Böttcher van het Institute of Mathematical Stochastics was in staat om multivariantie op afstand te gebruiken om de culturele achtergrond en een hogere orde-afhankelijkheid te bepalen, waaronder leeftijd en geslacht als beïnvloedende factoren voor de gemiste schooldagen. Zo kon hij een minimaal model voorstellen. "Dit is een elementair voorbeeld voor een toepassing van de ontwikkelde methode. Ik kan niet beoordelen of dit ook een onderbouwde bevinding is met betrekking tot de onderzochte vraag. Het werken met echte data en vooral de vakspecifieke interpretatie van de resultaten vereist altijd expertise in de respectief onderwerp, " Dr. Böttcher zegt, en geeft tal van andere illustratieve voorbeelden van de toepassing van zijn methode:"In the paper, Ik verwijs naar meer dan 350 vrij beschikbare datasets uit alle wetenschappelijke disciplines waarin statistisch significante hogere-orde afhankelijkheden voorkomen. Opnieuw, of deze afhankelijkheden zinvol zijn in termen van de onderliggende onderzoeken, vereist verder onderzoek en de expertise op de respectieve gebieden, " en hij voegt eraan toe, "natuurlijk, verzoeken om samenwerking zijn altijd welkom."

Statistische analyse houdt meestal rekening met afhankelijkheden tussen individuele variabelen. Vooral met veel variabelen, het is wenselijk om onafhankelijke variabelen te verwijderen voordat specifieke soorten afhankelijkheid worden bestudeerd. Dr. Björn Böttcher presenteert een methode voor dit doel genaamd "dependence structure detection, " die ook kan worden gebruikt om afhankelijkheden van hogere orde te detecteren. Variabelen worden "afhankelijk van hogere orde" genoemd als ze paarsgewijs onafhankelijk zijn, maar meer dan twee variabelen beïnvloeden elkaar nog steeds gezamenlijk. Dit soort afhankelijkheden hebben tot nu toe niet in de focus van toepassingen gestaan.

Sommige wetenschappers vermoeden dat er vooral in de genetica afhankelijkheden van hogere orde voorkomen:het basisidee hier is dat meerdere genen samen een eigenschap bepalen, maar deze genen vertonen noch individueel enige afhankelijkheid onder elkaar, noch individueel met de eigenschap - dus deze zouden inderdaad afhankelijk zijn van een hogere orde. Het raamwerk van multivariantie op afstand en de detectiemethode voor afhankelijkheidsstructuren zijn nu veelbelovende hulpmiddelen voor dergelijk onderzoek.

Implementaties van de nieuwe methoden zijn voorzien voor directe toepassingen in het pakket "multivariantie" voor de gratis statistische rekenomgeving R.