science >> Wetenschap >  >> Fysica

Studie toont een nieuwe op herhaling gebaseerde methode aan die de Kolmogorov-Smirnov-test nabootst

De herhalingsplot is een essentieel hulpmiddel voor het analyseren van niet-lineaire dynamische systemen, vooral systemen met empirisch geobserveerde tijdreeksgegevens. RP's tonen patronen in een faseruimtesysteem en geven aan waar gegevens dezelfde coördinaten bezoeken. RP's kunnen ook bepaalde soorten inferentiële statistieken en lineaire analyses nabootsen, zoals spectrale analyse. Een nieuw artikel in het tijdschrift Chaos , biedt een proof of concept voor het gebruik van RP's om de Kolmogorov-Smirnov-test na te bootsen, die wetenschappers gebruiken om te bepalen of twee datasets significant verschillen.

De auteurs, echter, wees voorzichtig dat niet alle soorten gegevens kunnen worden gebruikt met deze nieuwe methode. "Continue gegevens op een interval- of ratioschaalniveau zouden het meest geschikt zijn voor deze techniek, " zei Giuseppe Leonardi, een van de auteurs van de studie. "Echter, discreet gedistribueerde gegevens op hetzelfde meetniveau, zoals dobbelstenen, zouden ook geschikt zijn."

De onderzoekers analyseerden herhalingspunten in de RP's door de RP in vier kwadranten te verdelen en het aantal herhalingspunten in elke cel te tellen. Vervolgens, ze berekenden de herhalingspercentages binnen de steekproef en tussen de steekproeven en gebruikten die waarden, samen met de verwachte frequenties, om een ​​p-waarde te bepalen die gerelateerd is aan het verschil tussen de steekproeven. Deze p-waarde gaf aan of de twee groepen uit hetzelfde monster of uit verschillende monsters kwamen.

Om hun proof of concept te verifiëren, de onderzoekers voerden een reeks simulaties uit om te zien hoe hun op herhaling gebaseerde test presteerde in vergelijking met de Kolmogorov-Smirnov-test. Bij deze simulaties waren twee groepen normale, scheef normaal, of lognormale verdelingen met verschillende combinaties van gemiddelden en standaarddeviaties. De onderzoekers ontdekten dat de op herhaling gebaseerde methode ongeveer hetzelfde presteerde als de Kolmogorov-Smirnov-test, met enkele verschillen in gevoeligheid met verschillende distributietypen.

De op herhaling gebaseerde test bleek gevoeliger te zijn aan de uiteinden van de verdeling dan de Kolmogorov-Smirnov-test. Dit kan zijn omdat de test afwijkingen over het hele bereik van waarden in aanmerking neemt, in tegenstelling tot de Kolmogorov-Smirnov-test die alleen verantwoordelijk is voor de grootste afwijking tussen twee distributies. Leonardi legde uit dat deze verhoogde gevoeligheid de op herhaling gebaseerde test vooral nuttig zou maken voor niet-lineaire gegevens zoals menselijke reactietijden.

Hij waarschuwde ook dat hun methode statistisch betrouwbare verschillen zou kunnen suggereren die te klein zijn om zinvol te zijn. "Dit is misschien een nadeel van de test voor praktische gebruikers, " zei Leonardi. "Echter, we hebben dergelijke effecten niet diepgaand onderzocht."

Deze proof of concept toont aan dat de RP nuttig kan zijn voor statistische analysetools. Vooruit gaan, het team is van plan om de effecten van steekproefomvang op hun methode te onderzoeken. Leonardi zei dat ze de test ook verder willen ontwikkelen om andere soorten inferentiële statistieken te modelleren, inclusief variantieanalyse.