science >> Wetenschap >  >> anders

De vloek van dimensionaliteit verslaan

De methode van het team voorspelde de relatie tussen stedelijke luchtvervuiling en verkeersstroom nauwkeuriger dan bestaande methoden, vooral voor prognoses op langere termijn. Krediet:KAUST; Heno Hwang

Een gedeeltelijke matching-aanpak kan de dimensionaliteits-"vloek" van continue metingen in de loop van de tijd overwinnen om nauwkeurigere toekomstige voorspellingen op te leveren.

Door gegevens uit het verleden te scannen op zowel gedeeltelijke als volledige overeenkomsten met huidige waarnemingen, een door KAUST geleid onderzoeksteam heeft een voorspellingsschema ontwikkeld dat het toekomstige traject van omgevingsparameters betrouwbaarder kan voorspellen.

Het verzamelen van gegevens met regelmatige tussenpozen in de loop van de tijd is gebruikelijk in veel gebieden, maar vooral in milieu-, transport en biologisch onderzoek. Dergelijke gegevens worden gebruikt om de huidige toestand te bewaken en vast te leggen en ook om te helpen voorspellen wat er in de toekomst zou kunnen gebeuren. Een typische benadering is om te zoeken naar eerdere patronen of trajecten in de gegevens die overeenkomen met het huidige traject.

Echter, in praktijk, er zijn nooit volledige overeenkomsten, en dus moet de voorspeller kleinere en kleinere tijdvensters vinden in gegevens uit het verleden die een gedeeltelijke overeenkomst opleveren. Dit resulteert in een verlies van context en eventuele bredere trends die een betere voorspelling hadden kunnen geven, terwijl u mogelijk willekeurige ruis tekent.

"Het voorspellen van toekomstige trajecten van tijdreeksen is een uitdaging omdat de trajecten zijn samengesteld uit vele opeenvolgende waarnemingen of 'dimensies', " wat multivariate voorspellingsbenaderingen beperkt, " zegt Hernando Ombao van KAUST. "Dit staat bekend als de vloek van de dimensionaliteit."

Om deze uitdagingen te overwinnen, postdoc Shuhao Jiao ontwikkelde een methode die partiële functionele voorspelling (PFP) wordt genoemd en die informatie van alle volledige en gedeeltelijke trajecten uit het verleden integreert. Deze geoptimaliseerde aanpak maakt gebruik van alle beschikbare gegevens, het vastleggen van zowel langetermijntrends als goed op elkaar afgestemde deeltrajecten.

"Door de trajecten te effenen, we kunnen de vloek omzetten in een zegen door het grote plaatje vast te leggen van de dynamische informatie van trajecten, Jiao zegt. "Onze methode omvat zowel crosstrajectory als intratrajectory afhankelijkheid, die eerdere methoden niet hebben bereikt."

De aanpak omvat een stapsgewijze procedure waarbij de gegevens eerst worden geanalyseerd voor langere volledige trajecten, de "resterende" deelcomponenten worden vervolgens als fragmenten geëxtraheerd, onafhankelijk van trends uit het verleden, en alles wat overblijft wordt toegewezen aan willekeurige ruis. De drie functies worden vervolgens toegepast op het voorspellingsvenster.

Het team, samen met medewerker Alexander Aue van de Universiteit van Californië, demonstreerden hun methode voor de voorspelling van fijnstof in de lucht en verkeersstroom en toonden aan dat hun PBB-methode veel nauwkeurigere voorspellingen gaf dan bestaande methoden, vooral voor prognoses op langere termijn.

"Onze methode laat zien dat door het opnemen van afhankelijkheidsinformatie binnen en tussen trajecten, het is mogelijk om een ​​uitgesproken verbetering te bereiken in de voorspelling van toekomstige trajecten, ' zegt Ombao.