science >> Wetenschap >  >> anders

Nieuwe methode voor het meten van ruimtelijke afhankelijkheden verandert minder gegevens in meer gegevens

Afbeelding van onderlinge afhankelijkheden in menselijke migratie van overstromingsgebieden naar steden in het binnenland in Bangladesh. Krediet:Maurizio Porfiri, doctoraat

De identificatie van menselijke migratie gedreven door klimaatverandering, de verspreiding van COVID-19, landbouwtrends, en sociaaleconomische problemen in aangrenzende regio's zijn afhankelijk van gegevens:hoe complexer het model, hoe meer gegevens er nodig zijn om dergelijke ruimtelijk verdeelde verschijnselen te begrijpen. Echter, betrouwbare gegevens zijn vaak duur en moeilijk te verkrijgen, of te schaars om nauwkeurige voorspellingen mogelijk te maken.

Maurizio Porfiri, Instituutshoogleraar mechanica en ruimtevaart, biomedisch, en civiele en stedelijke techniek en een lid van het Center for Urban Science and Progress (CUSP) aan de NYU Tandon School of Engineering, een nieuwe oplossing bedacht op basis van netwerk- en informatietheorie die ervoor zorgt dat "kleine gegevens" groot worden, de toepassing van wiskundige technieken die normaal worden gebruikt voor tijdreeksen, aan ruimtelijke processen.

De studie, "Een informatietheoretische benadering om ruimtelijke afhankelijkheden in kleine datasets te bestuderen, " staat op de cover van Proceedings of the Royal Society A:Wiskundig, Fysische en technische wetenschappen , beschrijft hoe, uit een kleine steekproef van attributen op een beperkt aantal locaties, waarnemers kunnen robuuste gevolgtrekkingen maken van invloeden, inclusief interpolaties naar tussenliggende gebieden of zelfs verre regio's die vergelijkbare belangrijke kenmerken delen.

"Meestal zijn de datasets slecht, " legde Porfiri uit. "Daarom, we hebben een heel basale aanpak gevolgd, het toepassen van informatietheorie om te onderzoeken of invloed in de tijdelijke zin zou kunnen worden uitgebreid tot de ruimte, waardoor we met een zeer kleine dataset kunnen werken, tussen 25 en 50 waarnemingen, " zei hij. "We nemen één momentopname van de gegevens en trekken verbanden - niet gebaseerd op oorzaak en gevolg, maar op interactie tussen de afzonderlijke punten - om te zien of er een of andere onderliggende, collectieve reactie in het systeem."

De methode, ontwikkeld door Porfiri en medewerker Manuel Ruiz Marín van de afdeling kwantitatieve methoden, Recht en moderne talen, Technische Universiteit van Cartagena, Spanje, betrokken:

  • Het consolideren van een bepaalde dataset in een klein aantal toegestane symbolen, vergelijkbaar met de manier waarop een machine learning-systeem een ​​gezicht kan identificeren met beperkte pixelgegevens:een kin, jukbeenderen, voorhoofd, enzovoort.
  • Het toepassen van een informatietheorieprincipe om een ​​niet-parametrische toets te maken (een die geen onderliggend model voor de interactie tussen locaties aanneemt) om associaties tussen gebeurtenissen te trekken en om te ontdekken of onzekerheid op een bepaalde locatie wordt verminderd als men kennis heeft over de onzekerheid op een andere locatie.

Professor Maurizio Porfiri, aan het werk in zijn lab aan de NYU Tandon School of Engineering. Krediet:NYU Tandon School of Engineering

Porfiri legde uit dat aangezien een niet-parametrische benadering geen onderliggende structuur biedt voor de invloeden tussen knooppunten, het geeft flexibiliteit in hoe knooppunten kunnen worden gekoppeld, of zelfs hoe het concept van een buur wordt gedefinieerd.

"Omdat we dit concept van een buurman abstraheren, we kunnen het definiëren in de context van elke kwaliteit die u maar wilt, bijvoorbeeld, ideologie. ideologisch, Californië kan een buur zijn van New York, hoewel ze niet geografisch naast elkaar liggen. Ze kunnen dezelfde waarden delen."

Het team valideerde het systeem aan de hand van twee casestudies:bevolkingsmigratie in Bangladesh als gevolg van zeespiegelstijging en sterfgevallen door motorvoertuigen in de VS, een statistisch principieel inzicht verwerven in de mechanismen van belangrijke socio-economische problemen.

"In het eerste geval, we wilden zien of migratie tussen locaties kan worden voorspeld door geografische afstand of de ernst van de overstroming van dat specifieke district - of kennis van welk district dicht bij een ander district ligt of kennis van het niveau van overstromingen zal helpen bij het voorspellen van de omvang van migratie, " zei Ruiz Marín.

Voor het tweede geval ze keken naar de ruimtelijke verdeling van alcoholgerelateerde auto-ongelukken in 1980, 1994, en 2009, het vergelijken van staten met een hoge mate van dergelijke ongevallen met aangrenzende staten en met staten met vergelijkbare wetgevende ideologieën over rijden onder invloed.

"We ontdekten een sterkere relatie tussen staten die grenzen delen dan tussen staten die wetgevende ideologieën delen met betrekking tot alcoholgebruik en autorijden."

Volgende, Porfiri en Ruiz Marín zijn van plan hun methode uit te breiden tot de analyse van ruimtelijk-temporele processen, zoals wapengeweld in de VS - een groot onderzoeksproject dat onlangs is gefinancierd door het LEAP HI-programma van de National Science Foundation - of epileptische aanvallen in de hersenen. Hun werk zou kunnen helpen begrijpen wanneer en waar wapengeweld kan plaatsvinden of aanvallen kunnen beginnen.