Wetenschap
Figuur 1:Kenmerken die zijn afgeleid van indicatoren worden vervolgens ingevoerd in een model dat voorspellingen genereert samen met betrouwbaarheidsintervallen. Krediet:IBM
Regeringen over de hele wereld kwamen afgelopen december samen in Marrakesh om een pact te ratificeren om de samenwerking op het gebied van internationale migratie te verbeteren. Onder andere doelstellingen, het Global Compact for Migration probeert "nauwkeurige en uitgesplitste gegevens te gebruiken als basis voor empirisch onderbouwd beleid". Hoe kunnen machine learning-technologieën helpen bij diep polariserende maatschappelijke problemen zoals migratie?
Begin 2018, met steun van IBM Corporate Citizenship en het Deense ministerie van Buitenlandse Zaken, IBM en de Deense Vluchtelingenraad (DRC) zijn een partnerschap aangegaan dat volledig gericht is op de noodzaak om migratiefactoren beter te begrijpen en op empirisch onderbouwde beleidsrichtlijnen voor een reeks belanghebbenden. Tijdens de recente keynote van THINK Copenhagen, de secretaris-generaal van de DRC, Christiaan Friis Bach, presenteerde de eerste resultaten van deze inspanning.
Als we migratie- en vluchtelingenstromen kunnen voorspellen, kunnen we de bescherming van mensen op de vlucht voorkomen en verbeteren. Geweldige samenwerking met @IBM op het gebied van voorspellende modellering. Eerste resultaten gepresenteerd op #THINK2018CPH! pic.twitter.com/x1JDyI8s6L
— Christian Friis Bach (@christianfbach) 7 november 2018
In dit bericht, Ik zal de ontwikkeling doornemen van een machine learning-systeem dat strategische voorspellingen van gemengde migratie biedt, samen met scenario-analyse. Gemengde migratie verwijst naar grensoverschrijdende verplaatsingen van mensen die door een groot aantal factoren worden gemotiveerd om te verhuizen, inclusief vluchtelingen die op de vlucht zijn voor vervolging en conflicten, slachtoffers van mensenhandel, en mensen die op zoek zijn naar een beter leven en kansen. Dergelijke populaties hebben verschillende wettelijke statussen, waarvan sommige niet worden weerspiegeld in officiële overheidsstatistieken.
Het begrijpen van de dynamiek en drijfveren van migratie is inherent complex. De omstandigheden verschillen van persoon tot persoon. De vraag "waarom heb je besloten te verhuizen?" is niet eenvoudig voor mensen om te beantwoorden. Echter, voor zover individuele beslissingen structurele maatschappelijke factoren weerspiegelen, de dynamiek kan gedeeltelijk worden verklaard door geaggregeerde maatregelen. Bijvoorbeeld, economische drijfveren voor beweging zullen naar verwachting verband houden met werkgelegenheidskansen en dus met macro-indicatoren voor werkgelegenheid. Deze uitdagingen worden nog verergerd door de beschikbaarheid van gegevens en dekking op specifieke indicatoren.
Het voorspellingssysteem
We begonnen met het gebruik van het 4MI-monitoringprogramma van de DRC waarmee duizenden migranten op de vlucht worden geïnterviewd. Analyse van onderzoeksgegevens onthult clusters van drijfveren voor migratie op hoog niveau. Deze clusters varieerden van gebrek aan rechten en andere sociale diensten, tot economische noodzaak en conflicten. Deze drijfveren worden vervolgens toegewezen aan kwantitatieve indicatoren. Functies die van deze indicatoren zijn afgeleid, worden vervolgens ingevoerd in een model dat voorspellingen genereert samen met betrouwbaarheidsintervallen (Figuur 1). In aanvulling, het systeem genereert ook context voor elke voorspelling door specifieke drivers te tonen die hebben bijgedragen aan de voorspelling.
Met behulp van deze indicatoren, we hebben een ensemblemodel ontwikkeld om jaarlijks strategische prognoses te maken voor bilaterale stromen op gemengde migratievolumes. Uit onze evaluaties blijkt dat de foutenpercentages binnen enkele duizenden personen per jaar liggen, zelfs voor landen met volatiele omstandigheden. Het systeem maakt verder scenarioanalyse mogelijk, waar relatieve veranderingen in beïnvloedende factoren kunnen worden gemodelleerd om aangepaste voorspellingen te doen.
Uit een dergelijke analyse komt een interessante contra-intuïtieve dynamiek naar voren. Bijvoorbeeld, werkloosheidscijfers in Ethiopië zijn boven het gemiddelde in vergelijking met landen ten zuiden van de Sahara. Een groot aantal Ethiopiërs reist voor werk naar Saoedi-Arabië. Stijging van de arbeidsparticipatie tot de beste vijfde in de regio zal leiden tot meer migratie naar het VK (toename van twee procent), Zweden (toename van twee procent) en Saoedi-Arabië (toename van acht procent). Dit weerspiegelt een toegenomen vermogen en middelen van Ethiopiërs om hun aspiraties in het buitenland te vervullen. Als de werkloosheid tot het slechtste niveau stijgt, het model voorspelt een toename van migratie naar Zuid-Afrika (drie procent toename) en Saoedi-Arabië (vier procent toename), met EU-bestemmingen die grotendeels onveranderlijk zijn voor stijgingen van de werkloosheid.
Figuur 2:Correlatiematrix voor alle functies die in het model worden beschouwd (geen tijdelijke effecten). Krediet:IBM
Een dergelijke gedetailleerde kwantitatieve analyse was voorheen niet beschikbaar voor belanghebbenden die beleidsreacties moesten formuleren.
Causale gevolgtrekking
Het hierboven beschreven prognosesysteem is puur gegevensgestuurd, waarbij we op het model vertrouwen om relaties tussen alle variabelen af te leiden. Alternatief, als we materiedeskundigheid willen benutten en specifieke inzichten in het systeem willen opnemen, we zouden de benadering van probabilistische grafische modellen kunnen nemen.
Tijdens een workshop bij IBM Research – Ierland, materiedeskundigen van het Mixed Migration Centre in Genève en de DRC hebben het "spaghetti"-netwerk opgesteld en laten zien hoe zij verwachten dat indicatorclusters causaal met elkaar verbonden zijn. Door dit als invoer te gebruiken, vervolgens hebben we hun deskundige mening gecombineerd met de gegevens. We gebruikten een techniek genaamd structure learning om zo'n netwerk te ontwikkelen.
Voorspellingen met behulp van dergelijke netwerken presteren doorgaans niet zo goed als de puur gegevensgestuurde benaderingen die hierboven zijn beschreven; hoe dan ook, ze helpen bij scenarioanalyse en beleidsanalyse.
Wat is het volgende?
Figuur 3:(links) causaal netwerk getekend door experts en (rechts) netwerk geleerd op basis van de mening van experts en bewijs op basis van gegevens voor heel Sub-Sahara Afrika. Krediet:IBM
Dit zijn de eerste paar stappen op weg naar een toekomst waarin beleidsmakers direct toegang hebben tot bewijs wanneer en waar dat nodig is en waar complexe relaties gemakkelijk kunnen worden onderzocht om meer inzicht te geven en beter beleid te stimuleren.
Voor nu, we blijven het systeem verbeteren en verzamelen gebruikersfeedback met vakdeskundigen binnen de DRC. Na meer gedetailleerde validatie, we zullen proberen de geografische reikwijdte en scenarioanalysemogelijkheden uit te breiden.
Dit verhaal is opnieuw gepubliceerd met dank aan IBM Research. Lees hier het originele verhaal.
Statistische tests worden gebruikt om te bepalen of een veronderstelde relatie tussen variabelen een statistische significantie heeft. Doorgaans meet de test de mate waarin de variabelen correl
Wetenschap © https://nl.scienceaq.com