science >> Wetenschap >  >> Elektronica

Kunstmatige intelligentie gebruiken om digitale kaarten te verrijken

Een AI-model ontwikkeld aan het MIT en Qatar Computing Research Institute dat alleen satellietbeelden gebruikt om automatisch wegkenmerken in digitale kaarten te taggen, zou de GPS-navigatie kunnen verbeteren, vooral in landen met beperkte kaartgegevens. Tegoed:Google Maps/MIT Nieuws

Een door onderzoekers van het MIT en Qatar Computing Research Institute (QCRI) uitgevonden model dat satellietbeelden gebruikt om wegkenmerken in digitale kaarten te taggen, kan GPS-navigatie helpen verbeteren.

Door chauffeurs meer details over hun routes te tonen, kunnen ze vaak navigeren op onbekende locaties. Lane telt, bijvoorbeeld, kan een GPS-systeem inschakelen om bestuurders te waarschuwen voor uitlopende of samenvoegende rijstroken. Door informatie over parkeerplaatsen op te nemen, kunnen bestuurders vooruit plannen, terwijl het in kaart brengen van fietspaden fietsers kan helpen door drukke stadsstraten te rijden. Het verstrekken van actuele informatie over de toestand van de wegen kan ook de planning voor rampenbestrijding verbeteren.

Maar gedetailleerde kaarten maken is een dure, tijdrovend proces, meestal uitgevoerd door grote bedrijven, zoals Google, die voertuigen rond stuurt met camera's vastgebonden aan hun motorkappen om video en afbeeldingen van de wegen in een gebied vast te leggen. Door dat te combineren met andere gegevens kunnen nauwkeurige, actuele kaarten. Omdat dit proces duur is, echter, sommige delen van de wereld worden genegeerd.

Een oplossing is om machinale leermodellen op satellietbeelden los te laten - die gemakkelijker te verkrijgen zijn en vrij regelmatig worden bijgewerkt - om automatisch wegkenmerken te taggen. Maar wegen kunnen worden afgesloten door, zeggen, bomen en gebouwen, een uitdagende taak maken. In een paper dat wordt gepresenteerd op de Association for the Advancement of Artificial Intelligence-conferentie, de MIT- en QCRI-onderzoekers beschrijven "RoadTagger, " die een combinatie van neurale netwerkarchitecturen gebruikt om automatisch het aantal rijstroken en wegtypes (residentieel of snelweg) achter obstakels te voorspellen.

Bij het testen van RoadTagger op verstopte wegen van digitale kaarten van 20 Amerikaanse steden, het model telde rijstrooknummers met een nauwkeurigheid van 77 procent en leidde wegtypen met een nauwkeurigheid van 93 procent af. De onderzoekers zijn ook van plan om RoadTagger in staat te stellen andere functies te voorspellen, zoals parkeerplaatsen en fietspaden.

"De meeste bijgewerkte digitale kaarten zijn van plaatsen waar grote bedrijven het meest om geven. Als je op plaatsen bent waar ze niet veel om geven, je bent in het nadeel met betrekking tot de kwaliteit van de kaart, " zegt co-auteur Sam Madden, een professor bij de afdeling Electrical Engineering and Computer Science (EECS) en een onderzoeker bij het Computer Science and Artificial Intelligence Laboratory (CSAIL). "Ons doel is om het proces van het genereren van hoogwaardige digitale kaarten te automatiseren, zodat ze in elk land beschikbaar kunnen zijn."

De co-auteurs van het papier zijn CSAIL-afgestudeerde studenten Songtao He, Favyen Bastani, en Edwardpark; EECS-student Satvat Jagwani; CSAIL-hoogleraren Mohammad Alizadeh en Hari Balakrishnan; en QCRI-onderzoekers Sanjay Chawla, Sofiane Abbar, en Mohammed Amin Sadeghi.

CNN en GNN combineren

Quatar, waar QCRI is gevestigd, is "geen prioriteit voor de grote bedrijven die digitale kaarten maken, " zegt Madden. Toch, het bouwt voortdurend nieuwe wegen en verbetert oude, vooral als voorbereiding op het hosten van de FIFA World Cup 2022.

"Tijdens een bezoek aan Qatar, we hebben ervaringen gehad waarbij onze Uber-chauffeur niet weet hoe hij moet komen waar hij heen gaat, omdat de kaart zo verkeerd is, ", zegt Madden. "Als navigatie-apps niet over de juiste informatie beschikken, voor zaken als het samenvoegen van rijstroken, dit kan frustrerend of erger zijn."

RoadTagger vertrouwt op een nieuwe combinatie van een convolutioneel neuraal netwerk (CNN) - vaak gebruikt voor beeldverwerkingstaken - en een graaf-neuraal netwerk (GNN). GNN's modelleren relaties tussen verbonden knooppunten in een grafiek en zijn populair geworden voor het analyseren van zaken als sociale netwerken en moleculaire dynamica. Het model is "end-to-end, " wat betekent dat het alleen onbewerkte gegevens krijgt en automatisch uitvoer produceert, zonder menselijke tussenkomst.

De CNN neemt als invoer onbewerkte satellietbeelden van doelwegen. De GNN verdeelt de weg in stukken van ongeveer 20 meter, of 'tegels'. Elke tegel is een afzonderlijk grafiekknooppunt, verbonden door lijnen langs de weg. Voor elk knooppunt, de CNN extraheert wegkenmerken en deelt die informatie met zijn directe buren. Weginformatie plant zich voort over de hele grafiek, waarbij elk knooppunt wat informatie ontvangt over wegattributen in elk ander knooppunt. Als een bepaalde tegel is ingesloten in een afbeelding, RoadTagger gebruikt informatie van alle tegels langs de weg om te voorspellen wat er achter de occlusie zit.

Deze gecombineerde architectuur vertegenwoordigt een meer mensachtige intuïtie, zeggen de onderzoekers. Stel dat een deel van een vierbaansweg is afgesloten door bomen, dus bepaalde tegels tonen slechts twee rijstroken. Mensen kunnen gemakkelijk vermoeden dat er een paar rijstroken achter de bomen verborgen zijn. Traditionele modellen voor machinaal leren, zeg maar gewoon een CNN-extract alleen kenmerken van individuele tegels en voorspel hoogstwaarschijnlijk dat de verstopte tegel een tweebaansweg is.

"Mensen kunnen informatie van aangrenzende tegels gebruiken om het aantal banen in de verstopte tegels te raden, maar netwerken kunnen dat niet, " Hij zegt. "Onze aanpak probeert het natuurlijke gedrag van mensen na te bootsen, waar we lokale informatie van de CNN en wereldwijde informatie van de GNN vastleggen om betere voorspellingen te doen."

Gewichten leren

Om RoadTagger te trainen en te testen, de onderzoekers gebruikten een real-world kaartdataset, genaamd OpenStreetMap, waarmee gebruikers over de hele wereld digitale kaarten kunnen bewerken en beheren. Uit die dataset ze verzamelden bevestigde wegkenmerken van 688 vierkante kilometer aan kaarten van 20 Amerikaanse steden, waaronder Boston, Chicago, Washington, en Seattle. Vervolgens, ze verzamelden de bijbehorende satellietbeelden uit een Google Maps-dataset.

In opleiding, RoadTagger leert gewichten - die verschillende mate van belang toekennen aan functies en knooppuntverbindingen - van CNN en GNN. De CNN haalt kenmerken uit pixelpatronen van tegels en de GNN verspreidt de geleerde kenmerken langs de grafiek. Van willekeurig geselecteerde subgrafieken van de weg, het systeem leert de wegkenmerken op elke tegel te voorspellen. Daarbij, het leert automatisch welke afbeeldingskenmerken nuttig zijn en hoe deze kenmerken langs de grafiek kunnen worden verspreid. Bijvoorbeeld, als een doeltegel onduidelijke rijstrookmarkeringen heeft, maar de aangrenzende tegel heeft vier rijstroken met duidelijke rijstrookmarkeringen en deelt dezelfde wegbreedte, dan heeft de doeltegel waarschijnlijk ook vier banen. In dit geval, het model leert automatisch dat de wegbreedte een handig beeldkenmerk is, dus als twee aangrenzende tegels dezelfde wegbreedte delen, ze hebben waarschijnlijk hetzelfde aantal rijstroken.

Gezien een weg die niet wordt gezien in de training van OpenStreetMap, het model verdeelt de weg in tegels en gebruikt de geleerde gewichten om voorspellingen te doen. Belast met het voorspellen van een aantal rijstroken in een afgesloten tegel, het model merkt op dat aangrenzende tegels overeenkomende pixelpatronen hebben en, daarom, een grote kans om informatie te delen. Dus, als die tegels vier banen hebben, de afgesloten tegel moet er ook vier hebben.

In een ander resultaat, RoadTagger voorspelde nauwkeurig rijstrooknummers in een dataset van gesynthetiseerde, zeer uitdagende wegverstoringen. Als een voorbeeld, een viaduct met twee rijstroken bedekte enkele tegels van een doelweg met vier rijstroken. Het model detecteerde niet-overeenkomende pixelpatronen van het viaduct, dus negeerde het de twee rijstroken over de bedekte tegels, nauwkeurig voorspellen dat er vier rijstroken onder waren.

De onderzoekers hopen RoadTagger te gebruiken om mensen te helpen bij het snel valideren en goedkeuren van continue aanpassingen aan infrastructuur in datasets zoals OpenStreetMap, waar veel kaarten geen rijstrooktellingen of andere details bevatten. Een specifiek aandachtsgebied is Thailand, Bastani zegt, waar wegen voortdurend veranderen, maar er zijn weinig of geen updates in de dataset.

"Wegen die ooit als onverharde wegen werden bestempeld, zijn geplaveid, dus het is beter om op te rijden, en sommige kruispunten zijn volledig overgebouwd. Elk jaar zijn er veranderingen, maar digitale kaarten zijn verouderd, "zegt hij. "We willen dergelijke wegkenmerken voortdurend bijwerken op basis van de meest recente beelden."

Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.