Wetenschap
Voor last-mile leveringen, robots van de toekomst kunnen een nieuw MIT-algoritme gebruiken om de voordeur te vinden, aanwijzingen in hun omgeving gebruiken. Krediet:MIT Nieuws
In de niet al te verre toekomst, robots kunnen worden verzonden als last-mile-bezorgvoertuigen om uw afhaalbestelling te laten vallen, pakket, of een maaltijdpakket voor de deur - als ze de deur kunnen vinden.
Standaardbenaderingen voor robotnavigatie omvatten het vooraf in kaart brengen van een gebied, en vervolgens algoritmen gebruiken om een robot naar een specifiek doel of GPS-coördinaat op de kaart te leiden. Hoewel deze benadering zinvol kan zijn voor het verkennen van specifieke omgevingen, zoals de indeling van een bepaald gebouw of een geplande hindernisbaan, het kan onpraktisch worden in het kader van last-mile delivery.
Stel je voor, bijvoorbeeld, vooraf elke wijk binnen de bezorgzone van een robot in kaart moeten brengen, inclusief de configuratie van elk huis in die buurt, samen met de specifieke coördinaten van de voordeur van elk huis. Zo'n taak kan moeilijk op te schalen zijn naar een hele stad, vooral omdat de buitenkant van huizen vaak verandert met de seizoenen. Het in kaart brengen van elk huis kan ook problemen opleveren op het gebied van veiligheid en privacy.
Nu hebben MIT-ingenieurs een navigatiemethode ontwikkeld waarbij het niet nodig is om vooraf een gebied in kaart te brengen. In plaats daarvan, hun aanpak stelt een robot in staat om aanwijzingen in zijn omgeving te gebruiken om een route naar zijn bestemming te plannen, die in algemene semantische termen kan worden beschreven, zoals "voordeur" of "garage, " in plaats van als coördinaten op een kaart. Bijvoorbeeld, als een robot de opdracht krijgt om een pakket bij iemands voordeur af te leveren, het kan op de weg beginnen en een oprit zien, waarvan het is getraind om te herkennen dat het waarschijnlijk naar een trottoir leidt, die op zijn beurt waarschijnlijk naar de voordeur leidt.
De nieuwe techniek kan de tijd die een robot besteedt aan het verkennen van een eigendom aanzienlijk verkorten voordat het zijn doelwit identificeert, en het is niet afhankelijk van kaarten van specifieke woningen.
"We zouden niet willen dat we een kaart zouden moeten maken van elk gebouw dat we zouden moeten bezoeken, " zegt Michael Everett, een afgestudeerde student in MIT's Department of Mechanical Engineering. "Met deze techniek we hopen een robot aan het einde van een oprit te laten vallen en hem een deur te laten vinden."
Everett zal de resultaten van de groep deze week presenteren op de International Conference on Intelligent Robots and Systems. De krant, die is co-auteur van Jonathan How, hoogleraar luchtvaart en ruimtevaart aan het MIT, en Justin Miller van de Ford Motor Company, is finalist voor "Best Paper for Cognitive Robots."
"Een gevoel van wat de dingen zijn"
In recente jaren, onderzoekers hebben gewerkt aan de introductie van natuurlijke, semantische taal naar robotsystemen, robots trainen om objecten te herkennen aan hun semantische labels, zodat ze een deur visueel kunnen verwerken als een deur, bijvoorbeeld, en niet alleen als een solide, rechthoekig obstakel.
"Nu hebben we de mogelijkheid om robots een idee te geven van wat dingen zijn, live, ' zegt Evert.
Evert, Hoe, en Miller gebruiken vergelijkbare semantische technieken als springplank voor hun nieuwe navigatieaanpak, die gebruikmaakt van reeds bestaande algoritmen die kenmerken extraheren uit visuele gegevens om een nieuwe kaart van dezelfde scène te genereren, weergegeven als semantische aanwijzingen, of context.
In hun geval, de onderzoekers gebruikten een algoritme om een kaart van de omgeving op te bouwen terwijl de robot zich voortbewoog, met behulp van de semantische labels van elk object en een dieptebeeld. Dit algoritme wordt semantische SLAM (Simultaneous Localization and Mapping) genoemd.
Terwijl andere semantische algoritmen robots in staat hebben gesteld om objecten in hun omgeving te herkennen en in kaart te brengen voor wat ze zijn, ze hebben een robot niet toegestaan om op het moment beslissingen te nemen tijdens het navigeren door een nieuwe omgeving, op het meest efficiënte pad om naar een semantische bestemming zoals een 'voordeur' te gaan.
"Voordat, verkennen was gewoon, plof een robot neer en zeg 'ga, " en het zal bewegen en uiteindelijk daar komen, maar het zal langzaam gaan "Hoe zegt het.
De kosten om te gaan
De onderzoekers probeerden de padplanning van een robot te versnellen door middel van een semantische, context-gekleurde wereld. Ze ontwikkelden een nieuwe "cost-to-go schatter, " een algoritme dat een semantische kaart, gemaakt door reeds bestaande SLAM-algoritmen, omzet in een tweede kaart, die de waarschijnlijkheid weergeeft dat een bepaalde locatie dicht bij het doel is.
"Dit werd geïnspireerd door de beeld-naar-beeld vertaling, waar je een foto van een kat maakt en het op een hond laat lijken, Everett zegt. "Hier gebeurt hetzelfde soort idee, waarbij je één afbeelding maakt die eruitziet als een wereldkaart, en verander het in deze andere afbeelding die lijkt op de kaart van de wereld, maar nu is gekleurd op basis van hoe dicht verschillende punten van de kaart bij het einddoel zijn."
Deze kosten-te-gaan-kaart is ingekleurd, in grijstinten, om donkere gebieden weer te geven als locaties ver van een doel, en lichtere regio's als gebieden die dicht bij het doel liggen. Bijvoorbeeld, de stoep, geel gecodeerd in een semantische kaart, kan door het cost-to-go-algoritme worden vertaald als een donkerder gebied in de nieuwe kaart, vergeleken met een oprit, dat steeds lichter wordt naarmate het de voordeur nadert - het lichtste gebied op de nieuwe kaart.
De onderzoekers trainden dit nieuwe algoritme op satellietbeelden van Bing Maps met daarop 77 huizen uit één stedelijke en drie suburbane buurten. Het systeem zette een semantische kaart om in een kostenpostkaart, en het meest efficiënte pad uitgestippeld, volgende lichtere regio's op de kaart, naar het einddoel. Voor elk satellietbeeld, Everett heeft semantische labels en kleuren toegewezen aan contextkenmerken in een typische voortuin, zoals grijs voor een voordeur, blauw voor een oprit, en groen voor een haag.
Tijdens dit opleidingstraject het team paste ook maskers toe op elke afbeelding om het gedeeltelijke beeld na te bootsen dat de camera van een robot waarschijnlijk zou hebben als deze een tuin doorkruist.
"Een deel van de truc van onze aanpak was [het systeem geven] veel gedeeltelijke afbeeldingen, "Hoe legt uit. "Dus het moest echt uitzoeken hoe al deze dingen met elkaar verband hielden. Dat maakt deel uit van wat dit robuust maakt."
De onderzoekers testten hun aanpak vervolgens in een simulatie van een afbeelding van een geheel nieuw huis, buiten de trainingsdataset, eerst het reeds bestaande SLAM-algoritme gebruiken om een semantische kaart te genereren, vervolgens hun nieuwe cost-to-go-schatter toepassen om een tweede kaart te genereren, en pad naar een doel, in dit geval, de voordeur.
De nieuwe cost-to-go-techniek van de groep vond de voordeur 189 procent sneller dan klassieke navigatie-algoritmen, die geen rekening houden met context of semantiek, en in plaats daarvan buitensporige stappen besteden aan het verkennen van gebieden die waarschijnlijk niet in de buurt van hun doel zijn.
Everett zegt dat de resultaten illustreren hoe robots context kunnen gebruiken om efficiënt een doel te lokaliseren. zelfs in onbekende, niet-toegewezen omgevingen.
"Zelfs als een robot een pakket aflevert in een omgeving waar hij nog nooit is geweest, er kunnen aanwijzingen zijn die hetzelfde zijn als op andere plaatsen waar het is gezien, Everett zegt. "Dus de wereld kan een beetje anders zijn ingedeeld, maar er zijn waarschijnlijk enkele dingen gemeen."
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com