science >> Wetenschap >  >> Elektronica

Een diepgaande leerbenadering om defensieve escortteams te coördineren

Krediet:Garg et al.

Vooruitgang in robotica en kunstmatige intelligentie (AI) maakt de ontwikkeling mogelijk van kunstmatige middelen die zijn ontworpen om mensen te helpen in verschillende alledaagse situaties. Een van de vele mogelijke toepassingen van deze systemen zou kunnen zijn om mensen of waardevolle goederen te begeleiden die van de ene naar de andere locatie worden overgebracht, hen te beschermen tegen bedreigingen of aanvallen.

Gefascineerd door dit idee, een team van onderzoekers van de Universiteit van New Mexico heeft onlangs een nieuwe end-to-end-oplossing geïntroduceerd voor het coördineren van robot-escorteteams die hoogwaardige ladingen of goederen beschermen. De techniek die ze voorstelden, gepresenteerd in een paper dat vooraf is gepubliceerd op arXiv, is gebaseerd op diep versterkend leren (RL), wat inhoudt dat algoritmen worden getraind om effectieve voorspellingen te doen door gegevens te analyseren.

"Ik kwam voor het eerst op het idee achter dit onderzoek toen ik erover dacht mijn koffer door een overvol vliegveld te slepen, "Lydia Tapia, de hoofdonderzoeker van het onderzoek, vertelde TechXplore. "Ik dacht bij mezelf:wat als het mijn navigatie zou kunnen helpen door bij me te blijven en me te bewaken tijdens het lopen?"

Voordat ze begonnen met het ontwikkelen van hun oplossing voor het coördineren van defensieve escortteams, Tapia en haar team hebben eerdere literatuur doorgenomen op zoek naar inspiratie of soortgelijke benaderingen. Helaas, echter, ze konden geen andere onderzoeken vinden waarin robots werden gebruikt om inkomende dreigingen te voorspellen en te onderscheppen, menselijke gebruikers beschermen en ervoor zorgen dat ze hun bestemming veilig bereiken.

"Er is veel werk aan navigatie-assistenten, maar meestal werken ze door een alarm te laten klinken om te voorkomen dat een persoon in de buurt van een inkomende dreiging navigeert, " legde Tapia uit. "We ontdekten dat een robot-escortteam verschillende andere toepassingen zou kunnen hebben in veiligheidskritieke scenario's, veel belangrijker dan mijn luchthavenkoffer, daarom hebben we ons in dit artikel geconcentreerd op navigatie van nuttige ladingen, wat een veelvoorkomende taak is waarbij escorts de lading veilig houden tijdens het navigeren."

Tapia en haar collega's hebben hun diepe RL-model getraind om effectieve posities en strategieën te voorspellen om mogelijke bedreigingen te onderscheppen. Net als andere RL-technieken, tijdens de training, hun model onderging een lange reeks proeven waarin het acties moest voorstellen om bedreigingen te onderscheppen en escortes te coördineren, beloningen ontvangen wanneer de voorgestelde strategie effectief was. Overuren, het model leerde het geleerde tijdens de training te generaliseren en toe te passen op geheel nieuwe situaties.

Krediet:Lydia Tapia

"Er zijn momenteel geen intelligente methoden om dit probleem op te lossen, dus we hebben laten zien hoe agenten met een vaste functie kunnen worden ingezet, "Zei Tapia. "Echter, zoals u zich kunt voorstellen, je zou nogal wat defensieve agenten nodig hebben die op reguliere posities zijn geplaatst om een ​​navigerende lading te beschermen."

De onderzoekers evalueerden hun RL-techniek in een reeks simulaties waarbij escortagenten een specifiek doelwit beschermen tegen bedreigingen of obstakels in de omgeving. Ze ontdekten dat hun model beter presteerde dan de modernste algoritmen voor het vermijden van obstakels, het navigatiesucces met tot wel 31 procent verhogen. In aanvulling, de escortteams die met hun techniek gecoördineerd waren, bleken met succes de lading te beschermen met een slagingspercentage dat 75 procent hoger was dan dat van escortteams in statische formaties.

"De meest betekenisvolle bevinding van ons werk was dat we het probleem konden weergeven op een manier die haalbaar is voor de agent om een ​​oplossing te leren die flexibel is, zelfs onder onverwachte omstandigheden zoals het verwijderen of toevoegen van middelen, ' legde Tapia uit.

In de toekomst, de aanpak die is ontwikkeld door Tapia en haar team aan de Universiteit van New Mexico kan worden gebruikt om teams te coördineren die ladingen of menselijke reizigers begeleiden. Echter, het kan ook andere toepassingen hebben, bijvoorbeeld hulp bij de ontwikkeling van nieuwe instrumenten om visueel gehandicapte personen te helpen en te begeleiden terwijl ze op reis zijn of in onbekende omgevingen navigeren.

"We zijn verheugd om aanvullende toepassingen van dit werk te onderzoeken voor nieuwe problemen die we nog niet hebben opgelost, "Zei Tapia. "Het zou leuk zijn om onze intelligente agenten ook op hardware te zien demonstreren."

© 2019 Wetenschap X Netwerk