science >> Wetenschap >  >> Elektronica

Een generatieve geheugenbenadering om levenslang versterkend leren mogelijk te maken

Krediet:Raghavan, Hostetler &Chai.

Een belangrijke beperking van bestaande kunstmatige intelligentie (AI)-systemen is dat ze niet in staat zijn om taken aan te pakken waarvoor ze niet zijn opgeleid. In feite, zelfs als ze worden omgeschoold, de meeste van deze systemen zijn vatbaar voor 'catastrofaal vergeten, ' wat in wezen betekent dat een nieuw item hun eerder verworven kennis kan verstoren.

Bijvoorbeeld, als een model eerst wordt getraind om taak A te voltooien en vervolgens wordt omgeschoold voor taak B, de prestaties op taak A kunnen aanzienlijk afnemen. Een naïeve oplossing zou zijn om oneindig meer neurale lagen toe te voegen om extra taken of items te ondersteunen die worden getraind, maar een dergelijke aanpak zou niet efficiënt zijn, of zelfs functioneel schaalbaar.

Onderzoekers van SRI International hebben onlangs geprobeerd biologische geheugenoverdrachtsmechanismen toe te passen op AI-systemen, omdat ze geloven dat dit hun prestaties zou kunnen verbeteren en hen adaptiever zou maken. hun studie, voorgepubliceerd op arXiv, haalt inspiratie uit mechanismen van geheugenoverdracht bij mensen, zoals het langetermijn- en kortetermijngeheugen.

"We bouwen een nieuwe generatie AI-systemen die kunnen leren van ervaringen, "Sek Chai, een co-PI van het DARPA Lifelong Learning Machines (L2M)-project, vertelde TechXplore. "Dit betekent dat ze zich op basis van hun ervaringen kunnen aanpassen aan nieuwe scenario's. AI-systemen falen omdat ze niet adaptief zijn. Het DARPA L2M-project, onder leiding van Dr. Hava Siegelmann, streeft naar paradigmaveranderende vooruitgang in AI-mogelijkheden."

Krediet:Raghavan, Hostetler &Chai.

Geheugenoverdracht omvat een complexe opeenvolging van dynamische processen, waardoor mensen gemakkelijk toegang hebben tot opvallende of relevante herinneringen bij het denken, planning, het maken of doen van voorspellingen over toekomstige gebeurtenissen. Men denkt dat slaap een cruciale rol speelt bij het consolideren van herinneringen, vooral REM-slaap, het stadium waarin dromen het vaakst voorkomt.

In hun studie hebben Chai en zijn SRI-collega's ontwikkelden een generatief geheugenmechanisme dat kan worden gebruikt om AI-systemen op een pseudo-repetitieve manier te trainen. Met behulp van herhalings- en versterkingsleren (RL), dit mechanisme stelt AI-systemen in staat om gedurende hun hele leven te leren van opvallende herinneringen, en schaal met een groot aantal trainingstaken of items. De generatieve geheugenbenadering ontwikkeld door Chai en zijn collega's maakt gebruik van een coderingsmethode om de latente ruimte te scheiden. Hierdoor kan een AI-systeem leren, zelfs wanneer taken niet goed gedefinieerd zijn of wanneer het aantal taken onbekend is.

"Ons AI-systeem slaat niet direct ruwe data op, zoals video, geluid, enzovoort., ' legde Chai uit. 'Integendeel, we gebruiken het generatieve geheugen om te genereren of ons voor te stellen wat het eerder heeft meegemaakt. Generatieve AI-systemen zijn gebruikt om kunst te maken, muziek, enz. In ons onderzoek, we gebruiken ze om generatieve ervaringen te coderen die later kunnen worden gebruikt met versterkend leren. Een dergelijke benadering is geïnspireerd op biologische mechanismen in slaap en dromen, waar we ons fragmenten van ervaringen herinneren of voorstellen die worden versterkt in onze langetermijnherinneringen."

In de toekomst, de nieuwe generatieve geheugenbenadering geïntroduceerd door Chai en zijn collega's zou kunnen helpen om het probleem van catastrofaal vergeten in neurale netwerkgebaseerde modellen aan te pakken, levenslang leren in AI-systemen mogelijk te maken. De onderzoekers testen nu hun aanpak op computergebaseerde strategiespellen die vaak worden gebruikt om AI-systemen te trainen en te evalueren.

"We gebruiken realtime strategiespellen zoals StarCraft2 om onze AI-agenten te trainen en te bestuderen op het gebied van levenslang leren, zoals aanpassing, robuustheid, en veiligheid, " zei Chai. "Onze AI-agenten zijn getraind met verrassingen die in het spel worden geïnjecteerd (bijvoorbeeld verandering van terrein en eenheidscapaciteit)."

© 2019 Wetenschap X Netwerk