science >> Wetenschap >  >> Fysica

Onderzoekers komen dichter bij volledig optisch kunstmatig neuraal netwerk

Onderzoekers hebben aangetoond dat een neuraal netwerk kan worden getraind met behulp van een optisch circuit (blauwe rechthoek in de afbeelding). In het volledige netwerk zouden er meerdere aan elkaar gekoppeld zijn. De laseringangen (groen) coderen informatie die door de chip wordt gedragen door optische golfgeleiders (zwart). De chip voert operaties uit die cruciaal zijn voor het kunstmatige neurale netwerk met behulp van afstembare bundelsplitsers, die worden weergegeven door de gebogen secties in de golfgeleiders. Deze secties koppelen twee aangrenzende golfgeleiders aan elkaar en worden afgestemd door de instellingen van optische faseverschuivers (rood en blauw gloeiende objecten) aan te passen. die fungeren als 'knoppen' die tijdens de training kunnen worden aangepast om een ​​bepaalde taak uit te voeren. Krediet:Tyler W. Hughes, Stanford universiteit

Onderzoekers hebben aangetoond dat het mogelijk is om kunstmatige neurale netwerken direct op een optische chip te trainen. De belangrijke doorbraak toont aan dat een optisch circuit een cruciale functie kan vervullen van een op elektronica gebaseerd kunstmatig neuraal netwerk en kan leiden tot minder dure, snellere en energiezuinigere manieren om complexe taken uit te voeren, zoals spraak- of beeldherkenning.

"Door een optische chip te gebruiken om neurale netwerkberekeningen efficiënter uit te voeren dan mogelijk is met digitale computers, kunnen complexere problemen worden opgelost, "Dit zou het vermogen van kunstmatige neurale netwerken vergroten om taken uit te voeren die nodig zijn voor zelfrijdende auto's of om een ​​passend antwoord te formuleren op een gesproken vraag", zegt onderzoeksteamleider Shanhui Fan van Stanford University. bijvoorbeeld. Het zou ook ons ​​leven kunnen verbeteren op manieren die we ons nu niet kunnen voorstellen."

Een kunstmatig neuraal netwerk is een soort kunstmatige intelligentie die verbonden eenheden gebruikt om informatie te verwerken op een manier die vergelijkbaar is met de manier waarop de hersenen informatie verwerken. Door deze netwerken te gebruiken om een ​​complexe taak uit te voeren, bijvoorbeeld spraakherkenning, vereist de cruciale stap van het trainen van de algoritmen om inputs te categoriseren, zoals verschillende woorden.

Hoewel optische kunstmatige neurale netwerken onlangs experimenteel zijn aangetoond, de trainingsstap werd uitgevoerd met behulp van een model op een traditionele digitale computer en de definitieve instellingen werden vervolgens geïmporteerd in het optische circuit. In optiek , Het tijdschrift van de Optical Society voor onderzoek met hoge impact, Onderzoekers van Stanford University rapporteren een methode om deze netwerken rechtstreeks in het apparaat te trainen door een optische analoog van het 'backpropagation'-algoritme te implementeren, wat de standaardmanier is om conventionele neurale netwerken te trainen.

"Het gebruik van een fysiek apparaat in plaats van een computermodel voor training maakt het proces nauwkeuriger, " zei Tyler W. Hughes, eerste auteur van het artikel. "Ook, omdat de trainingsstap een zeer rekenkundig duur onderdeel is van de implementatie van het neurale netwerk, het optisch uitvoeren van deze stap is de sleutel tot het verbeteren van de rekenefficiëntie, snelheid en stroomverbruik van kunstmatige netwerken."

Een op licht gebaseerd netwerk

Hoewel neurale netwerkverwerking meestal wordt uitgevoerd met behulp van een traditionele computer, er zijn aanzienlijke inspanningen geleverd om hardware te ontwerpen die specifiek is geoptimaliseerd voor neurale netwerkcomputing. Op optica gebaseerde apparaten zijn van groot belang omdat ze parallel berekeningen kunnen uitvoeren terwijl ze minder energie verbruiken dan elektronische apparaten.

In het nieuwe werk de onderzoekers overwonnen een grote uitdaging bij het implementeren van een volledig optisch neuraal netwerk door een optische chip te ontwerpen die de manier nabootst waarop conventionele computers neurale netwerken trainen.

Krediet:Optical Society of America

Een kunstmatig neuraal netwerk kan worden gezien als een zwarte doos met een aantal knoppen. Tijdens de opleidingsstap, deze knoppen worden elk een beetje gedraaid en vervolgens wordt het systeem getest om te zien of de prestaties van de algoritmen zijn verbeterd.

"Onze methode helpt niet alleen te voorspellen in welke richting de knoppen moeten worden gedraaid, maar ook hoeveel je aan elke knop moet draaien om dichter bij de gewenste prestatie te komen, "zei Hughes. "Onze aanpak versnelt de training aanzienlijk, vooral voor grote netwerken, omdat we parallel informatie krijgen over elke knop."

Training op de chip

Het nieuwe trainingsprotocol werkt op optische circuits met afstembare bundelsplitsers die worden aangepast door de instellingen van optische faseverschuivers te wijzigen. Laserstralen die informatie coderen die moet worden verwerkt, worden in het optische circuit afgevuurd en door optische golfgeleiders door de bundelsplitsers gedragen, die worden aangepast als knoppen om de neurale netwerkalgoritmen te trainen.

In het nieuwe trainingsprotocol de laser wordt eerst door het optische circuit geleid. Bij het verlaten van het apparaat, het verschil met de verwachte uitkomst wordt berekend. Deze informatie wordt vervolgens gebruikt om een ​​nieuw lichtsignaal te genereren, die via het optische netwerk in de tegenovergestelde richting wordt teruggestuurd. Door tijdens dit proces de optische intensiteit rond elke bundelsplitser te meten, de onderzoekers lieten zien hoe te detecteren, parallel, hoe de prestaties van het neurale netwerk zullen veranderen met betrekking tot de instelling van elke bundelsplitser. De instellingen van de faseverschuiver kunnen op basis van deze informatie worden gewijzigd, en het proces kan worden herhaald totdat het neurale netwerk het gewenste resultaat oplevert.

De onderzoekers testten hun trainingstechniek met optische simulaties door een algoritme te leren om ingewikkelde functies uit te voeren, zoals het uitkiezen van complexe kenmerken binnen een reeks punten. Ze ontdekten dat de optische implementatie op dezelfde manier presteerde als een conventionele computer.

"Ons werk toont aan dat je de wetten van de fysica kunt gebruiken om computerwetenschappelijke algoritmen te implementeren, " zei Fan. "Door deze netwerken te trainen in het optische domein, het laat zien dat optische neurale netwerksystemen kunnen worden gebouwd om bepaalde functionaliteiten uit te voeren met alleen optica."

De onderzoekers zijn van plan het systeem verder te optimaliseren en willen het gebruiken om een ​​praktische toepassing van een neurale netwerktaak door te voeren. De algemene aanpak die ze ontwierpen, zou kunnen worden gebruikt met verschillende neurale netwerkarchitecturen en voor andere toepassingen zoals herconfigureerbare optica.