science >> Wetenschap >  >> Elektronica

Nieuw ontwerp bevordert optische neurale netwerken die met de snelheid van het licht rekenen met behulp van technische materie

Ontworpen optisch neuraal netwerk toegepast op een conventionele machine learning-taak. Krediet:UCLA Engineering Institute for Technology Advancement

Diffractief diep neuraal netwerk is een optisch raamwerk voor machinaal leren dat diffractieve oppervlakken en geconstrueerde materie gebruikt om alle berekeningen optisch uit te voeren. Na het ontwerp en de training in een computer met behulp van moderne deep learning-methoden, elk netwerk is fysiek gefabriceerd, met behulp van bijvoorbeeld 3D-printen of lithografie, om het getrainde netwerkmodel in materie te construeren. Deze 3D-structuur van gemanipuleerde materie is samengesteld uit doorlatende en/of reflecterende oppervlakken die in totaal machinale leertaken uitvoeren door middel van licht-materie-interactie en optische diffractie, met de snelheid van het licht, en zonder dat er stroom nodig is, behalve het licht dat het invoerobject verlicht. Dit is vooral belangrijk voor het veel sneller en met aanzienlijk minder vermogen herkennen van doelobjecten in vergelijking met standaard computergebaseerde machine learning-systemen, en kan grote voordelen opleveren voor autonome voertuigen en verschillende defensiegerelateerde toepassingen, onder andere. Geïntroduceerd door UCLA-onderzoekers [1], dit raamwerk werd experimenteel gevalideerd voor objectclassificatie en beeldvorming, het bieden van een schaalbaar en energiezuinig optisch rekenraamwerk. Bij volgend onderzoek, UCLA-ingenieurs hebben de inferentieprestaties van diffractieve optische neurale netwerken verder verbeterd door ze te integreren met standaard digitale diepe neurale netwerken, hybride machine learning-modellen vormen die berekeningen uitvoeren, gedeeltelijk met behulp van lichtdiffractie door materie en gedeeltelijk met behulp van een computer [2].

In hun laatste werk, [3] gepubliceerd in Geavanceerde fotonica , een open access tijdschrift van SPIE, de internationale vereniging voor optica en fotonica, de UCLA-groep heeft optimaal geprofiteerd van de inherente parallellisatiemogelijkheden van optica, en de inferentie- en generalisatieprestaties van diffractieve optische neurale netwerken aanzienlijk verbeterd (zie de afbeelding), helpen de kloof te dichten tussen volledig optische en de standaard elektronische neurale netwerken. Een van de belangrijkste verbeteringen was een differentieel detectieschema, waarbij elke klassescore op het uitgangsvlak van het optische netwerk wordt berekend met behulp van twee verschillende detectoren, één staat voor positieve getallen en de andere voor negatieve getallen. De juiste objectklasse (bijvoorbeeld auto's, vliegtuigen, schepen enz.) wordt afgeleid door het detectorpaar met het grootste genormaliseerde verschil tussen de positieve en de negatieve detectoren. Dit differentiële detectieschema wordt ook gecombineerd met parallel lopende diffractieve optische netwerken, waarbij elk is gespecialiseerd om specifiek een subgroep van objectklassen te herkennen. Dit klassespecifieke diffractieve netwerkontwerp profiteert aanzienlijk van het parallellisme en de schaalbaarheid van optische systemen, parallelle lichtpaden vormen binnen 3D-gemanipuleerde materie om de klassenscores van verschillende soorten objecten afzonderlijk te berekenen.

Deze nieuwe ontwerpstrategieën bereikten ongekende niveaus van inferentienauwkeurigheid voor volledig optisch neuraal netwerkgebaseerd machine learning. Bijvoorbeeld, in één implementatie toonden UCLA-onderzoekers numeriek blinde testnauwkeurigheden van 98,59%, 91,06% en 51,44% voor de herkenning van de afbeeldingen van handgeschreven cijfers, mode producten, en CIFAR-10 grijswaardenbeeldgegevensset (bestaande uit vliegtuigen, auto's, vogels, katten, hert, honden, kikkers, paarden, schepen, en vrachtwagens), respectievelijk [3]. Ter vergelijking, deze gevolgtrekkingsresultaten komen dicht in de buurt van de prestaties van enkele van de eerdere generaties volledig elektronische diepe neurale netwerken, bijvoorbeeld, LeNet, die classificatienauwkeurigheden van 98,77% bereikt, 90,27%, en 55,21% overeenkomend met dezelfde datasets, respectievelijk. Meer recente ontwerpen van elektronische neurale netwerken, zoals ResNet, veel betere prestaties behalen, nog steeds een kloof tussen de prestaties van volledig optische en elektronische neurale netwerken. deze kloof, echter, wordt gecompenseerd door belangrijke voordelen die worden geboden door volledig optische neurale netwerken, zoals de inferentiesnelheid, schaalbaarheid, parallellisme en het lage energieverbruik van passieve optische netwerken die gebruik maken van geconstrueerde materie om te berekenen door diffractie van licht.

Dit onderzoek werd geleid door Dr. Aydogan Ozcan, een Chancellor's Professor of Electrical and Computer Engineering aan de UCLA, en een associate director van het California NanoSystems Institute (CNSI). De andere auteurs van dit werk zijn afgestudeerde studenten Jingxi Li, Deniz Mengu en Yi Luo, evenals Dr. Yair Rivenson, een adjunct-hoogleraar elektrische en computertechniek aan de UCLA.

"Onze resultaten bieden een belangrijke vooruitgang om optische neurale netwerkgebaseerde oplossingen met laag vermogen en lage latentie te bieden voor verschillende machine learning-toepassingen, " zei prof. Ozcan. Bovendien, deze systematische vooruitgang in diffractieve optische netwerkontwerpen kan ons een stap dichter bij de ontwikkeling van de volgende generatie brengen, taakspecifieke en intelligente computercamerasystemen.

Dit onderzoek werd ondersteund door de Koç Group, NSF en HHMI.