Wetenschap
Krediet:Massachusetts Institute of Technology
"Deep Learning" computersystemen, gebaseerd op kunstmatige neurale netwerken die de manier nabootsen waarop de hersenen leren van een opeenstapeling van voorbeelden, zijn een hot topic geworden in de informatica. Naast het mogelijk maken van technologieën zoals gezichts- en spraakherkenningssoftware, deze systemen kunnen enorme hoeveelheden medische gegevens doorzoeken om patronen te vinden die diagnostisch nuttig kunnen zijn, of scan chemische formules op mogelijke nieuwe geneesmiddelen.
Maar de berekeningen die deze systemen moeten uitvoeren zijn zeer complex en veeleisend, zelfs voor de krachtigste computers.
Nutsvoorzieningen, een team van onderzoekers van MIT en elders heeft een nieuwe benadering van dergelijke berekeningen ontwikkeld, licht gebruiken in plaats van elektriciteit, waarvan ze zeggen dat het de snelheid en efficiëntie van bepaalde deep learning-berekeningen enorm zou kunnen verbeteren. Hun resultaten verschijnen vandaag in het tijdschrift Natuurfotonica in een paper van MIT-postdoc Yichen Shen, afgestudeerde student Nicholas Harris, professoren Marin Soljacic en Dirk Englund, en acht anderen.
Soljacic zegt dat veel onderzoekers door de jaren heen beweringen hebben gedaan over op optica gebaseerde computers, maar dat "mensen dramatisch te veel beloofden, en het mislukte." Hoewel veel voorgestelde toepassingen van dergelijke fotonische computers niet praktisch bleken te zijn, een op licht gebaseerd neuraal netwerksysteem ontwikkeld door dit team "kan voor sommige toepassingen van toepassing zijn op diep leren, " hij zegt.
Traditionele computerarchitecturen zijn niet erg efficiënt als het gaat om het soort berekeningen dat nodig is voor bepaalde belangrijke neurale netwerktaken. Dergelijke taken omvatten meestal herhaalde vermenigvuldigingen van matrices, wat zeer rekenintensief kan zijn in conventionele CPU- of GPU-chips.
Na jaren van onderzoek, het MIT-team heeft een manier bedacht om deze operaties in plaats daarvan optisch uit te voeren. "Deze chip, als je het eenmaal afstemt, kan matrixvermenigvuldiging uitvoeren met, in principe, nul energie, bijna onmiddellijk, " zegt Soljacic. "We hebben de cruciale bouwstenen gedemonstreerd, maar nog niet het volledige systeem."
Bij wijze van analogie, Soljacic wijst erop dat zelfs een gewone brillenglas een complexe berekening (de zogenaamde Fourier-transformatie) uitvoert op de lichtgolven die er doorheen gaan. De manier waarop lichtbundels berekeningen uitvoeren in de nieuwe fotonische chips is veel algemener, maar heeft een soortgelijk onderliggend principe. De nieuwe aanpak maakt gebruik van meerdere lichtbundels die zo gericht zijn dat hun golven op elkaar inwerken, interferentiepatronen produceren die het resultaat van de beoogde operatie weergeven. Het resulterende apparaat is iets wat de onderzoekers een programmeerbare nanofotonische processor noemen.
Het resultaat, Shen zegt, is dat de optische chips die deze architectuur gebruiken, in principe, veel sneller en met minder dan een duizendste zoveel energie per bewerking als conventionele elektronische chips berekeningen uitvoeren die worden uitgevoerd in typische kunstmatige intelligentie-algoritmen. "Het natuurlijke voordeel van het gebruik van licht om matrixvermenigvuldiging uit te voeren, speelt een grote rol bij de snelheid en energiebesparing, omdat dichte matrixvermenigvuldigingen het meest energieverslindende en tijdrovende onderdeel zijn in AI-algoritmen", zegt hij.
De nieuwe programmeerbare nanofotonische processor, die werd ontwikkeld in het Englund-lab door Harris en medewerkers, maakt gebruik van een reeks golfgeleiders die onderling zijn verbonden op een manier die naar behoefte kan worden aangepast, programmeren van die bundel voor een specifieke berekening. "Je kunt in elke matrixbewerking programmeren, ", zegt Harris. De processor leidt het licht door een reeks gekoppelde fotonische golfgeleiders. Het volledige voorstel van het team roept op tot verweven lagen van apparaten die een bewerking toepassen die een niet-lineaire activeringsfunctie wordt genoemd, analoog aan de werking van neuronen in de hersenen.
Om het concept te demonstreren, het team stelde de programmeerbare nanofotonische processor in om een neuraal netwerk te implementeren dat vier basisklinkergeluiden herkent. Zelfs met dit rudimentaire systeem, ze waren in staat om een nauwkeurigheidsniveau van 77 procent te bereiken, vergeleken met ongeveer 90 procent voor conventionele systemen. Er zijn "geen substantiële obstakels" om het systeem op te schalen voor een grotere nauwkeurigheid, zegt Soljacic.
Englund voegt eraan toe dat de programmeerbare nanofotonische processor ook andere toepassingen kan hebben, inclusief signaalverwerking voor datatransmissie. "Hoge snelheid analoge signaalverwerking is iets dat dit zou kunnen aankunnen" sneller dan andere benaderingen die het signaal eerst omzetten in digitale vorm, aangezien licht een inherent analoog medium is. "Deze aanpak zou de verwerking rechtstreeks in het analoge domein kunnen doen, " hij zegt.
Het team zegt dat het nog veel meer moeite en tijd zal kosten om dit systeem bruikbaar te maken; echter, zodra het systeem is opgeschaald en volledig functioneert, het kan veel gebruikerscases vinden, zoals datacenters of beveiligingssystemen. Het systeem kan ook een zegen zijn voor zelfrijdende auto's of drones, zegt Harris, of "wanneer je veel rekenwerk moet doen, maar je hebt niet veel kracht of tijd."
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com