Science >> Wetenschap >  >> Fysica

Orbitaal-hoek-momentum-gecodeerde diffractieve netwerken voor objectclassificatietaken

Het voorgestelde diffractieve diepe neurale netwerk maakt gebruik van orbitale impulsmomentcodering en diffractieve lagen om ruimtelijke informatie uit handgeschreven cijfers te verwerken, wat een robuuste en veelzijdige benadering biedt voor herkenning van enkele en meervoudige cijfers. Credit:Geavanceerde fotonica Nexus (2023). DOI:10.1117/1.APN.2.6.066006

Deep learning heeft een revolutie teweeggebracht in de manier waarop we data waarnemen en gebruiken. Naarmate de datasets echter groeien en de eisen op het gebied van computers toenemen, hebben we efficiëntere manieren nodig om gegevens te verwerken, op te slaan en te verwerken. In dit opzicht wordt optisch computergebruik gezien als de volgende grens van de computertechnologie. In plaats van elektronische signalen te gebruiken, vertrouwt optisch computergebruik op de eigenschappen van lichtgolven, zoals golflengte en polarisatie, om gegevens op te slaan en te verwerken.



Diffractieve diepe neurale netwerken (D 2 NN) gebruiken verschillende eigenschappen van lichtgolven om taken uit te voeren zoals beeld- en objectherkenning. Dergelijke netwerken bestaan ​​uit tweedimensionale pixelarrays als diffractieve lagen. Elke pixel dient als een instelbare parameter die de eigenschappen van de lichtgolven die er doorheen gaan beïnvloedt. Dit unieke ontwerp stelt de netwerken in staat computertaken uit te voeren door informatie in lichtgolven te manipuleren. Tot nu toe D 2 NN's maken gebruik van eigenschappen van lichtgolven, zoals intensiteit, fase, polarisatie en golflengte.

Nu blijkt uit een onderzoek gepubliceerd in Advanced Photonics Nexus , hebben onderzoekers van de Minzu Universiteit van China, de Universiteit van Peking en de Shanxi Universiteit in China drie D 2 NN's met diffractieve lagen die objecten kunnen herkennen met behulp van informatie die wordt vastgehouden in orbitaal impulsmoment (OAM) van licht. Deze omvatten OAM-gecodeerde D 2 met één detector NN's voor single- en multitask-classificatie, en multidetector OAM-gecodeerde D 2 NN voor herhaalbare multitask-classificatie.

Maar wat is OAM? Het is een eigenschap van lichtgolven die verband houdt met de rotatie- of draaiende beweging. Het kan een oneindig aantal onafhankelijke waarden aannemen, die elk overeenkomen met een andere lichtmodus. Vanwege het brede scala aan mogelijke toestanden of modi kan OAM ruimtelijke informatie overbrengen, zoals de positie, opstelling of structuur van een object. In de voorgestelde D 2 NN-framework worden OAM-bundels met informatie die handgeschreven cijfers verlichten gecombineerd tot een enkele vortexbundel. Deze straal, die meerdere OAM-modi bevat, elk geassocieerd met een specifieke draaiing of rotatie van lichtgolven, gaat door vijf diffractieve lagen die zijn getraind om de kenmerken van handgeschreven cijfers uit de OAM-modi te herkennen.

Een opvallend kenmerk van de OAM-gecodeerde D 2 NN is het vermogen om de reeks herhalende cijfers te onderscheiden. Om dit te bereiken gebruikten de onderzoekers meerdere detectoren om OAM-informatie van meerdere afbeeldingen tegelijkertijd te verwerken.

Wanneer getest op de MNIST-dataset, een veelgebruikte dataset voor handgeschreven cijferherkenning, de D 2 NN voorspelde ongeveer 85,49% van de tijd correct enkele cijfers in de afbeeldingen, een nauwkeurigheidsniveau vergelijkbaar met D 2 NN-modellen die gebruik maken van de golflengte- en polarisatie-eigenschappen van licht.

Het gebruik van OAM-modi om informatie te coderen is een belangrijke stap in de richting van het bevorderen van parallelle verwerkingsmogelijkheden en zal ten goede komen aan toepassingen die realtime verwerking vereisen, zoals beeldherkenning of gegevensintensieve taken.

In feite bereikt dit werk een doorbraak in parallelle classificatie door gebruik te maken van de OAM-vrijheidsgraad, waarmee andere bestaande D 2 worden overtroffen NN-ontwerpen. Met name OAM-gecodeerde D 2 NN's bieden een krachtig raamwerk om de mogelijkheden van volledig optische parallelle classificatie en OAM-gebaseerde machine vision-taken verder te verbeteren en zullen naar verwachting veelbelovende onderzoeksrichtingen openen voor D 2 NN.

Meer informatie: Kuo Zhang et al., Geavanceerde volledig optische classificatie met behulp van orbitaal-hoek-momentum-gecodeerde diffractieve netwerken, Advanced Photonics Nexus (2023). DOI:10.1117/1.APN.2.6.066006

Geleverd door SPIE