science >> Wetenschap >  >> Fysica

Machine learning-techniek reconstrueert beelden die door een multimode-vezel gaan

Krediet:CC0 Publiek Domein

Door innovatief gebruik van een neuraal netwerk dat beeldverwerking door het menselijk brein nabootst, een onderzoeksteam rapporteert nauwkeurige reconstructie van beelden die over optische vezels worden verzonden over afstanden tot een kilometer.

In het tijdschrift van de Optical Society voor high-impact onderzoek, optiek , de onderzoekers melden dat ze een type machine learning-algoritme leren dat bekend staat als een diep neuraal netwerk om afbeeldingen van getallen te herkennen aan het patroon van spikkels dat ze creëren wanneer ze naar het uiteinde van een vezel worden verzonden. Het werk zou endoscopische beeldvorming voor medische diagnose kunnen verbeteren, de hoeveelheid informatie die wordt overgedragen via glasvezeltelecommunicatienetwerken vergroten, of verhoog het optische vermogen dat door vezels wordt geleverd.

"We gebruiken moderne diepe neurale netwerkarchitecturen om de invoerbeelden op te halen uit de vervormde uitvoer van de vezel, " zei Demetri Psaltis, Zwitsers Federaal Instituut voor Technologie, Lausanne, die het onderzoek leidde in samenwerking met collega Christophe Moser. "We laten zien dat dit mogelijk is voor vezels tot 1 kilometer lang", voegde hij eraan toe. noemde het werk 'een belangrijke mijlpaal'.

De onscherpte ontcijferen

Optische vezels geven informatie door met licht. Multimode vezels hebben een veel grotere capaciteit om informatie over te dragen dan singlemode vezels. Hun vele kanalen - bekend als ruimtelijke modi omdat ze verschillende ruimtelijke vormen hebben - kunnen verschillende informatiestromen tegelijkertijd verzenden.

Hoewel multimode-vezels zeer geschikt zijn voor het dragen van op licht gebaseerde signalen, het verzenden van afbeeldingen is problematisch. Het licht van het beeld reist door alle kanalen en wat er aan de andere kant uitkomt, is een patroon van spikkels dat het menselijk oog niet kan ontcijferen.

Om dit probleem aan te pakken, Psaltis en zijn team wendden zich tot een diep neuraal netwerk, een soort machine learning-algoritme dat ongeveer hetzelfde functioneert als de hersenen. Diepe neurale netwerken kunnen computers de mogelijkheid geven om objecten op foto's te identificeren en spraakherkenningssystemen te helpen verbeteren. Input wordt verwerkt door verschillende lagen kunstmatige neuronen, die elk een kleine berekening uitvoeren en het resultaat doorgeven aan de volgende laag. De machine leert de invoer te identificeren door de bijbehorende uitvoerpatronen te herkennen.

"Als we nadenken over de oorsprong van neurale netwerken, dat is ons eigen brein, het proces is eenvoudig, " legt Eirini Kakkava uit, een doctoraatsstudent die aan het project werkt. "Als een persoon naar een object staart, neuronen in de hersenen worden geactiveerd, wat wijst op herkenning van een bekend object. Ons brein kan dit omdat het ons hele leven wordt getraind met beelden of signalen van dezelfde categorie objecten, die de sterkte van de verbindingen tussen de neuronen verandert." Om een ​​kunstmatig neuraal netwerk te trainen, onderzoekers volgen in wezen hetzelfde proces, het netwerk leren om bepaalde afbeeldingen te herkennen (in dit geval handgeschreven cijfers) totdat het afbeeldingen in dezelfde categorie kan herkennen als de trainingsafbeeldingen die het nog niet eerder heeft gezien.

Leren door de cijfers

Om hun systeem te trainen, de onderzoekers wendden zich tot een database met 20, 000 voorbeelden van handgeschreven nummers, 0 tot en met 9. Ze selecteerden 16, 000 te gebruiken als trainingsgegevens, en apart gehouden 2, 000 om de training te valideren en nog eens 2, 000 voor het testen van het gevalideerde systeem. Ze gebruikten een laser om elk cijfer te verlichten en stuurden de lichtstraal door een optische vezel, waarvan er ongeveer 4 500 kanalen, naar een camera aan de andere kant. Een computer heeft gemeten hoe de intensiteit van het uitgangslicht varieerde over het vastgelegde beeld, en ze verzamelden een reeks voorbeelden voor elk cijfer.

Hoewel de voor elk cijfer verzamelde spikkelpatronen er voor het menselijk oog hetzelfde uitzagen, het neurale netwerk was in staat om verschillen te onderscheiden en patronen van intensiteit te herkennen die bij elk cijfer horen. Testen met de gereserveerde afbeeldingen toonden aan dat het algoritme een nauwkeurigheid van 97,6 procent bereikte voor afbeeldingen die werden verzonden via een vezel van 0,1 meter lang en een nauwkeurigheid van 90 procent met een vezel van 1 kilometer lang.

Een eenvoudigere methode

Navid Borhani, een onderzoeksteamlid, zegt dat deze machinale leerbenadering veel eenvoudiger is dan andere methoden om beelden te reconstrueren die door optische vezels zijn gegaan, waarvoor een holografische meting van de uitvoer nodig is. Het neurale netwerk kon ook omgaan met vervormingen veroorzaakt door omgevingsstoringen aan de vezel, zoals temperatuurschommelingen of bewegingen veroorzaakt door luchtstromen die ruis aan het beeld kunnen toevoegen - een situatie die erger wordt met de lengte van de vezel.

"Het opmerkelijke vermogen van diepe neurale netwerken om informatie op te halen die via multimode-vezels wordt verzonden, zal naar verwachting medische procedures zoals endoscopie en communicatietoepassingen ten goede komen, " zei Psaltis. Telecommunicatiesignalen moeten vaak door vele kilometers glasvezel reizen en kunnen vervormingen ondergaan, die deze methode zou kunnen corrigeren. Artsen zouden ultradunne vezelsondes kunnen gebruiken om beelden van de traktaten en slagaders in het menselijk lichaam te verzamelen zonder dat ze complexe holografische recorders nodig hebben of zich zorgen hoeven te maken over beweging. "Lichte bewegingen als gevolg van ademhaling of bloedsomloop kunnen de beelden die door een multimode-vezel worden verzonden, vervormen, " zei Psaltis. De diepe neurale netwerken zijn een veelbelovende oplossing om met die ruis om te gaan.

Psaltis en zijn team zijn van plan de techniek uit te proberen met biologische monsters, om te zien of dat net zo goed werkt als het lezen van handgeschreven nummers. Ze hopen een reeks onderzoeken uit te voeren met behulp van verschillende categorieën afbeeldingen om de mogelijkheden en grenzen van hun techniek te verkennen.