Wetenschap
Een nieuwe machine learning-aanpak kan onderzoekers helpen bij het oplossen van problemen, zoals het uitzoeken van de beste cilindergroottes om elektromagnetische energie op te vangen. Krediet:Duke University School of Nursing
Elektrotechnici van Duke University hebben een nieuwe methode bedacht om moeilijke ontwerpproblemen met veel mogelijke oplossingen in een grote ontwerpruimte op te lossen met behulp van machine learning. Nagesynchroniseerd met de "neuraal-adjoint methode, "De aanpak onthult met succes een geoptimaliseerd ontwerp voor een elektromagnetisch communicatieapparaat en kan ook worden gebruikt voor vele andere ontwerpuitdagingen, variërend van biomedische beeldvorming tot holografie.
Het onderzoek verscheen op 24 februari online in het tijdschrift Optica Express , getiteld "Neural-adjoint methode voor het inverse ontwerp van volledig diëlektrische metasurfaces."
Het dilemma dat wordt aangepakt door de nieuwe methode voor machinaal leren, is het oplossen van inverse problemen, wat betekent dat onderzoekers het resultaat weten dat ze willen, maar niet zeker weten wat de beste manier is om het te bereiken. Binnen dit type uitdaging is er een klasse die slecht gestelde inverse problemen wordt genoemd, wat betekent dat er een oneindig aantal oplossingen is zonder advies over welke de beste zou kunnen zijn.
"Als je twee getallen krijgt om toe te voegen, u een directe en eenvoudige oplossing kunt krijgen, " legde Willie Padilla uit, hoogleraar elektrische en computertechniek aan Duke. "Maar als ik zeg dat ik twee reële getallen moet geven die optellen tot drie, er is een oneindige reeks getallen die het antwoord zou kunnen zijn zonder begrip als het juiste antwoord is gekozen. Het omdraaien van deze eenvoudige taak laat zien hoe uitdagend een slecht gesteld omgekeerd probleem kan zijn."
In het nieuwe onderzoek de specifieke taak die Padilla wil oplossen, is het vinden van het beste ontwerp voor een diëlektrisch (metaalvrij) metamateriaal dat een specifieke elektromagnetische respons produceert. Metamaterialen zijn synthetische materialen die zijn samengesteld uit vele individuele technische kenmerken, die samen eigenschappen produceren die niet in de natuur voorkomen. Ze bereiken dit door hun structuur in plaats van door hun chemie. In Padilla's diëlektrische metamateriaalexperiment, hij gebruikt een groot vel dat is opgebouwd uit afzonderlijke rasters van twee bij twee van siliciumcilinders die lijken op korte, vierkante Lego.
Berekenen hoe de elektromagnetische effecten van een identieke set cilinders op elkaar inwerken, is een eenvoudig proces dat door commerciële software kan worden uitgevoerd. Maar het is een veel moeilijker voorstel om het slecht gestelde inverse probleem uit te werken van welke geometrie het beste een gewenste reeks eigenschappen zal produceren. Omdat elke cilinder een elektromagnetisch veld creëert dat zich buiten zijn fysieke grenzen uitstrekt, ze gaan op een onvoorspelbare manier met elkaar om, niet-lineaire manier.
"Als je een gewenste reactie probeert op te bouwen door de elektromagnetische effecten te combineren die door elke afzonderlijke cilinder worden geproduceerd, je krijgt een ingewikkelde kaart van veel hoge en lage toppen die niet alleen een som van hun delen is, "zei professor Padilla. "Het is een enorme geometrische parameterruimte en je bent volledig blind - er is geen indicatie welke kant je op moet."
Padilla's nieuwe machine learning-aanpak om door deze complexe ontwerpruimte te navigeren, begint met het trainen van een diep neuraal netwerk met 60, 000 simulaties van verschillende ontwerpen en de elektromagnetische eigenschappen die ze produceren. Zelfs rekening houdend met 14 geometrische parameters, het machine learning-algoritme leerde de functie die de complexe geometrie verbindt met het elektromagnetische resultaat.
Op dit punt, het diepe neurale netwerk zou onderzoekers een antwoord kunnen bieden op een omgekeerde vraag naar het vinden van een geometrie die een gewenst antwoord kan produceren. Maar met 1,04 biljoen mogelijke oplossingen, het zou het neurale netwerk meer dan drie jaar kosten om een antwoord te vinden.
"Naar mijn weten, dit is het grootste fotonica-probleem van de geometrische ruimte waar iemand aan heeft gewerkt, " zei Padilla. "Als je het probeerde op te lossen met een normaal computeralgoritme, het zou 600 miljoen jaar duren. Het diepe neurale netwerk bemonsterde slechts 0,0000575% van de ontwerpruimte, maar het leerde de functie toch."
Hoewel een indrukwekkende prestatie, het is de tweede stap naar dit proces dat echt nieuw is. Hoewel de onderzoekers niet precies weten hoe de functie die het diepe neurale netwerk bedacht er eigenlijk uitziet, daarmee kunnen ze toewerken naar een optimaal antwoord.
De nieuwe neurale-adjunct-methode werkt door te beginnen bij 16, 000 willekeurige punten en berekenen hoe goed elke oplossing is. Het stelt elk in staat om naar een betere oplossing te gaan - een proces dat gradiëntafdaling wordt genoemd. Door dit proces meerdere keren te herhalen, het algoritme werkt zich een weg naar lokaal geoptimaliseerde oplossingen. Cruciaal, de onderzoekers stellen ook minimum- en maximumgrenzen vast op basis van hun kennis van de ruimte waarbinnen de machine learning nauwkeurig is, waardoor het algoritme niet te gek werd met zijn oplossingen.
Na 300 herhalingen, het programma kijkt naar de 16, 000 lokaal optimale oplossingen gevonden en de beste optie kiest. Het geeft ook aan of er een grens is ingesteld voor een parameter die een betere oplossing mogelijk zou maken als deze zou worden uitgebreid.
"Bij het doen van dit onderzoek we zagen al onze beste oplossingen vastlopen tegen de maximale hoogte die we hadden ingesteld voor de cilinders, "zei Padilla. "We beperkten onszelf, maar wisten het niet. Dus hebben we de hoogte vergroot, deed nog meer simulaties, en inderdaad een betere oplossing gevonden."
Toegepast op metamaterialen, Padilla zegt dat deze methode kan helpen bij het ontwikkelen van platte communicatieantennes voor de zijkanten van gebouwen die zichzelf snel kunnen herconfigureren om gebruikers in de buurt beter te kunnen bereiken. Maar hij zegt dat het ook kan worden gebruikt in een breed scala aan toepassingen die informatie verzamelen van elektromagnetische golven. Bijvoorbeeld, het interpreteren van röntgenstralen of magnetische golven in medische beeldvormingsapparatuur of het ontwikkelen van computergegenereerde hologrammen.
Wetenschap © https://nl.scienceaq.com