science >> Wetenschap >  >> Elektronica

Training met het zoekalgoritme voor toestanden van materie maakt snoeien van neuronmodellen mogelijk

Axonen van presynaptische neuronen (invoer X) verbinden met takken van dendrieten (horizontale rechthoeken) door synaptische lagen; de membraanlaag (verticale rechthoeken) somt de dendritische activaties op, en draagt ​​de som over aan het somalichaam (zwarte bol). Synaptische lagen hebben vier verschillende verbindingsgevallen, namelijk, de directe verbinding, de omgekeerde verbinding, de constante 0-verbinding en de constante 1-verbinding. Krediet:Kanazawa University

Kunstmatige neurale netwerken zijn machine learning-systemen die zijn samengesteld uit een groot aantal verbonden knooppunten die kunstmatige neuronen worden genoemd. Net als de neuronen in een biologisch brein, deze kunstmatige neuronen zijn de primaire basiseenheden die worden gebruikt om neurale berekeningen uit te voeren en problemen op te lossen. Vooruitgang in de neurobiologie heeft de belangrijke rol geïllustreerd die dendritische celstructuren spelen bij neurale berekeningen, en dit heeft geleid tot de ontwikkeling van kunstmatige neuronmodellen op basis van deze structuren.

Het recent ontwikkelde benaderende logica-neuronenmodel (ALNM) is een enkelvoudig neuraal model met een dynamische dendritische structuur. De ALNM kan een neurale snoeifunctie gebruiken om tijdens de training onnodige dendriettakken en synapsen te elimineren om een ​​specifiek probleem aan te pakken. Het resulterende vereenvoudigde model kan dan worden geïmplementeerd in de vorm van een hardwarematige logische schakeling.

Echter, het bekende backpropagation (BP)-algoritme dat werd gebruikt om de ALMN te trainen, beperkte in feite de rekencapaciteit van het neuronmodel. "Het BP-algoritme was gevoelig voor initiële waarden en kon gemakkelijk worden gevangen in lokale minima, " zegt corresponderende auteur Yuki Todo van de Faculteit Elektrotechniek en Computertechniek van de Universiteit van Kanazawa. "Daarom hebben we de mogelijkheden geëvalueerd van verschillende heuristische optimalisatiemethoden voor het trainen van de ALMN."

Na een reeks experimenten, het algoritme voor het zoeken naar toestanden (SMS) werd geselecteerd als de meest geschikte trainingsmethode voor het ALMN. Zes benchmarkclassificatieproblemen werden vervolgens gebruikt om de optimalisatieprestaties van de ALNM te evalueren toen deze werd getraind met behulp van de SMS als leeralgoritme. en de resultaten toonden aan dat SMS superieure trainingsprestaties leverde in vergelijking met BP en de andere heuristische algoritmen in termen van zowel nauwkeurigheid als convergentiesnelheid.

Het evolutieproces van het zoeken naar toestanden van materie (SMS) is gebaseerd op het fysische principe van de thermische energie-bewegingsverhouding. Het hele optimalisatieproces is verdeeld in de volgende drie fasen:de gastoestand (50 procent), de vloeibare toestand (40 procent) en de vaste toestand (10 procent). Elke staat heeft zijn eigen operaties met verschillende exploratie-exploitatieverhoudingen. De gastoestand is een pure verkenning aan het begin van het optimalisatieproces. De vloeibare toestand bezit tegelijkertijd het zoeken naar exploratie en exploitatie, en de vaste stof richt zich op de exploitatie eenvoudigweg in het laatste deel van het optimalisatieproces. Het op deze manier geoptimaliseerde algoritme kan een passende balans tussen exploratie en exploitatie bereiken. Krediet:Kanazawa University

"Een classificatie op basis van de ALNM en SMS werd ook vergeleken met verschillende andere populaire classificatiemethoden, " stelt universitair hoofddocent Todo, "en de statistische resultaten bevestigden de superioriteit van deze classificatie op deze benchmarkproblemen."

Tijdens het opleidingsproces de ALNM vereenvoudigde de neurale modellen door middel van synaptische snoei- en dendritische snoeiprocedures, en de vereenvoudigde structuren werden vervolgens vervangen met behulp van logische circuits. Deze circuits boden ook een bevredigende classificatienauwkeurigheid voor elk van de benchmarkproblemen. Het gemak van hardware-implementatie van deze logische circuits suggereert dat in toekomstig onderzoek de ALNM en SMS zullen worden gebruikt om steeds complexere en hoogdimensionale real-world problemen op te lossen.

ALNM is in staat om de neurale modellen te vereenvoudigen door synaptische snoei en dendritische snoei tijdens het trainingsproces. Vervolgens, de vereenvoudigde structuren van ALNM kunnen worden vervangen door logische circuits, die alleen bestaat uit de 'vergelijkers' en logica NIET, EN- en OF-poorten. Onder hen, de 'comparator' werkt als een analoog-naar-digitaal omzetter die de ingang vergelijkt met de drempel θ. Als de ingang X de drempel θ overschrijdt, de 'vergelijker' zal 1 uitvoeren. Anders, het zal 0 uitvoeren. Wanneer geïmplementeerd op hardware, deze logische circuits kunnen worden gebruikt als efficiënte classificaties om de zes benchmarkproblemen op te lossen. Krediet:Universiteit van Kanazawa