science >> Wetenschap >  >> Elektronica

Drie convolutionele neurale netwerkmodellen voor herkenning van gezichtsuitdrukkingen in het wild

De basisstructuur van de Light-CNN. Krediet:Jie &Yongsheng.

Twee onderzoekers van de Shanghai University of Electric Power hebben onlangs nieuwe neurale netwerkmodellen voor gezichtsherkenning (FER) in het wild ontwikkeld en geëvalueerd. hun studie, gepubliceerd in het tijdschrift Neurocomputing van Elsevier, presenteert drie modellen van convolutionele neurale netwerken (CNN's):een Light-CNN, een dual-branch CNN en een vooraf opgeleide CNN.

"Vanwege het gebrek aan informatie over niet-frontale gezichten, FER in het wild is een moeilijk punt in computervisie, "Qian Yongsheng, een van de onderzoekers die het onderzoek heeft uitgevoerd, vertelde TechXplore. "Bestaande methoden voor het herkennen van natuurlijke gezichtsuitdrukkingen op basis van diepe convolutionele neurale netwerken (CNN's) bieden verschillende problemen, inclusief overfitting, hoge rekencomplexiteit, enkele functie en beperkte voorbeelden."

Hoewel veel onderzoekers CNN-benaderingen voor FER hebben ontwikkeld, tot dusver, zeer weinigen van hen hebben geprobeerd te bepalen welk type netwerk het meest geschikt is voor deze specifieke taak. Zich bewust van deze leemte in de literatuur, Yongsheng en zijn collega Shao Jie ontwikkelden drie verschillende CNN's voor FER en voerden een reeks evaluaties uit om hun sterke en zwakke punten te identificeren.

"Ons eerste model is een ondiep licht-CNN dat een in de diepte scheidbare module introduceert met de resterende netwerkmodule, het verminderen van netwerkparameters door de convolutiemethode te wijzigen, " zei Yongsheng. "De tweede is een dual-branch CNN, die globale kenmerken en lokale textuurkenmerken combineert, proberen om rijkere kenmerken te verkrijgen en het gebrek aan rotatie-invariantie van convolutie te compenseren. De derde voorgetrainde CNN gebruikt gewichten die zijn getraind in dezelfde gedistribueerde grote database om opnieuw te trainen op zijn eigen kleine database, het verminderen van de trainingstijd en het verbeteren van de herkenningsgraad."

Kader van de dual-branch CNN. Krediet:Jie &Yongsheng.

De onderzoekers hebben hun CNN-modellen uitgebreid geëvalueerd op drie datasets die veel worden gebruikt voor FER:de openbare CK+, multi-view BU-3DEF en FER2013 datasets. Hoewel de drie CNN-modellen verschillen in prestaties vertoonden, ze behaalden allemaal veelbelovende resultaten, beter presteren dan verschillende state-of-the-art benaderingen voor FER.

"Momenteel, de drie CNN-modellen worden afzonderlijk gebruikt, " legde Yongsheng uit. "Het ondiepe netwerk is meer geschikt voor embedded hardware. De voorgetrainde CNN kan betere resultaten behalen, maar vereist vooraf getrainde gewichten. Het dual-branch-netwerk is niet erg effectief. Natuurlijk, je zou ook kunnen proberen de drie modellen samen te gebruiken."

In hun evaluaties de onderzoekers merkten op dat door de resterende netwerkmodule en de in de diepte scheidbare module te combineren, zoals ze deden voor hun eerste CNN-model, netwerkparameters kunnen worden verminderd. Dit zou uiteindelijk enkele van de tekortkomingen van computerhardware kunnen oplossen. In aanvulling, ze ontdekten dat het vooraf getrainde CNN-model een grote database naar zijn eigen database had overgebracht en dus met beperkte monsters kon worden getraind.

Het raamwerk van de voorgetrainde CNN. Krediet:Jie &Yongsheng.

De drie door Yongsheng en Jie voorgestelde CNN's voor FER kunnen tal van toepassingen hebben, bijvoorbeeld, helpen bij de ontwikkeling van robots die de gezichtsuitdrukkingen van mensen waarmee ze communiceren kunnen identificeren. De onderzoekers zijn nu van plan om hun modellen extra aan te passen, om hun prestaties verder te verbeteren.

"In ons toekomstige werk, we zullen proberen verschillende traditionele handmatige functies toe te voegen om lid te worden van de dual-branch CNN en de fusiemodus te wijzigen, "Zei Yongsheng. "We zullen ook cross-database trainingsnetwerkparameters gebruiken om betere generalisatiemogelijkheden te krijgen en een effectievere benadering van deep transfer learning toe te passen."

© 2019 Wetenschap X Netwerk