science >> Wetenschap >  >> Elektronica

De leeftijd van mensen schatten met behulp van convolutionele neurale netwerken

Een diagram van het voorgestelde systeem voor leeftijdsschatting. Krediet:Agbo-Ajala &Viriri.

De afgelopen jaren is onderzoekers hebben een groeiend aantal op machine learning (ML) gebaseerde gezichtsherkenningstechnieken ontwikkeld, die tal van interessante toepassingen kunnen hebben, bijvoorbeeld, het verbeteren van bewakingsbewaking, veiligheidscontrole, en mogelijk zelfs forensische kunst. Naast gezichtsherkenning, verbeteringen in ML hebben ook de ontwikkeling mogelijk gemaakt van tools om specifieke kwaliteiten te voorspellen of te schatten (bijv. geslacht of leeftijd) van een persoon door afbeeldingen van hun gezichten te analyseren.

In een recente studie, onderzoekers van de Universiteit van Kwazulu-Natal, in Zuid Afrika, ontwikkelde een op machine learning gebaseerd model om de leeftijd van mensen te schatten door afbeeldingen van hun gezichten te analyseren die in willekeurige, levensechte omgevingen zijn genomen. Deze nieuwe architectuur werd geïntroduceerd in een paper gepubliceerd door Spinger en enkele dagen geleden gepresenteerd op de International Conference on Computational Collective Intelligence (ICCCI) 2019.

De meeste traditionele benaderingen voor leeftijdsclassificatie presteren alleen goed bij het analyseren van gezichtsbeelden die zijn genomen in gecontroleerde omgevingen, bijvoorbeeld, in het lab of in fotostudio's. Anderzijds, zeer weinig van hen zijn in staat om de leeftijd van mensen in te schatten op foto's die in echte alledaagse situaties zijn gemaakt.

"Deep learning-methoden hebben bewezen effectief te zijn bij het oplossen van dit probleem, vooral met de beschikbaarheid van zowel een grote hoeveelheid gegevens voor training als high-end machines, schreven de onderzoekers in hun paper. Met het oog hierop, we stellen een diepgaande leeroplossing voor om de leeftijd te schatten op basis van echte gezichten."

Het team van onderzoekers van de Universiteit van Kwazulu-Natal ontwikkelde een op diepe convolutionele neurale netwerk (CNN) gebaseerde architectuur met zes lagen. Hun model is getraind om de leeftijd van individuen te schatten op basis van afbeeldingen van gezichten die in ongecontroleerde omgevingen zijn genomen. De architectuur bereikt dit door te leren welke gezichtsrepresentaties het meest cruciaal zijn voor leeftijdsschatting en door zich te concentreren op deze specifieke kenmerken.

De beeldvoorbewerkingsfase. Krediet:Agbo-Ajala &Viriri.

Om de prestaties van hun op CNN gebaseerde model te verbeteren, de onderzoekers trainden het voor op een grote dataset genaamd IMDB-WIKI, die meer dan een half miljoen afbeeldingen van gezichten bevat, afkomstig van IMDB en Wikipedia, gelabeld met de leeftijd van elk onderwerp. Door deze initiële training konden ze hun architectuur aanpassen aan de beeldinhoud.

Vervolgens, de onderzoekers stemden het model af met behulp van afbeeldingen uit nog twee andere databases, namelijk MORPH-II en OUI-Adience, het trainen om eigenaardigheden en verschillen op te pikken. MORPH-II bevat ongeveer 70, 000 gelabelde afbeeldingen van gezichten, terwijl OUI-Adience 26 bevat, 580 gezichtsfoto's gemaakt in ideale levensechte omgevingen.

Toen ze hun model evalueerden op foto's die in ongecontroleerde omgevingen waren genomen, de onderzoekers ontdekten dat deze uitgebreide training tot opmerkelijke prestaties leidde. Hun model behaalde state-of-the-art resultaten, beter presteren dan verschillende andere op CNN gebaseerde methoden voor leeftijdsschatting.

"Onze experimenten demonstreren de effectiviteit van onze methode voor leeftijdsschatting in het wild wanneer geëvalueerd op de OUI-Adience-benchmark, waarvan bekend is dat het afbeeldingen van gezichten bevat die zijn verkregen in ideale en onbeperkte omstandigheden, " schreven de onderzoekers. "De voorgestelde leeftijdsclassificatiemethode behaalt nieuwe state-of-the-art resultaten, met een verbetering in nauwkeurigheid van 8,6 procent (exact) en 3,4 procent (eenmalig) ten opzichte van het best gerapporteerde resultaat op de OUI-Adience-dataset."

In de toekomst, de nieuwe op CNN gebaseerde architectuur die door deze onderzoekers is ontwikkeld, zou effectievere implementaties van leeftijdsschattingen in verschillende real-life omgevingen mogelijk maken. Het team is ook van plan om lagen aan het model toe te voegen en het te trainen op andere datasets van gezichtsafbeeldingen die in ongecontroleerde omgevingen zijn gemaakt, zodra ze beschikbaar zijn. om zijn prestaties verder te verbeteren.

© 2019 Wetenschap X Netwerk