Wetenschap
Echte wereld, onbeperkte afbeeldingen zoals deze (a) worden gebruikt om gezichtsherkenningsnetwerken te trainen. Het testen voor het onderzoek werd gedaan op sterk gecontroleerde laserscangegevens die per gezichtspunt varieerden (b, kolommen), verlichting (b, rijen) en karikatuurachtige identiteitssterkte (c). Krediet:Universiteit van Texas in Dallas
De technologie voor gezichtsherkenning is de afgelopen vijf jaar snel vooruitgegaan. Terwijl onderzoekers van de Universiteit van Texas in Dallas proberen vast te stellen hoe computers zo goed zijn geworden als mensen, ze werpen ook licht op hoe het menselijk brein informatie sorteert.
Wetenschappers van UT Dallas hebben de prestaties geanalyseerd van het nieuwste echelon van gezichtsherkenningsalgoritmen, onthullen de verrassende manier waarop deze programma's - die zijn gebaseerd op machine learning - werken. hun studie, online gepubliceerd 12 november in Intelligentie van de natuurmachine , laat zien dat deze geavanceerde computerprogramma's - diepe convolutionele neurale netwerken (DCNN's) genoemd - erachter kwamen hoe gezichten anders konden worden geïdentificeerd dan de onderzoekers hadden verwacht.
"De laatste 30 jaar mensen hebben aangenomen dat computergebaseerde visuele systemen alle beeldspecifieke informatie kwijtraken - hoek, verlichting, uitdrukking enzovoort, " zei Dr. Alice O'Toole, senior auteur van de studie en de Aage en Margareta Møller Professor in de School of Behavioural and Brain Sciences. "In plaats daarvan, de algoritmen houden die informatie bij terwijl ze de identiteit belangrijker maken, dat is een fundamenteel nieuwe manier van denken over het probleem."
Bij machinaal leren, computers analyseren grote hoeveelheden data om patronen te leren herkennen, met als doel beslissingen te kunnen nemen met minimale menselijke inbreng. O'Toole zei dat de vooruitgang die is geboekt door machine learning voor gezichtsherkenning sinds 2014 "alles met grote sprongen heeft veranderd".
"Dingen die voorheen nooit haalbaar waren, die computer vision-technologie 30 jaar lang hebben belemmerd, werd niet alleen haalbaar, maar vrij eenvoudig, "Zei O'Toole. "Het addertje onder het gras is dat niemand begreep hoe het werkt."
Algoritmen van de vorige generatie waren effectief in het herkennen van gezichten die slechts kleine veranderingen hadden ondergaan ten opzichte van de afbeelding die ze al kenden. huidige technologie, echter, kent een identiteit goed genoeg om veranderingen in expressie te overwinnen, gezichtspunt of uiterlijk, zoals het verwijderen van een bril.
"Deze nieuwe algoritmen werken meer zoals jij en ik, "Zei O'Toole. "Dat komt deels omdat ze een enorme hoeveelheid ervaring hebben opgedaan met variaties in hoe één identiteit kan verschijnen. Maar dat is niet het hele plaatje."
Het team van O'Toole ging aan de slag om te leren hoe de leeralgoritmen werken - zowel om het vertrouwen dat in hun resultaten wordt gesteld te onderbouwen en, zoals hoofdauteur Matthew Hill uitlegde, om licht te werpen op hoe de visuele cortex van het menselijk brein dezelfde taak uitvoert.
"De structuur van dit type neuraal netwerk is oorspronkelijk geïnspireerd op hoe de hersenen visuele informatie verwerken, " zei Heuvel, een cognitie en neurowetenschappen doctoraatsstudent. "Omdat het uitblinkt in het oplossen van dezelfde problemen die de hersenen doen, het kan inzicht geven in hoe de hersenen het probleem oplossen."
De oorsprong van het type neuraal netwerkalgoritme dat het team bestudeerde dateert uit 1980, maar de kracht van neurale netwerken groeide meer dan 30 jaar later exponentieel.
"Begin dit decennium Er gebeurden twee dingen:het internet gaf dit programma miljoenen afbeeldingen en identiteiten om mee te werken - ongelooflijke hoeveelheden gemakkelijk beschikbare gegevens - en de rekenkracht groeide, zodat, in plaats van twee of drie lagen 'neuronen' in het neurale netwerk, je kunt meer dan 100 lagen hebben, zoals dit systeem nu doet, ' zei O'Toole.
Ondanks het beoogde doel van het algoritme, de schaal van zijn berekeningen - die op zijn minst in de tientallen miljoenen lopen - betekent dat wetenschappers niet alles kunnen begrijpen wat het doet.
"Hoewel het algoritme is ontworpen om het gedrag van neuronen in de hersenen te modelleren, we kunnen niet alles bijhouden tussen input en output, " zei Connor Parde, een auteur van het papier en een cognitie en neurowetenschappen doctoraatsstudent. "Dus we moeten ons onderzoek richten op de output."
Om de mogelijkheden van het algoritme te demonstreren, het team gebruikte karikaturen, extreme versies van een identiteit, welke Y. Ivette Colon BS'17, een onderzoeksassistent en een andere auteur van de studie, beschreven als "de meest 'jij'-versie van jou."
"Karikaturen overdrijven je unieke identiteit ten opzichte van die van anderen, ' zei O'Toole. 'In zekere zin, dat is precies wat het algoritme wil doen:benadrukken wat jou anders maakt dan alle anderen."
Tot verbazing van de onderzoekers de DCNN blonk eigenlijk uit in het verbinden van karikaturen met hun corresponderende identiteiten.
"Gezien deze vervormde beelden met buitenproportionele kenmerken, het netwerk begrijpt dat dit dezelfde kenmerken zijn die een identiteit onderscheidend maken en brengt de karikatuur correct in verband met de identiteit, "Zei O'Toole. "Het ziet die onderscheidende identiteit op manieren die niemand van ons had verwacht."
Dus, naarmate computersystemen gelijk beginnen te worden - en, soms, overtreffen - de gezichtsherkenningsprestaties van mensen, zou de basis van het algoritme voor het sorteren van informatie kunnen lijken op wat het menselijk brein doet?
Er achter komen, er is een beter begrip nodig van de menselijke visuele cortex. De meest gedetailleerde informatie die beschikbaar is, is via beelden verkregen via functionele MRI, die kan worden gebruikt om de activiteit van de hersenen in beeld te brengen terwijl een persoon een mentale taak uitvoert. Hill beschreef fMRI als "te luidruchtig" om de kleine details te zien.
"De resolutie van een fMRI is lang niet wat je nodig hebt om te zien wat er gebeurt met de activiteit van individuele neuronen, " zei Hill. "Met deze netwerken, je hebt elke berekening. Dat stelt ons in staat om ons af te vragen:kunnen identiteiten op deze manier in onze geest worden georganiseerd?"
O'Toole's lab zal die vraag als volgende aanpakken, dankzij een recente subsidie van meer dan $ 1,5 miljoen over vier jaar van het National Eye Institute of the National Institutes of Health.
"De NIH heeft ons belast met de biologische vraag:hoe relevant zijn deze resultaten voor de menselijke visuele waarneming?" ze zei. "We hebben vier jaar financiering om een antwoord te vinden."
Wetenschap © https://nl.scienceaq.com