Wetenschap
Echte wereld, onbeperkte afbeeldingen zoals deze (a) worden gebruikt om gezichtsherkenningsnetwerken te trainen. Het testen voor het onderzoek werd gedaan op sterk gecontroleerde laserscangegevens die per gezichtspunt varieerden (b, kolommen), verlichting (b, rijen) en karikatuurachtige identiteitssterkte (c). Krediet:Universiteit van Texas in Dallas
De technologie voor gezichtsherkenning is de afgelopen vijf jaar snel vooruitgegaan. Terwijl onderzoekers van de Universiteit van Texas in Dallas proberen vast te stellen hoe computers zo goed zijn geworden als mensen, ze werpen ook licht op hoe het menselijk brein informatie sorteert.
Wetenschappers van UT Dallas hebben de prestaties geanalyseerd van het nieuwste echelon van gezichtsherkenningsalgoritmen, onthullen de verrassende manier waarop deze programma's - die zijn gebaseerd op machine learning - werken. hun studie, online gepubliceerd 12 november in Intelligentie van de natuurmachine , laat zien dat deze geavanceerde computerprogramma's - diepe convolutionele neurale netwerken (DCNN's) genoemd - erachter kwamen hoe gezichten anders konden worden geïdentificeerd dan de onderzoekers hadden verwacht.
"De laatste 30 jaar mensen hebben aangenomen dat computergebaseerde visuele systemen alle beeldspecifieke informatie kwijtraken - hoek, verlichting, uitdrukking enzovoort, " zei Dr. Alice O'Toole, senior auteur van de studie en de Aage en Margareta Møller Professor in de School of Behavioural and Brain Sciences. "In plaats daarvan, de algoritmen houden die informatie bij terwijl ze de identiteit belangrijker maken, dat is een fundamenteel nieuwe manier van denken over het probleem."
Bij machinaal leren, computers analyseren grote hoeveelheden data om patronen te leren herkennen, met als doel beslissingen te kunnen nemen met minimale menselijke inbreng. O'Toole zei dat de vooruitgang die is geboekt door machine learning voor gezichtsherkenning sinds 2014 "alles met grote sprongen heeft veranderd".
"Dingen die voorheen nooit haalbaar waren, die computer vision-technologie 30 jaar lang hebben belemmerd, werd niet alleen haalbaar, maar vrij eenvoudig, "Zei O'Toole. "Het addertje onder het gras is dat niemand begreep hoe het werkt."
Algoritmen van de vorige generatie waren effectief in het herkennen van gezichten die slechts kleine veranderingen hadden ondergaan ten opzichte van de afbeelding die ze al kenden. huidige technologie, echter, kent een identiteit goed genoeg om veranderingen in expressie te overwinnen, gezichtspunt of uiterlijk, zoals het verwijderen van een bril.
"Deze nieuwe algoritmen werken meer zoals jij en ik, "Zei O'Toole. "Dat komt deels omdat ze een enorme hoeveelheid ervaring hebben opgedaan met variaties in hoe één identiteit kan verschijnen. Maar dat is niet het hele plaatje."
Het team van O'Toole ging aan de slag om te leren hoe de leeralgoritmen werken - zowel om het vertrouwen dat in hun resultaten wordt gesteld te onderbouwen en, zoals hoofdauteur Matthew Hill uitlegde, om licht te werpen op hoe de visuele cortex van het menselijk brein dezelfde taak uitvoert.
"De structuur van dit type neuraal netwerk is oorspronkelijk geïnspireerd op hoe de hersenen visuele informatie verwerken, " zei Heuvel, een cognitie en neurowetenschappen doctoraatsstudent. "Omdat het uitblinkt in het oplossen van dezelfde problemen die de hersenen doen, het kan inzicht geven in hoe de hersenen het probleem oplossen."
De oorsprong van het type neuraal netwerkalgoritme dat het team bestudeerde dateert uit 1980, maar de kracht van neurale netwerken groeide meer dan 30 jaar later exponentieel.
"Begin dit decennium Er gebeurden twee dingen:het internet gaf dit programma miljoenen afbeeldingen en identiteiten om mee te werken - ongelooflijke hoeveelheden gemakkelijk beschikbare gegevens - en de rekenkracht groeide, zodat, in plaats van twee of drie lagen 'neuronen' in het neurale netwerk, je kunt meer dan 100 lagen hebben, zoals dit systeem nu doet, ' zei O'Toole.
Ondanks het beoogde doel van het algoritme, de schaal van zijn berekeningen - die op zijn minst in de tientallen miljoenen lopen - betekent dat wetenschappers niet alles kunnen begrijpen wat het doet.
"Hoewel het algoritme is ontworpen om het gedrag van neuronen in de hersenen te modelleren, we kunnen niet alles bijhouden tussen input en output, " zei Connor Parde, een auteur van het papier en een cognitie en neurowetenschappen doctoraatsstudent. "Dus we moeten ons onderzoek richten op de output."
Om de mogelijkheden van het algoritme te demonstreren, het team gebruikte karikaturen, extreme versies van een identiteit, welke Y. Ivette Colon BS'17, een onderzoeksassistent en een andere auteur van de studie, beschreven als "de meest 'jij'-versie van jou."
"Karikaturen overdrijven je unieke identiteit ten opzichte van die van anderen, ' zei O'Toole. 'In zekere zin, dat is precies wat het algoritme wil doen:benadrukken wat jou anders maakt dan alle anderen."
Tot verbazing van de onderzoekers de DCNN blonk eigenlijk uit in het verbinden van karikaturen met hun corresponderende identiteiten.
"Gezien deze vervormde beelden met buitenproportionele kenmerken, het netwerk begrijpt dat dit dezelfde kenmerken zijn die een identiteit onderscheidend maken en brengt de karikatuur correct in verband met de identiteit, "Zei O'Toole. "Het ziet die onderscheidende identiteit op manieren die niemand van ons had verwacht."
Dus, naarmate computersystemen gelijk beginnen te worden - en, soms, overtreffen - de gezichtsherkenningsprestaties van mensen, zou de basis van het algoritme voor het sorteren van informatie kunnen lijken op wat het menselijk brein doet?
Er achter komen, er is een beter begrip nodig van de menselijke visuele cortex. De meest gedetailleerde informatie die beschikbaar is, is via beelden verkregen via functionele MRI, die kan worden gebruikt om de activiteit van de hersenen in beeld te brengen terwijl een persoon een mentale taak uitvoert. Hill beschreef fMRI als "te luidruchtig" om de kleine details te zien.
"De resolutie van een fMRI is lang niet wat je nodig hebt om te zien wat er gebeurt met de activiteit van individuele neuronen, " zei Hill. "Met deze netwerken, je hebt elke berekening. Dat stelt ons in staat om ons af te vragen:kunnen identiteiten op deze manier in onze geest worden georganiseerd?"
O'Toole's lab zal die vraag als volgende aanpakken, dankzij een recente subsidie van meer dan $ 1,5 miljoen over vier jaar van het National Eye Institute of the National Institutes of Health.
"De NIH heeft ons belast met de biologische vraag:hoe relevant zijn deze resultaten voor de menselijke visuele waarneming?" ze zei. "We hebben vier jaar financiering om een antwoord te vinden."
Geïnspireerd door kombuchathee, ingenieurs creëren levende materialen
Blauw licht betekent grote vooruitgang voor op perovskiet gebaseerde leds
Onderzoekers bestudeerden de fabricage van polymere vezels voor gebruik in geavanceerde gezondheidszorg
Nieuwe hybride 3D-printtechniek voegt een vierde dimensie toe aan additive manufacturing
Hoog-entropie-gestabiliseerde chalcogeniden met hoge thermo-elektrische prestaties
Orkaan Genevieve teistert Mexicos Baja met wind en regen
Hoe slimme monitoring een stadsboerderij helpt floreren
Ammoniakuitstoot veroorzaakt waarschijnlijk geen extreme waas in China
De toekomst is nu:langetermijnonderzoek toont aan dat de verzuring van de oceaan op het Great Barrier Reef toeneemt
Maak een lijst van de top 5 van natuurlijke hulpbronnen
Parijs bindt Singapore, Hong Kong als duurste steden ter wereld
Nieuw efficiënt kwantumalgoritme overtreft de Quantum Phase Estimation-norm
Japan schort jaarlijkse financiering voor Hawaï-telescoopproject op
Het samenvoegen van geheugen en berekening, programmeerbare chipsnelheden AI, verlaagt stroomverbruik
Astrofysici brengen het babyuniversum in 3D in kaart en ontdekken 4, 000 vroege sterrenstelsels
Overwinning voor Amerikaanse astronauten op kritieke ruimtewandeling om powerbox te vervangen (update)
Een nieuwe kijk op planetaire klimaatregelingen
Hoe het volume van een Atom
Wetenschap © https://nl.scienceaq.com