science >> Wetenschap >  >> Elektronica

Onderzoek toont aan dat gezichtsherkenningsexperts beter presteren met AI als partner

Tonen deze twee gezichten dezelfde persoon? Opgeleide specialisten, forensische gezichtsonderzoekers genaamd, getuigen over dergelijke vragen in de rechtbank. Een NIST-studie die hun nauwkeurigheid meet, onthult voor het eerst de wetenschap achter hun werk. Krediet:J. Stoughton/NIST

Experts in het herkennen van gezichten spelen vaak een cruciale rol in strafzaken. Een foto van een beveiligingscamera kan voor een verdachte gevangenisstraf of vrijheid betekenen - en getuigenissen van hoog opgeleide forensische gezichtsexaminatoren laten de jury weten of die afbeelding de beschuldigde daadwerkelijk weergeeft. Hoe goed zijn gezichtsherkenningsexperts eigenlijk? Zou kunstmatige intelligentie helpen?

Een studie die vandaag verschijnt in de Proceedings van de National Academy of Sciences antwoorden heeft gebracht. In werk dat forensische wetenschap combineert met psychologie en computervisieonderzoek, een team van wetenschappers van het National Institute of Standards and Technology (NIST) en drie universiteiten heeft de nauwkeurigheid van professionele gezichtsherkenningsmiddelen getest, ten minste één onthulling die zelfs de onderzoekers verraste:getrainde mensen presteren het beste met een computer als partner, niet een ander persoon.

"Dit is de eerste studie die de nauwkeurigheid van gezichtsidentificatie meet voor professionele forensische gezichtsonderzoekers, werken onder omstandigheden die van toepassing zijn in de praktijk, "Zei NIST-elektronisch ingenieur P. Jonathon Phillips. "Ons diepere doel was om betere manieren te vinden om de nauwkeurigheid van forensische gezichtsvergelijkingen te vergroten."

De inspanning van het team begon als reactie op een rapport uit 2009 van de National Research Council, "Versterking van de forensische wetenschap in de Verenigde Staten:een pad voorwaarts", wat de noodzaak onderstreepte om de nauwkeurigheid van beslissingen van forensische onderzoekers te meten.

De NIST-studie is het meest uitgebreide onderzoek tot nu toe van gezichtsidentificatieprestaties in een groot, gevarieerde groep mensen. De studie onderzoekt ook de beste technologie, het vergelijken van de nauwkeurigheid van state-of-the-art gezichtsherkenningsalgoritmen met menselijke experts.

Hun resultaat van deze klassieke confrontatie van mens versus machine? Geen van beide krijgt de beste resultaten alleen. Met een samenwerking tussen de twee werd maximale nauwkeurigheid bereikt.

"Samenlevingen vertrouwen op de expertise en opleiding van professionele forensische gezichtsonderzoekers, omdat men denkt dat hun oordeel het beste is, " zei co-auteur Alice O'Toole, een professor in de cognitieve wetenschappen aan de Universiteit van Texas in Dallas. "Echter, we hebben geleerd dat om de meest nauwkeurige gezichtsidentificatie te krijgen, we moeten de krachten van mens en machine combineren."

De resultaten komen op een tijdig moment in de ontwikkeling van gezichtsherkenningstechnologie, die al tientallen jaren vooruitgaat, maar heeft pas zeer recent competentie verworven die die van best presterende mensen benadert.

"Als we deze studie drie jaar geleden hadden gedaan, de prestaties van het beste computeralgoritme zouden vergelijkbaar zijn geweest met die van een gemiddelde ongetrainde student, ' zei Phillips. 'Tegenwoordig state-of-the-art algoritmen presteren net zo goed als een hoog opgeleide professional."

Bij het onderzoek zelf waren in totaal 184 deelnemers betrokken, een groot aantal voor een experiment van dit type. Zevenentachtig werden getrainde professionele gezichtsonderzoekers, terwijl 13 "superherkenners waren, " een term die een uitzonderlijk natuurlijk vermogen impliceert. De overige 84 - de controlegroepen - omvatten 53 vingerafdrukonderzoekers en 31 niet-gegradueerde studenten, geen van hen had training in gezichtsvergelijkingen.

Voor de test, de deelnemers ontvingen 20 paar gezichtsafbeeldingen en beoordeelden de waarschijnlijkheid dat elk paar dezelfde persoon is op een zevenpuntsschaal. Het onderzoeksteam heeft opzettelijk extreem uitdagende paren geselecteerd, het gebruik van beelden die zijn gemaakt met beperkte controle over de verlichting, expressie en uitstraling. Vervolgens testten ze vier van de nieuwste geautomatiseerde gezichtsherkenningsalgoritmen, allemaal ontwikkeld tussen 2015 en 2017, dezelfde beeldparen gebruiken.

Drie van de algoritmen zijn ontwikkeld door Rama Chellappa, een professor in elektrische en computertechniek aan de Universiteit van Maryland, en zijn team, die hebben meegewerkt aan het onderzoek. De algoritmen zijn getraind om in algemene gezichtsherkenningssituaties te werken en werden zonder wijziging toegepast op de afbeeldingensets.

Een van de bevindingen was niet verrassend maar belangrijk voor het rechtssysteem:de getrainde professionals deden het significant beter dan de ongetrainde controlegroepen. Dit resultaat bevestigde het superieure vermogen van de getrainde examinatoren, daarmee voor de eerste keer een wetenschappelijke basis voor hun getuigenis in de rechtbank.

De algoritmen hebben zichzelf ook goed vrijgesproken, zoals mag worden verwacht van de gestage verbetering van de prestaties van algoritmen in de afgelopen jaren.

Wat de collectieve wenkbrauwen van het team deed fronsen, betreft de prestaties van meerdere examinatoren. Het team ontdekte dat het combineren van de meningen van meerdere forensische gezichtsonderzoekers niet de meest nauwkeurige resultaten opleverde.

"Onze gegevens laten zien dat de beste resultaten komen van een enkele gezichtsonderzoeker die werkt met een enkel best presterend algoritme, "Zei Phillips. "Hoewel het combineren van twee menselijke onderzoekers de nauwkeurigheid verbetert, het is niet zo goed als het combineren van één examinator en het beste algoritme."

Het combineren van examinatoren en AI wordt momenteel niet gebruikt in forensisch onderzoek in de echte wereld. Hoewel deze studie deze fusie van examinatoren en AI niet expliciet testte in een dergelijke operationele forensische omgeving, resultaten bieden een routekaart voor het verbeteren van de nauwkeurigheid van gezichtsidentificatie in toekomstige systemen.

Hoewel het driejarige project heeft aangetoond dat mensen en algoritmen verschillende benaderingen gebruiken om gezichten te vergelijken, het stelt andere wetenschappers een prikkelende vraag:wat is het onderliggende onderscheid tussen de menselijke en de algoritmische benadering?

"Als het combineren van beslissingen uit twee bronnen de nauwkeurigheid verhoogt, dan toont deze methode het bestaan ​​van verschillende strategieën aan, "Zei Phillips. "Maar het verklaart niet hoe de strategieën verschillen."