science >> Wetenschap >  >> Elektronica

Deze AI-vogelaar laat je kijken door de ogen van een machine

Een team van Duke heeft een computer getraind om op basis van slechts een foto tot 200 soorten vogels te identificeren. Gegeven een foto van een mysterieuze vogel (boven), de AI spuugt warmtekaarten uit die laten zien welke delen van het beeld het meest lijken op typische soortenkenmerken die het eerder heeft gezien. Krediet:Duke University

Het kan jaren van vogelobservatie-ervaring kosten om de ene soort van de andere te onderscheiden. Maar met behulp van een kunstmatige-intelligentietechniek genaamd deep learning, Onderzoekers van de Duke University hebben een computer getraind om tot 200 soorten vogels te identificeren op basis van slechts een foto.

De echte innovatie, echter, is dat de A.I. tool toont ook zijn denken, op een manier die zelfs iemand die geen pinguïn van een papegaaiduiker kent, kan begrijpen.

Het team trainde hun diepe neurale netwerk - algoritmen gebaseerd op de manier waarop de hersenen werken - door het te voeden 11, 788 foto's van 200 vogelsoorten om van te leren, variërend van zwemmende eenden tot zwevende kolibries.

De onderzoekers hebben het netwerk nooit verteld "dit is een snavel" of "dit zijn vleugelveren". Gegeven een foto van een mysterieuze vogel, het netwerk is in staat om belangrijke patronen in de afbeelding te onderscheiden en een gok te wagen door die patronen te vergelijken met typische soortenkenmerken die het eerder heeft gezien.

Onderweg spuugt het een reeks hittekaarten uit die in wezen zeggen:"Dit is niet zomaar een grasmus. Het is een grasmus met een kap, en hier zijn de kenmerken - zoals zijn gemaskerde kop en gele buik - die hem verraden."

Duke computerwetenschappen Ph.D. student Chaofan Chen en student Oscar Li leidden het onderzoek, samen met andere teamleden van het Prediction Analysis Lab onder leiding van Duke-professor Cynthia Rudin.

Ze ontdekten dat hun neurale netwerk in staat is om tot 84% van de tijd de juiste soort te identificeren - vergelijkbaar met sommige van zijn best presterende tegenhangers, die niet onthullen hoe ze kunnen vertellen, zeggen, de ene mus van de andere.

Rudin zegt dat hun project over meer gaat dan het benoemen van vogels. Het gaat erom te visualiseren wat diepe neurale netwerken echt zien als ze naar een afbeelding kijken.

Soortgelijke technologie wordt gebruikt om mensen te taggen op sociale netwerksites, spot vermoedelijke criminelen in bewakingscamera's, en train zelfrijdende auto's om zaken als verkeerslichten en voetgangers te detecteren.

Het probleem, Rudin zegt, is dat de meeste deep learning-benaderingen van computervisie notoir ondoorzichtig zijn. In tegenstelling tot traditionele software, deep learning software leert van de data zonder expliciet geprogrammeerd te zijn. Als resultaat, hoe deze algoritmen precies 'denken' wanneer ze een afbeelding classificeren, is niet altijd duidelijk.

Rudin en haar collega's proberen aan te tonen dat A.I. hoeft niet zo te zijn. Zij en haar lab ontwerpen deep learning-modellen die de redenering achter hun voorspellingen verklaren, duidelijk maken waarom en hoe ze tot hun antwoorden kwamen. Als zo'n model een fout maakt, de ingebouwde transparantie maakt het mogelijk om te zien waarom.

Voor hun volgende project, Rudin en haar team gebruiken hun algoritme om verdachte gebieden te classificeren in medische beelden zoals mammogrammen. Als het werkt, hun systeem helpt artsen niet alleen om knobbeltjes op te sporen, verkalkingen en andere symptomen die kunnen wijzen op borstkanker. Het zal ook laten zien op welke delen van het mammogram het zich richt, onthullen welke specifieke kenmerken het meest lijken op de kankerachtige laesies die het eerder bij andere patiënten heeft gezien.

Op die manier, Rudin zegt, hun netwerk is ontworpen om de manier waarop artsen een diagnose stellen na te bootsen. "Het is zaakgebaseerd redeneren, " zei Rudin. "We hopen dat we artsen of patiënten beter kunnen uitleggen waarom hun beeld door het netwerk werd geclassificeerd als kwaadaardig of goedaardig."

Het team presenteert een paper over hun bevindingen op de drieëndertigste conferentie over neurale informatieverwerkingssystemen (NeurIPS 2019) in Vancouver op 12 december.