science >> Wetenschap >  >> Elektronica

Nieuw programma kiest snel en efficiënt doelen in een menigte

Krediet:CC0 Publiek Domein

Het kan voor computers moeilijker zijn om Waldo te vinden, een ongrijpbaar personage dat zich verbergt in menigten in een populaire kinderboekenreeks, dan voor mensen.

Nutsvoorzieningen, een A*STAR-onderzoeker en haar collega's hebben een biologisch geïnspireerd programma ontwikkeld waarmee computers echte Waldos en andere doelen efficiënter kunnen identificeren.

Computerbeeldanalyse wordt routinematig gebruikt in de geneeskunde, veiligheid, en redden. Snelheid is vaak cruciaal bij deze inspanningen, zegt Mengmi Zhang, een computerwetenschapper bij A*STAR's Institute for Infocomm Research, die de studie leidde. Ze noemt het gebruik van computers om slachtoffers van natuurrampen te vinden, zoals aardbevingen.

Maar deze inspanningen worden vaak belemmerd omdat computers geen menselijke intuïtie hebben. Een persoon kan snel een hond spotten in een drukke ruimte, bijvoorbeeld, zelfs als ze die specifieke hond nog nooit eerder hebben gezien. Een computer, daarentegen, moet worden getraind met behulp van duizenden afbeeldingen van verschillende honden, en zelfs dan, ze kunnen haperen bij het zoeken naar een nieuwe hond waarvan ze het beeld nog niet eerder zijn tegengekomen.

Deze zwakte kan met name problematisch zijn bij het scannen naar wapens, zegt Zhang. Een computer die getraind is om messen en geweren te zoeken, kan een ander scherp voorwerp over het hoofd zien. "Als er één scherpe metalen stok is die niet in de trainingsset is gezien, het betekent niet dat de passagier het aan boord van het vliegtuig moet kunnen nemen, " zegt Zhang.

Huidige computerzoekopdrachten zijn ook vaak traag omdat de computer elk deel van een afbeelding in volgorde moet scannen, evenveel aandacht besteden aan elk onderdeel. mensen, echter, snel hun aandacht verschuiven tussen verschillende locaties in een afbeelding om hun doel te vinden. Zhang en haar collega's wilden begrijpen hoe mensen dit zo efficiënt doen. Ze presenteerden 45 mensen met overvolle beelden en vroegen hen om op jacht te gaan naar een doelwit, zeggen, een schaap. Ze keken hoe de ogen van de proefpersonen over het tafereel schoten, kort fixeren op verschillende locaties in het beeld. Ze vonden dat, gemiddeld, mensen konden de schapen in ongeveer 640 milliseconden lokaliseren. Dit kwam overeen met het veranderen van de locatie van hun blik, gemiddeld, iets meer dan twee en een half keer.

Het team ontwikkelde vervolgens een computermodel om deze meer mensachtige zoekstrategie in de jacht op een hond te implementeren. In plaats van te zoeken naar een doelwit dat identiek was aan een vooraf gegeven afbeelding van een hond, het model werd getraind om te zoeken naar iets dat vergelijkbare kenmerken had als de voorbeeldafbeelding. Hierdoor kon het model generaliseren op basis van een enkel hondenbeeld, aan het "algemene concept van een hond, " en snel andere honden uitkiezen die hij nog niet eerder had gezien, legt Zhang uit.

De onderzoekers testten hoe effectief het nieuwe visuele zoekmodel van de computer was door te meten hoe vaak de computer zich op verschillende locaties in een scène moest fixeren voordat hij zijn doelwit vond. "Wat ons verbaast, is dat door onze methode te gebruiken, computers kunnen net zo snel afbeeldingen zoeken als mensen, zelfs bij het zoeken naar objecten die ze nog nooit eerder hebben gezien, " zegt Zhang. De computer was zelfs zo goed als mensen in het vinden van Waldo.

Het team programmeert nu hun model met een beter begrip van de context. Bijvoorbeeld, mensen begrijpen van nature dat een kopje eerder op een tafel staat dan in de lucht zweeft. Eenmaal geïmplementeerd, dit zou de efficiëntie van het model nog verder moeten verbeteren, zegt Zhang, toevoegen, 'Waldo kan zich niet meer verstoppen.'