Wetenschap
Martin Schrimpf. Krediet:Kris Brewer
Als we 's ochtends onze ogen openen en die eerste scène van de dag in ons opnemen, we denken niet veel na over het feit dat ons brein de objecten binnen ons gezichtsveld met grote efficiëntie verwerkt en dat het een gebrek aan informatie over onze omgeving compenseert - allemaal om ons in staat te stellen onze dagelijkse functies. Het glas water dat je op het nachtkastje hebt achtergelaten toen je je klaarmaakte om naar bed te gaan, wordt nu gedeeltelijk geblokkeerd door je wekker, toch weet je dat het een glas is.
Dit schijnbaar eenvoudige vermogen van mensen om gedeeltelijk afgesloten objecten te herkennen - in deze situatie gedefinieerd als het effect van een object in een 3D-ruimte dat een ander object uit het zicht blokkeert - is een gecompliceerd probleem geweest voor de computervisiegemeenschap. Martin Schrimpf, een afgestudeerde student in het DiCarlo-lab in de afdeling Hersenen en Cognitieve Wetenschappen aan het MIT, legt uit dat machines steeds bedrevener zijn geworden in het snel en zelfverzekerd herkennen van hele items, maar als iets een deel van dat item aan het zicht onttrekt, deze taak wordt steeds moeilijker voor de modellen om het artikel nauwkeurig te herkennen.
"Voor modellen van computervisie tot functie in het dagelijks leven, ze moeten in staat zijn om verstopte objecten net zo goed te verteren als hele - per slot van rekening als je om je heen kijkt, de meeste objecten zijn gedeeltelijk verborgen achter een ander object, " zegt Schrimpf, co-auteur van een artikel over het onderwerp dat onlangs is gepubliceerd in de Proceedings van de National Academy of Sciences ( PNAS ).
In de nieuwe studie hij zegt, "We groeven in de onderliggende berekeningen in de hersenen en gebruikten onze bevindingen om computermodellen te bouwen. Door visuele verwerking in het menselijk brein te recapituleren, we hopen dus ook modellen in computervisie te verbeteren."
Hoe zijn wij als mensen in staat om deze alledaagse taak herhaaldelijk uit te voeren zonder veel aandacht en energie in deze actie te steken, hele scènes snel en nauwkeurig identificeren nadat je alleen stukjes hebt gezien? Onderzoekers in de studie begonnen met de menselijke visuele cortex als een model voor het verbeteren van de prestaties van machines in deze omgeving, zegt Gabriël Kreiman, een filiaal van het MIT Center for Brains, geesten, en Machines. Kreinman is hoogleraar oogheelkunde aan het Boston Children's Hospital en de Harvard Medical School en was hoofdonderzoeker voor het onderzoek.
In hun krant "Terugkerende berekeningen voor het voltooien van visuele patronen, " het team liet zien hoe ze een rekenmodel ontwikkelden, geïnspireerd door fysiologische en anatomische beperkingen, die in staat was om de gedrags- en neurofysiologische observaties vast te leggen tijdens het voltooien van het patroon. Uiteindelijk, het model verschafte nuttige inzichten om te begrijpen hoe conclusies te trekken uit minimale informatie.
Dit verhaal is opnieuw gepubliceerd met dank aan MIT News (web.mit.edu/newsoffice/), een populaire site met nieuws over MIT-onderzoek, innovatie en onderwijs.
Wetenschap © https://nl.scienceaq.com