Wetenschap
Tegoed:CC0 Publiek Domein
Onderzoekers van de HSE University en de Polytechnische Universiteit van Moskou hebben ontdekt dat AI-modellen geen kenmerken van het menselijk gezichtsvermogen kunnen weergeven vanwege een gebrek aan nauwe koppeling met de respectievelijke fysiologie, dus zijn ze slechter in het herkennen van beelden. De resultaten van het onderzoek zijn gepubliceerd in de Proceedings of the Seventh International Congress on Information and Communication Technology .
Om te begrijpen hoe machinale perceptie van afbeeldingen verschilt van menselijke perceptie, hebben wetenschappers afbeeldingen van klassieke visuele illusies geüpload naar de online service IBM Watson Visual Recognition. De meeste waren geometrische silhouetten, gedeeltelijk verborgen door geometrische vormen van de achtergrondkleur. Het systeem probeerde de aard van het beeld te bepalen en gaf de mate van zekerheid aan in zijn reactie.
Het bleek dat kunstmatige intelligentie geen enkele denkbeeldige figuur kan herkennen, met uitzondering van een gekleurde denkbeeldige driehoek. Door het hoge contrast met de achtergrond werd deze correct herkend.
"Objecten die vergelijkbaar zijn met die we tijdens het experiment hebben gebruikt, kunnen in het echte leven worden gevonden", zegt Vladimir Vinnikov, een analist bij het Laboratory of Methods for Big Data-analyse van de HSE-faculteit Computerwetenschappen en auteur van het onderzoek. "De automatische piloot van een auto of vliegtuig neemt bijvoorbeeld een aanhangwagen of een radiotoren waar, die 's nachts alleen wordt aangegeven door markeringslichten, op dezelfde manier als we denkbeeldige geometrische vormen waarnemen."
Het menselijk oog is voortdurend onwillekeurig in beweging en het lichtgevoelige oppervlak van zijn netvlies heeft de vorm van een halve bol. Een persoon kan een illusie zien als het beeld een vector is, d.w.z. als het referentiepunten en krommen bevat die ze verbinden. De menselijke verbeelding zal het plaatje compleet maken dankzij constante oogbewegingen, een fysiologisch kenmerk van onze visie.
In opto-elektronische systemen is alles anders geregeld. Hun lichtgevoelige matrix heeft een platte, meestal rechthoekige vorm en het lenssysteem zelf is lang niet zo vrij in beweging als het menselijk oog. Daarom kan kunstmatige intelligentie geen denkbeeldige lijnen voltooien die fragmenten van een geometrische illusie met elkaar verbinden. Machine vision ziet alleen wat werkelijk wordt afgebeeld, terwijl mensen het beeld in hun verbeelding voltooien op basis van de contouren.
Tegenwoordig verspreiden neurale netwerkbeeldherkenningssystemen zich actief in de commerciële sector. De vraag hoe nauwkeurig machines afbeeldingen herkennen, is echter nog steeds een open vraag. Mensenlevens kunnen afhangen van de nauwkeurigheid van herkenning. Er kan bijvoorbeeld een ongeluk gebeuren als de stuurautomaat van een auto of vliegtuig een object met een laag contrast ten opzichte van de achtergrond niet herkent en niet op tijd een obstakel kan ontwijken.
Wetenschappers zijn van mening dat onnauwkeurigheid van machine-beeldherkenning kan worden gecorrigeerd. Ze kunnen bijvoorbeeld de herkenning van rasterafbeeldingen, die een raster van pixels vertegenwoordigen, aanvullen door fysiologische kenmerken van oogbewegingen te simuleren waardoor het oog tweedimensionale en driedimensionale scènes kan zien. Een alternatieve manier is om een vectorbeschrijving van de afbeeldingen toe te voegen, waardoor de machine kan worden geprogrammeerd om de afbeelding te omzeilen langs de banen die door de vectoren zijn gespecificeerd.
"Imaginaire objecten moeten zeker worden gebruikt als tests in systemen die afhankelijk zijn van de herkenning van foto- en videostreams, bijvoorbeeld in stuurautomaten van auto's of drones. Dit zal helpen om de risico's te vermijden die gepaard gaan met het gebruik van machine-intelligentiesystemen in de industrie en transportsystemen", zegt Vinnikov. + Verder verkennen
Wetenschap © https://nl.scienceaq.com