Science >> Wetenschap >  >> Elektronica

Uitleg:hoe computers gezichten en andere objecten "zien".

Computers kunnen gezichten en andere objecten 'zien' via een proces dat beeldherkenning wordt genoemd. Hierbij worden wiskundige technieken gebruikt om digitale beelden te analyseren en patronen en kenmerken daarin te identificeren.

Een veel voorkomende benadering van beeldherkenning is objectdetectie, waarbij specifieke objecten in een afbeelding worden geïdentificeerd. Dit gebeurt meestal met behulp van een techniek die convolutionele neurale netwerken (CNN's) wordt genoemd, een soort deep learning-algoritme dat specifiek is ontworpen om patronen in afbeeldingen te herkennen.

In een CNN wordt het beeld eerst opgedeeld in kleinere regio's, en elke regio wordt geanalyseerd door een reeks filters. Deze filters zijn ontworpen om specifieke kenmerken te identificeren, zoals randen, hoeken en texturen. De uitvoer van de filters wordt vervolgens door een reeks poolinglagen geleid, waardoor de dimensionaliteit van de gegevens wordt verminderd en het gemakkelijker wordt om patronen te identificeren.

Na de poolinglagen worden de gegevens door een volledig verbonden laag geleid, wat een traditionele neurale netwerklaag is die de kenmerken combineert die door de convolutionele lagen worden geïdentificeerd en het beeld classificeert. De uitvoer van de volledig verbonden laag is een vector van waarschijnlijkheden, die de waarschijnlijkheid aangeeft dat het beeld een specifiek object bevat.

Door CNN te trainen op een grote dataset van afbeeldingen die zijn gelabeld met de bijbehorende objecten, is het mogelijk om de computer te leren specifieke objecten in nieuwe afbeeldingen te herkennen.

Een andere benadering van beeldherkenning is gezichtsherkenning, waarbij specifieke gezichten binnen een afbeelding worden geïdentificeerd. Dit wordt meestal gedaan met behulp van een techniek genaamd Eigenfaces, waarbij een reeks basisafbeeldingen wordt gemaakt die de belangrijkste kenmerken van een gezicht vertegenwoordigen.

Om een ​​gezicht in een nieuw beeld te identificeren, wordt het beeld eerst op de basisbeelden geprojecteerd en wordt de resulterende vector vergeleken met de vectoren van bekende gezichten. Het gezicht met de meest vergelijkbare vector wordt vervolgens geïdentificeerd als de waarschijnlijke match.

Beeldherkenning is een zich snel ontwikkelend vakgebied en er worden voortdurend nieuwe technieken ontwikkeld om de nauwkeurigheid en efficiëntie van object- en gezichtsherkenning te verbeteren. Deze technieken worden gebruikt in een breed scala aan toepassingen, zoals beveiligingssystemen, medische beeldvorming en autonome voertuigen.