science >> Wetenschap >  >> Elektronica

Neurale netwerken hebben geleerd soortgelijke objecten op video's te herkennen zonder verslechtering van de nauwkeurigheid

AI zal dienen om een ​​netwerkcontrolesysteem te ontwikkelen dat niet alleen problemen detecteert en erop reageert, maar ze ook kan voorspellen en vermijden. Krediet:CC0 Publiek Domein

Andrey Savchenko, Hoogleraar aan de Hogere School of Economics (HSE University), heeft een methode ontwikkeld die kan helpen de beeldidentificatie op video's te verbeteren. In zijn project een netwerk is aangeleerd door een nieuw algoritme en kan nu 10 keer sneller beslissingen nemen over beeldherkenning en classificatie dan voorheen. Dit onderzoek werd gepresenteerd in het artikel "Sequentiële driewegbeslissingen in beeldherkenning met meerdere categorieën met diepe kenmerken op basis van afstandsfactor", gepubliceerd in Informatiewetenschappen .

Neurale netwerken hebben lang geleden geleerd om mensen en dieren te identificeren in video's. Kunstmatige neuronen kunnen leren door te onthouden hoe een bepaald object eruitziet in een afbeelding. Gebruikelijk, onderzoekers nemen een open database met foto's (bijv. ImageNet, plaatsen, etc.) en gebruik het om een ​​neuraal netwerk aan te leren. Om het besluitvormingsproces te versnellen, ons algoritme is ingesteld om slechts enkele van de voorbeeldafbeeldingen te kiezen, of focus op een beperkt aantal eigenschappen. Er kunnen complicaties optreden wanneer objecten van verschillende klassen op dezelfde foto staan, en er zijn slechts een klein aantal trainingsvoorbeelden voor elke categorie.

Het nieuwe algoritme kan nu afbeeldingen herkennen zonder significante verslechtering van de nauwkeurigheid door de toepassing van een sequentiële drieweg-besluitvormingsmethode. Door deze aanpak toe te passen, een neuraal netwerk kan eenvoudige afbeeldingen op één manier analyseren voor duidelijk herkenbare objecten, terwijl moeilijk te identificeren objecten nader kunnen worden onderzocht.

"Elke foto kan worden beschreven door letterlijk duizenden kenmerken. Dus, het zou niet veel zin hebben om alle kenmerken van een bepaald invoerbeeld te vergelijken met die van een basistrainingsvoorbeeld, aangezien de meeste monsters niet vergelijkbaar zouden zijn met het geanalyseerde beeld. Dus, we vergeleken aanvankelijk slechts enkele van de belangrijke functies, en leg de trainingsinstanties opzij, die uiteraard niet als definitieve oplossingen kunnen worden behandeld. Als resultaat, de trainingssteekproef wordt kleiner en er zijn nog maar een paar voorbeelden over. In de volgende fase, we zouden het aantal functies voor de resterende afbeeldingen vergroten, en herhaal dit proces totdat er nog maar één klas over is, " merkte prof. Savchenko op.

Deze aanpak verkortte de tijd voor herkenning met 1,5 tot 10 keer, in vergelijking met reguliere classifiers en bekende sequentiële driewegbeslissingen met meerdere categorieën. Als resultaat, deze technologie zou in de toekomst kunnen worden gebruikt op mobiele apparaten en andere basisgadgets.