science >> Wetenschap >  >> Elektronica

3D-modellen van goedkope videocamera's

Krediet:Linköping Universitet

Hannes Ovrén laat in zijn proefschrift over computervisie aan de Universiteit van Linköping zien hoe 3D-modellen kunnen worden gemaakt van videofilms die zijn opgenomen met eenvoudige camera's op het lichaam of op een robot. Het onderzoek opent nieuwe mogelijkheden voor zowel robots als mensen, niet in de laatste plaats voor politie en reddingsdiensten.

Onderzoek naar computervisie is van grote betekenis voor de toekomst van kunstmatige intelligentie:autonome systemen zijn afhankelijk van het vermogen van robots en andere systemen om zich te oriënteren en objecten en mensen te ontdekken.

De bijdrage van Hannes Ovrén laat zien hoe je een 3D-model van de omgeving kunt maken, gebaseerd op videofilms die zijn gemaakt met een goedkope camera op het lichaam. Het model geeft schaal nauwkeurig weer, waardoor metingen kunnen worden gedaan.

"Momenteel, robots zien bewegen nogal voorzichtig, om bij te houden waar ze zijn. In sommige gevallen, ze moeten misschien zelfs stoppen om hun locatie te bepalen. Deze technologie stelt robots in staat om vrijer te bewegen en een model van de omgeving te construeren terwijl ze bewegen, " zegt Per-Erik Forssén, docent bij het Computer Vision Laboratory, en de belangrijkste supervisor van Hannes Ovrén.

Andere toepassingsgebieden zijn te vinden in, bijvoorbeeld, politiewerk of reddingswerk, waar personeel met een op het lichaam gemonteerde camera een plaats delict of een ongevalslocatie in drie dimensies kan nabootsen, met mensen en voorwerpen op de exacte locatie die ze hadden op het moment dat de foto werd genomen.

Krediet:Linköping Universitet

Het probleem met het maken van 3D-modellen van eenvoudige videocamera's was tot nu toe dat de camera stil moest staan, bij voorkeur op een statief gemonteerd. Als de camera beweegt, rechte objecten kunnen in het beeld gekromd lijken, of op verschillende hoogtes lijken te zijn. Objecten wiebelen, en een vervormd beeld wordt verkregen. Dit komt omdat goedkope camera's een type sluiter hebben dat bekend staat als een "rollende" sluiter, die de afbeelding rij voor rij in pixels opbouwt. Smartphones hebben dit type camera.

"Elk beeldframe bevat beweging, maar het is mogelijk om het beeld aanzienlijk te verbeteren door te modelleren hoe de camera is bewogen en de beweging te compenseren, ", zegt Hannes Ovrén.

Om te voorkomen dat de berekeningen te veeleisend worden, zijn methode creëert een curve, bekend als een "spline, " die beschrijft hoe de camera is bewogen. Deze curve is opgebouwd uit spline-knopen, waarbij elke knoop het uiterlijk van de curve op een bepaald tijdstip bepaalt. Als de knopen dichter worden geplaatst, de methode kan complexere bewegingen aan, maar de berekeningen worden veeleisender.

Hannes Ovrén laat in het proefschrift zien dat het mogelijk is om significant minder knopen te gebruiken wanneer de fouten die ontstaan ​​door het rechttrekken en afvlakken van de curve worden gemodelleerd. Om te voorkomen dat de fouten te groot worden, de methode maakt ook gebruik van een traagheidsmeeteenheid die aan de camera is bevestigd. Dit is een kleine en goedkope sensor die acceleratie volgt, hoeksnelheid en oriëntatie ten opzichte van de grond.

Het maken van een 3D-model. Krediet:Hannes Ovrén

"De metingen van de sensor worden meegenomen in de berekeningen en zo kunnen we de afstand tussen knopen vergroten, het verkleinen van de berekeningen, ", zegt Hannes Ovrén.

Door de vereenvoudiging zijn de beweging van de camera en de splinecurve niet precies hetzelfde. Het is mogelijk, echter, om te bepalen hoe het verschil in traject de omvang van meetfouten beïnvloedt, en vergroot op deze manier de betrouwbaarheid van het 3D-model en de afstanden daarin.