science >> Wetenschap >  >> Elektronica

Kaolin:de eerste uitgebreide bibliotheek voor 3-D deep learning-onderzoek

Kaolien toepassingen. Krediet:Murthy Jatavallabhula et al.

Aangezien de meeste omgevingen in de echte wereld driedimensionaal zijn, deep learning-modellen die zijn ontworpen om video's te analyseren of taken in echte omgevingen uit te voeren, moeten idealiter worden getraind op 3D-gegevens. Technologische hulpmiddelen zoals robots, zelfrijdende voertuigen, smartphones, en andere apparaten genereren momenteel een groeiende hoeveelheid 3D-gegevens die uiteindelijk kunnen worden verwerkt door deep learning-algoritmen.

Tot nu toe, echter, het trainen van deep learning-algoritmen op deze enorme hoeveelheid 3D-gegevens was relatief moeilijk, omdat de benodigde tools en platforms alleen toegankelijk zijn voor sommige kunstmatige intelligentie (AI)-onderzoekers. Om dit gebrek aan direct beschikbare tools aan te pakken, een team van onderzoekers van NVIDIA heeft onlangs Kaolin gemaakt, een PyTorch open-source bibliotheek gericht op het bevorderen en faciliteren van 3D deep learning onderzoek.

"Momenteel, er is geen enkele open-source softwarebibliotheek die meerdere representaties van 3D-gegevens ondersteunt, meerdere taken, en evaluatiecriteria, " Krishna Murthy Jatavallabhula, een van de onderzoekers die het onderzoek heeft uitgevoerd, vertelde TechXplore. "We besloten deze leemte in de literatuur aan te pakken door Kaolin te creëren, de eerste uitgebreide 3-D deep learning-bibliotheek."

Kaolien, de PyTorch-bibliotheek gepresenteerd door Jatavallabhula en zijn collega's, bevat een verscheidenheid aan tools voor het bouwen van deep learning-architecturen die 3D-gegevens kunnen analyseren, die zowel efficiënt als gebruiksvriendelijk zijn. Het stelt onderzoekers ook in staat om te laden, voorbewerken, en manipuleer 3D-gegevens voordat deze worden gebruikt om deep learning-algoritmen te trainen.

Kaolin bevat verschillende grafische modules om 3D-afbeeldingen te bewerken, met functies als renderen, verlichting, schaduw en verwringing van het zicht. Bovendien, het ondersteunt een breed scala aan verliesfuncties en evaluatiestatistieken, waardoor onderzoekers hun deep learning-algoritmen gemakkelijk kunnen evalueren.

Krediet:Murthy Jatavallabhula et al.

"Typisch, 3-D deep learning-onderzoekers moeten veel standaardcode schrijven voor hun onderzoeksprojecten, " legde Jatavallabhula uit. "Met kaolien, echter, onderzoekers hoeven alleen de nieuwe delen van hun project uit te voeren, aangezien Kaolin een uitgebreide set hulpprogramma's voor het laden van gegevens verpakt, conversie en evaluatie."

Kaolin is een waardevol hulpmiddel voor zowel ontwikkelaars die ervaring hebben met het ontwikkelen van deep learning-modellen als voor degenen die net beginnen. Binnen de bibliotheek, in feite, ontwikkelaars kunnen er ook verschillende state-of-the-art architecturen vinden die ze kunnen gebruiken als uitgangspunt of als inspiratiebron voor hun eigen modellen.

"Terwijl actieve 3-D deep learning-onderzoekers Kaolin zien als een middel om hun onderzoek te versnellen, nieuwkomers op dit gebied wenden zich tot Kaolin voor een idee van waar te beginnen, ' zei Jatavallabhula.

In de toekomst, de open-sourcebibliotheek die door deze onderzoekers bij NVIDIA wordt gepresenteerd, kan helpen om 3-D deep learning-onderzoek te versnellen, het assisteren van ontwikkelaars bij het creëren van nieuwe AI-architecturen, evenals bij het opleiden en evalueren ervan. In de tussentijd, Jatavallabhula en zijn collega's zijn van plan om Kaolin uit te breiden en de mogelijkheden ervan verder te vergroten.

"Ons plan is om meer deep learning-modellen toe te voegen aan onze modeldierentuin (verzameling AI-modellen) en onze dekking uit te breiden naar een bredere reeks toepassingen zoals zelfrijdende auto's en belichaamde agenten die 3D-leren nodig hebben, " zei Jatavallabhula. "Kortom, we zijn van plan om van Kaolin een one-stop-platform te maken voor 3-D deep learning-onderzoek."

© 2019 Wetenschap X Netwerk