science >> Wetenschap >  >> Biologie

Kunstmatige neurale netwerken kunnen het beheer van natuurhistorische collecties stimuleren

Smithsonian-onderzoekers classificeren gedigitaliseerde herbariumvellen die zijn gekleurd met kwik om een ​​trainingsdataset te bouwen. Krediet:Paul B. Frandsen, Smithsonian

miljoenen, zo niet miljarden, van de exemplaren bevinden zich in de natuurhistorische collecties van de wereld, maar de meeste hiervan zijn niet zorgvuldig bestudeerd, of zelfs gekeken, in decennia. Hoewel het cruciale gegevens bevat voor veel wetenschappelijke inspanningen, de meeste objecten zitten stilletjes in hun eigen nieuwsgierigheidskastjes.

Dus, massale digitalisering van natuurhistorische collecties is een belangrijk doel geworden in musea over de hele wereld. Na vele biologen bijeen te hebben gebracht, curatoren, vrijwilligers en burgerwetenschappers, dergelijke initiatieven hebben al grote datasets uit deze collecties gegenereerd en ongekende inzichten opgeleverd.

Nutsvoorzieningen, een onderzoek, onlangs gepubliceerd in de open access Biodiversiteit Data Journal , suggereert dat de nieuwste ontwikkelingen op het gebied van digitalisering en machinaal leren samen museumconservatoren kunnen helpen bij hun inspanningen om voor deze ongelooflijke wereldwijde bron te zorgen en ervan te leren.

Een team van onderzoekers van het Smithsonian Department of Botany, Data Science Lab, en Digitalization Program Office hebben onlangs samengewerkt met NVIDIA om een ​​proefproject uit te voeren met behulp van deep learning-benaderingen om in gedigitaliseerde herbariumspecimens te graven.

Hun studie is een van de eerste die het gebruik van deep learning-methoden beschrijft om ons begrip van gedigitaliseerde collectiemonsters te vergroten. Het is ook het eerste dat aantoont dat een diep convolutioneel neuraal netwerk - een computersysteem dat is gemodelleerd naar de neuronactiviteit in dierlijke hersenen dat in principe zelfstandig kan leren - effectief onderscheid kan maken tussen vergelijkbare planten met een verbazingwekkende nauwkeurigheid van bijna 100%.

Het Amerikaanse National Herbarium in het Smithsonian's National Museum of Natural History in Washington, DC Credit:Chip Clark, Smithsonian

In de krant, de wetenschappers beschrijven twee verschillende neurale netwerken die ze hebben getraind om taken uit te voeren op het gedigitaliseerde deel (momenteel 1,2 miljoen exemplaren) van het National Herbarium van de Verenigde Staten.

Het team trainde eerst een net om herbariumvellen die bevlekt waren met kwikkristallen automatisch te herkennen. omdat kwik vaak werd gebruikt door sommige vroege verzamelaars om de plantencollecties te beschermen tegen insectenschade. Het tweede net werd getraind om onderscheid te maken tussen twee plantenfamilies die een opvallend gelijkaardig uiterlijk hebben.

De getrainde neurale netten presteerden respectievelijk met 90% en 96% nauwkeurigheid (of 94% en 99% als de meest uitdagende exemplaren werden weggegooid), bevestigen dat deep learning een nuttige en belangrijke technologie is voor de toekomstige analyse van gedigitaliseerde museumcollecties.

Gedigitaliseerde collecties in combinatie met deep learning zullen ons helpen om een ​​anders menselijke taak te automatiseren, namelijk het identificeren van een onbekend aantal gekleurde specimenvellen in een collectie van meer dan 5 miljoen. Zie http://collections.si.edu. Krediet:Smithsonian Institution

"De resultaten kunnen worden gebruikt om zowel de curatie te verbeteren als nieuwe onderzoekspistes te ontsluiten, ’ concluderen de wetenschappers.

"Dit onderzoekspaper is een prachtig proof of concept. We weten nu dat we machinaal leren kunnen toepassen op gedigitaliseerde natuurhistorische specimens om curatoriële en identificatieproblemen op te lossen. De toekomst zal deze tools gebruiken in combinatie met grote gedeelde datasets om fundamentele hypothesen over de evolutie en verspreiding van planten en dieren, " zegt Dr. Laurence J. Dorr, Voorzitter van het Smithsonian Department of Botany en co-auteur van de studie.