science >> Wetenschap >  >> Elektronica

beter werden in natuurbehoud, AI-studie van wetenschappelijke abstracts suggereert:

Krediet:CC0 Publiek Domein

Onderzoekers gebruiken een soort machine learning dat bekend staat als sentimentanalyse om de successen en mislukkingen van natuurbehoud in de loop van de tijd te beoordelen. In hun studie hebben verschijnt 19 maart in Patronen -een nieuw open access data science-tijdschrift van Cell Press - de onderzoekers beoordeelden de abstracts van meer dan 4, 000 onderzoeken naar de herintroductie van soorten gedurende vier decennia en vonden dat, in het algemeen, we worden steeds beter in het herintroduceren van soorten in het wild. Ze zeggen dat machinaal leren op dit gebied en andere gebieden zou kunnen worden gebruikt om de beste technieken en oplossingen te identificeren uit de steeds groter wordende hoeveelheid wetenschappelijk onderzoek.

"We wilden wat lessen trekken uit de enorme hoeveelheid literatuur over natuurbehoud over herintroductieprogramma's die we hier in Californië zouden kunnen gebruiken terwijl we proberen zeeotters terug te brengen naar plaatsen waar ze al tientallen jaren niet meer hebben rondgezworven. " zegt senior auteur Kyle Van Houtan, hoofdwetenschapper bij Monterey Bay Aquarium. "Maar wat voor ons lag, waren miljoenen woorden en duizenden manuscripten. We vroegen ons af hoe we er gegevens uit konden halen die we daadwerkelijk konden analyseren, en dus wendden we ons tot natuurlijke taalverwerking."

Natuurlijke taalverwerking is een soort machine learning dat reeksen menselijke taal analyseert om bruikbare informatie te extraheren. waardoor een computer in wezen documenten kan lezen als een mens. Sentiment analyse, die de onderzoekers in dit artikel gebruikten, kijkt meer specifiek naar een getrainde reeks woorden waaraan een positieve of negatieve emotionele waarde is toegekend om de positiviteit of negativiteit van de tekst in het algemeen te beoordelen.

De onderzoekers gebruikten de database Web of Science om 4, 313 herintroductiestudies van soorten gepubliceerd van 1987 tot 2016 met doorzoekbare samenvattingen. Vervolgens gebruikten ze verschillende "kant-en-klare" lexicons voor sentimentanalyse - wat betekent dat de woorden erin al een sentimentscore hadden gekregen op basis van zaken als film- en restaurantrecensies - om een ​​model te bouwen dat elk abstract een algemene score kon geven. "We hoefden de modellen niet te trainen, dus na een paar uur draaien hadden we ineens al deze resultaten tot onze beschikking, ", zegt Van Houtan. "De scores gaven ons een trend in de tijd, en we konden de resultaten opvragen om te zien wat het sentiment werd geassocieerd met studies over panda's of op Californische condors of koraalriffen."

De trends die ze zagen suggereerden een groter succes in het behoud. "Overuren, er is veel minder onzekerheid in de beoordeling van sentiment in de onderzoeken, en we zien herintroductieprojecten succesvoller worden - en dat is een grote afhaalmaaltijd, " zegt hij. "Kijkend naar duizenden studies, het lijkt alsof we er steeds beter in worden, en dat is bemoedigend."

"Als we onze instandhoudingsdollars willen maximaliseren, dan moeten we snel kunnen inschatten wat werkt en wat niet, " zegt studie co-auteur Lucas Joppa, Chief Environmental Officer bij Microsoft. "Machinaal leren, en natuurlijke taalverwerking in het bijzonder, heeft het vermogen om resultaten te doorzoeken en een licht te laten schijnen op succesverhalen waar anderen van kunnen leren."

Om ervoor te zorgen dat hun resultaten nauwkeurig waren, de onderzoekers keken naar de meest voorkomende indicatoren van positief sentiment (en dus behoudsucces) in hun resultaten en vonden woorden als "succes, " "beschermen, " "groei, " "steun, " "helpen, " en "voordeel"; woorden die een negatief sentiment aangaven waren woorden als "dreigen, " "verlies, " "risico, " "bedreiging, " "probleem, " en "doden." Deze woorden kwamen overeen met wat ze, als biologen voor lange tijd instandhouding, doorgaans zouden gebruiken om succes en falen in hun eigen studies aan te duiden. Ze ontdekten ook dat trends beschreven door de sentimentanalyse voor specifieke herintroductieprogramma's waarvan bekend is dat ze successen of mislukkingen zijn (zoals de herintroductie van de Californische condor) overeenkwamen met de bekende resultaten.

De onderzoekers zeggen dat kant-en-klare sentimentanalyse verrassend goed voor hen werkte, waarschijnlijk omdat veel woorden die in de natuurbeschermingsbiologie worden gebruikt deel uitmaken van onze dagelijkse lexicons en daarom nauwkeurig zijn gecodeerd met het juiste sentiment. Op andere gebieden, ze denken dat er meer werk moet worden verzet om een ​​model te ontwikkelen en te trainen dat het sentiment van meer technische, veldspecifieke taal en syntaxis. Een andere beperking, ze zeggen, is dat slechts een beperkt aantal van de papers die ze wilden analyseren open access waren, wat betekende dat ze abstracts moesten beoordelen in plaats van volledige papers. "We krabben hier echt maar aan de oppervlakte, maar dit is zeker een stap in de goede richting, ’, zegt Van Houtan.

Nog altijd, ze denken dat dit een techniek is die breder kan en moet worden toegepast in zowel de natuurbeschermingsbiologie als andere gebieden om de enorme hoeveelheden onderzoek die nu worden uitgevoerd en gepubliceerd, te begrijpen. "Zoveel lokaal natuurbehoud blijft onopgemerkt door de wereldwijde natuurbeschermingsgemeenschap, en dit artikel laat zien hoe machine learning kan helpen die informatiekloof te dichten, ' zegt Joppe.

"Veel van deze technieken zijn al meer dan tien jaar in gebruik in commerciële omgevingen, maar we hopen ze te vertalen naar omgevingen zoals de onze om klimaatverandering of plasticvervuiling te bestrijden of om het behoud van bedreigde diersoorten te bevorderen, ", zegt Van Houtan. "Er is een overvloed aan gegevens binnen handbereik, maar het is deze slapende reus omdat het niet goed is samengesteld of georganiseerd, wat het moeilijk maakt om te analyseren. We willen mensen verbinden met ideeën, capaciteit, en technische oplossingen die ze anders misschien niet zouden tegenkomen, zodat we enige vooruitgang kunnen boeken bij deze schijnbaar hardnekkige problemen."