science >> Wetenschap >  >> Elektronica

Tijdbesparende software in een tijdperk van steeds groter wordende wetenschappelijke gegevens

Eliza Grames, promovendus in ecologie en evolutionaire biologie. Krediet:Universiteit van Connecticut

Het is moeilijk om mensen enthousiast te maken voor software, zegt Eliza Grames, een promovendus in ecologie en evolutionaire biologie. Nog, de software die ze heeft ontwikkeld, is opwindend voor iedereen die op het punt staat een nieuw onderzoek te beginnen en probeert vast te stellen of het echt … nieuw is.

Kruip in de huid van een onderzoeker.

Voorafgaand aan een nieuwe studie, een grondige en uitputtende beoordeling van bestaande literatuur moet worden gedaan om ervoor te zorgen dat het project nieuw is. Of, om te bepalen of er bestaande gegevens zijn die kunnen worden gebruikt om een ​​nieuwe vraag te beantwoorden.

Dit is een flinke klus, vooral gezien het feit dat er elk jaar miljoenen nieuwe onderzoeksartikelen worden gepubliceerd. Waar begint men zelfs al die gegevens te verkennen?

"Elke nieuwe studie draagt ​​meer bij aan wat we weten over een onderwerp, nuance en complexiteit toevoegen die ons begrip van de natuurlijke wereld helpen verbeteren. Om deze rijkdom aan bewijsmateriaal te begrijpen en dichter bij een volledig beeld van de wereld te komen, onderzoekers wenden zich steeds meer tot systematische reviewmethoden als een manier om deze informatie te synthetiseren, ' zegt Grames.

Systematische beoordelingen begonnen op het gebied van geneeskunde en volksgezondheid, waar het op de hoogte blijven van onderzoek kan zijn, vrij letterlijk, een kwestie van leven of dood, zegt Grames. (Ooit afgevraagd hoe uw arts op de hoogte is van de nieuwste behandelingen voor uw aandoening?)

"In die velden er is een gevestigd systeem met Medical Subject Headers waar artikelen worden getagd met trefwoorden die bij het werk horen, maar ecologie heeft dat niet."

Andere onderzoeksgebieden binnen het wetenschappelijke spectrum zaten in hetzelfde schuitje.

Het project is ontstaan ​​uit nood. In haar eigen beoordelingsproces, Grames merkte op dat ze artikelen en sleuteltermen zou missen en was geïnteresseerd in hoe ze die ontbrekende termen kon identificeren. Dus, Grames besloot een systeem te creëren dat onderzoekers op het gebied van ecologie, omgeving, Conserveringsbiologie, evolutionaire biologie en andere wetenschappen, zou kunnen gebruiken.

"Terwijl we aan deze software werkten, we realiseerden ons dat er een veel snellere manier was om de beoordelingen te doen dan hoe anderen ze deden, " zegt Grames, "De traditionele manier was om door kranten te bladeren en een term eruit te halen en vervolgens de rest van het artikel te lezen om meer termen te vinden die gebruikt kunnen worden."

Zelfs met vrij specifieke zoekwoorden, Grames merkt op dat de gemiddelde systematische review op haar gebied van conservatiebiologie aanvankelijk ongeveer 10 oplevert, 000 onderzoeksdocumenten. Hoewel het belangrijk is om relevante informatie op te halen, te veel irrelevante informatie kan onnodige tijd toevoegen.

Krediet:MethodenEcolEvol

"Elk jaar, de hoeveelheid data blijft maar toenemen. Er zijn enkele systematische reviews die, als je kijkt naar de hoeveelheid tijd die ze drie jaar geleden zouden hebben gekost, ze zouden ongeveer 300 dagen nodig hebben om uit te voeren. Als dezelfde beoordelingen vandaag zouden zijn gedaan, ze zouden ongeveer 350 dagen duren omdat het aantal publicaties maar blijft stijgen."

Grames zegt dat het ongeveer een maand duurde om ideeën voor de software op te lossen, daarna bracht ze een zomer door met het schrijven en repareren van de code. Het resultaat is een open-source softwarepakket genaamd litsearchr.

Hoe het werkt, zegt Grames, is dat een gebruiker een zoekopdracht in een paar databases zal invoeren.

"De zoekwoorden moeten redelijk relevant zijn ingevoerd in het algoritme om alle potentiële zoekwoorden te extraheren, die vervolgens in een netwerk worden geplaatst. De originele zoekwoorden staan ​​centraal in het netwerk en zijn het meest verbonden."

Grames zegt dat de tijd die nodig is om een ​​zoekstrategie te ontwikkelen met 90% is afgenomen.

Gepresenteerd met de meest relevante artikelen, onderzoekers hebben dan aanzienlijk minder papieren om handmatig te ontleden. Deze beoordelingsfase is nu gedeeltelijk geautomatiseerd, te, voegt Grames toe.

Litsearchr maakt deel uit van een gezamenlijke inspanning van onderzoekers, metavers genoemd, waarbij het doel is om meerdere softwarepakketten aan elkaar te koppelen zodat onderzoekers hun onderzoek van begin tot eind in dezelfde codeertaal kunnen uitvoeren.

"Onderzoekers kunnen hun systematische reviews ontwikkelen, data importeren, en er is zelfs een pakket dat de resultatensectie voor de systematische review kan schrijven, ' zegt Grames.

Grames en haar team hebben de software zo opgezet dat deze door iedereen kan worden gebruikt, of ze kunnen coderen of niet, gebruik van kant-en-klare sjablonen. Er is ook een gedetailleerde stapsgewijze video om gebruikers door het proces te leiden.

Door de software open source te houden, Grames zegt dat het debuggen en bewerken is verbeterd omdat gebruikers kunnen wijzen op details die aandacht nodig hebben. "Elke keer als ik een e-mail krijg, het is zo spannend. Het is leuk om het open te hebben, want mensen kunnen het me laten weten als er een typefout is."

De software wordt momenteel gebruikt door onderzoekers in de voedingswetenschap en psychologie, en voor een enorme onderneming die alle papieren met betrekking tot insectenpopulaties over de hele wereld screent.

"We zouden dit project op geen enkele manier kunnen doen zonder het niveau van automatisering dat we krijgen met litsearchr. Ik bouwde dit uit een behoefte van een ander project, maar deze software maakt het mogelijk om nog grotere analyses uit te voeren dan voorheen."