Wetenschap
Krediet:John Innes Center
Een gratis, open-source toolkit om onderzoekers te helpen omgaan met overbelasting van gegevensbeheer is bedacht door het John Innes Center Informatics-team.
de gereedschapskist, genaamd "dtool, " is een softwarepakket om wetenschappelijke gegevens te beheren en toegankelijk te maken voor eerstelijnsonderzoekers die in meerdere projectgebieden werken.
Het werkt door data en metadata – informatie die de data identificeert – te verpakken in handige dozen of datasets.
Deze op zichzelf staande pakketten met gegevens en metagegevens maken het gemakkelijk om gegevenssets te verplaatsen en externe back-upkopieën te maken.
De tools werken met zowel traditionele bestandssystemen als cloudopties zoals Amazon S3 en Microsoft Azure, waardoor onderzoekers de opslagoplossing kunnen kiezen die het beste bij hun behoeften en budget past.
Het systeem betekent dat onderzoekers snel interessante datasets kunnen vinden zonder de hoofdpijn van toegang tot en onderhoud van een centrale database. De verpakte metadata kan worden gebruikt om de integriteit van de gegevens in de box te verifiëren.
Het John Innes Center-team schetst de voordelen van dtool in een artikel gepubliceerd in PeerJ – the Journal of Life and Environmental Sciences.
Ze zeggen dat de toolkit gemoedsrust biedt omdat onderzoekers weten dat de gegevens die ten grondslag liggen aan wetenschappelijke resultaten veilig zijn, doorzoekbaar en toegankelijk in een sterk verspreide onderzoeksomgeving zoals het John Innes Centre.
Dr. Tjelvar Olsson, Senior Scientific Data and Infrastructure Manager bij het John Innes Centre, wie is een van de makers van het systeem, zei:"In het John Innes Center hebben we 40 verschillende onderzoeksgroepen die zich bezighouden met enorme hoeveelheden allerlei soorten gegevens.
"We willen dat meer mensen dtool gebruiken om hun gegevens te beheren. We hebben het zo ontworpen dat het past bij hun manier van werken, een lichtgewicht, oplossing die op een minimale manier wordt gebruikt en bovenop wat ze al doen."
Een van de early adopters van dtool is het team van Dr. Brande Wulff dat werkt aan ziekteresistentie bij tarwe in het John Innes Centre.
Vooruitgang in technologieën zoals genetische sequencing en computationele systeembiologie hebben bijgedragen tot een explosie van de hoeveelheden en soorten gegevens. Hoewel dit heeft geleid tot grote vooruitgang in de planten- en microbiële wetenschap, heeft het geleid tot aanzienlijke uitdagingen op het gebied van gegevensbeheer en -verwerking voor eerstelijnsonderzoekers.
Dr. Matthew Hartley, hoofd van het informaticateam van het JIC, die hielpen bij het bedenken van dtool, zei dat de impact al voelbaar was.
"Het op grote schaal beheren van gegevens is een van de grootste uitdagingen in computationeel biologisch onderzoek. dtool heeft het opslaan van onze gegevens goedkoper gemaakt, gaf ons gemoedsrust en versnelde ons onderzoek.".
"Lichtgewicht databeheer met dtool" is gepubliceerd in PeerJ .
Wetenschap © https://nl.scienceaq.com