Wetenschap
Grafische afbeelding van hergebruik van gegevens. Credit:Kroon-Batenburg et al.
Het steeds populairder wordende onderwerp van de depositie van ruwe diffractiegegevens wordt onderzocht in een Topical Review in IUCrJ . Voortbouwend op de workshop van 2015 georganiseerd door de IUCr Diffraction Data Deposition Working Group (DDDWG), de auteurs brengen het verhaal up-to-date met verslagen van nieuwe vakspecifieke en institutionele datarepositories, en van toenemende beleidsdruk op het beheer van onderzoeksgegevens, zoals het Europese Open Science-initiatief.
Het artikel is, echter, meer dan alleen een workshopverslag of een overzicht van evoluerend beleid. Het probeert de kosten-batenargumenten over depositie van diffractiegegevens te onderbouwen met voorbeelden uit echt eerstelijnsonderzoek. Bijvoorbeeld, Kroon-Batenburg en Helliwell hebben samengewerkt aan onderzoeken naar eiwitbinding van het chemotherapeutische middel cisplatine, en hebben al hun 34 onbewerkte datasets beschikbaar gesteld via de University of Manchester Data Library. Sommige van deze datasets zijn opnieuw geanalyseerd en hebben geresulteerd in een nieuw begrip van cisplatine-lysozymmodellen.
Het vooruitzicht om op deze manier meer informatie te extraheren uit gearchiveerde primaire datasets (ofwel door de inzichten van nieuwe ogen of door latere verbeteringen in software-analyse) heeft implicaties voor structurele databases, het idee van continue verbetering van studies te vergemakkelijken, zoals voor macromoleculaire structuurmodellen (lang verdedigd door Terwilliger).
Niet alleen op het gebied van macromoleculaire structuurbepaling zijn deze overwegingen van belang. Een van de grootste uitdagingen bij het hergebruiken van onbewerkte gegevens is de behoefte aan volledige metagegevens die bij elke onbewerkte gegevensset horen. om de daaropvolgende interpretatie en volledige evaluatie mogelijk te maken.
Verschillende IUCr-commissies publiceren actief hun samenvattingen van de essentiële metadata die moeten worden vastgelegd naast alle experimentele datasets. Deze initiatieven en hun relatie tot de IUCr-standaard voor gegevenskarakterisering (CIF, het Crystallographic Information Framework) worden in het artikel besproken. Opnieuw, Er worden praktische aanwijzingen gegeven voor essentiële metadata die naast diffractiedatasets moeten worden vastgelegd.
Hoewel er bemoedigende tekenen zijn dat de wetenschappelijke gemeenschap meer geïnformeerde interesse toont in gegevensbeheer en het wetenschappelijk potentieel ervan, nieuwe uitdagingen worden opgeworpen door de nieuwste generatie instrumentatie, in staat om enorme hoeveelheden gegevens met een ongelooflijke snelheid te genereren. Het is misschien niet mogelijk om alle gegevens die worden geproduceerd te archiveren of zelfs grondig te analyseren. Echter, dit artikel zal helpen om een diep begrip te krijgen van de redenen waarom de samenleving inspanningen en middelen zou moeten investeren om de grootst mogelijke waarde uit de gegevensvloed te halen, in kristallografie zoals in elke wetenschap.
Wetenschap © https://nl.scienceaq.com