science >> Wetenschap >  >> anders

Permanente opslag van digitale archeologische datasets

Credit:Universiteit Leiden

Het is het einde van uw archeologisch onderzoeksproject, en u vraagt ​​zich misschien af ​​waar u uw gegevens moet deponeren. Na de opgraving, alle vondsten zijn getekend, gescand, gedigitaliseerd, en de database is voltooid. Wellicht heeft u ook veel gegevens verzameld door verdere wetenschappelijke analyse van de archeologische resten. Sommige archeologische gegevens zullen in de publicatie terechtkomen, maar hoe zit het met de rest van deze grote dataset?

Grote gegevens

De term 'big data' beschrijft vaak een dataset die het resultaat is van wetenschappelijk onderzoek en die zowel qua hoeveelheid als qua digitale bestandsgrootte behoorlijk substantieel is. Big data vormen in wezen de kern van het huidige archeologische onderzoek. Toch komt slechts een klein percentage van de totale archeologische dataset in de publicaties terecht. Een dergelijke dataset is kostbaar en het resultaat van jarenlang werk en veel inspanning, en, in zekere zin, niet reproduceerbaar. Het is dus essentieel om de bewaring ervan op lange termijn te garanderen.

Naast het opslaan en beheren van de gegevens gedurende het project, zodra het project is voltooid, de onderzoeker moet de definitieve onderzoeksdataset deponeren om de wetenschappelijke integriteit te behouden. "In onze faculteit mensen zoals ik bieden graag hulp bij dit proces in de vorm van Data Management consultaties, " zegt Kate Mokranova, student-assistent datamanagement bij de Faculteit Archeologie.

Dans-EASY

Alle onderzoekers worden door de Faculteit der Archeologie aangemoedigd om hun data op Dans-EASY - een online archiveringssysteem voor het deponeren en hergebruiken van onderzoeksdata - te deponeren en via permanente DOI te koppelen aan hun publicaties.

“De Faculteit Archeologie gebruikt Dans-EASY al jaren voor het deponeren van datasets. er lijkt nog steeds weinig algemeen bewustzijn te zijn over de stappen die men moet nemen voordat een dataset wordt gedeponeerd. Dat is waar datastewards van onze faculteit, zoals mij, doe mee en help bij de hele procedure van het deponeren op Dans-EASY, die in eerste instantie verwarrend kan zijn, " merkt Kaat op.

Metagegevens

Onder de verschillende dingen die onderzoekers voor en tijdens het gegevensdepositieproces moeten overwegen, zijn de juiste Creative Commons-licenties, d.w.z., hoeveel Open Access de totale dataset zal zijn, en duurzame bestandsformaten die de bewaring van de totale dataset op lange termijn garanderen. Daarnaast, het is niet voldoende om alleen de digitale bestanden te deponeren, liever, deze moeten worden aangevuld met metadata om de dataset voor anderen begrijpelijk te maken.

"Metadata zullen ervoor zorgen dat andere archeologen de gedeponeerde dataset in de toekomst kunnen gebruiken. Het grondig documenteren van de feitelijke context van de dataset is, om deze reden, uiterst belangrijk en helpt voorkomen dat de gegevens in de toekomst verkeerd worden begrepen of verkeerd worden gebruikt. De onderzoeker die metadata aanmaakt, kan dat doen met behulp van Dans-EASY-richtlijnen. Deze richtlijnen helpen de onderzoekers nadenken over de vragen over datadocumentatie, zoals welke codes en variabelen men moet gebruiken om de gegevens te documenteren, en hoe moeten de bestanden hun naam krijgen, " legt Kaat uit.