science >> Wetenschap >  >> Elektronica

Het datameer uitbaggeren

Krediet:CC0 Publiek Domein

Met datameren kan informatie aan een systeem worden toegevoegd zonder voorbewerking of modellering. Vergelijk dit met een conventionele database waar gegevens op een veel verfijndere en formelere manier moeten worden aangeleverd. Een data lake biedt dus een veel snellere invoersnelheid. Echter, zoals uit onderzoek uit Brazilië blijkt, ook al behoudt een data lake het hoogste granulariteitsniveau van de gegevens, dat nuttige flexibiliteit ook problematisch kan zijn. "Als het niet wordt beheerd, het is gemakkelijk om de controle over de repository te verliezen vanwege het volume en de groei ervan, ', legt het team uit.

De onderzoekers leggen verder uit dat datameren niet de semantiek van een conventionele database bevatten, maar hoewel dit voordelig kan zijn om bepaalde soorten vooroordelen te vermijden bij het opnieuw extraheren en analyseren van dagen, het betekent wel dat het begrijpen van de inhoud van het datameer een nogal omslachtige taak kan worden. Dit, stelt het team voor, heeft misschien de wijdverbreide acceptatie en het gebruik van data lakes binnen de bedrijfsomgeving ondermijnd en de acceptatie van dit nuttige hulpmiddel belemmerd vanwege bepaalde misvattingen over hoe ze zouden kunnen worden gebruikt bij inspanningen op het gebied van datawetenschap.

Het team heeft zich nu tot kennisbeheermodellen gewend om de problemen in verband met het gebruik van data lakes aan te pakken en de gegevens die erin zweven te verrijken om de bruikbaarheid van de informatie te verbeteren. Ze voegen er ook aan toe dat ze door het gebruik van een dataportaalplatform en bijbehorende metadata redeneren dat hun aanpak een gemakkelijke toegang tot het datameer zou bieden, het nut ervan zou behouden en vergroten en het denigreren ervan in een zogenaamd datamoeras zou voorkomen.