science >> Wetenschap >  >> Fysica

Gegevens opslaan in DNA brengt de natuur in het digitale universum

De volgende grens van gegevensopslag:DNA. Krediet:ymgerman/Shutterstock.com

De mensheid produceert gegevens in een onvoorstelbaar tempo, tot het punt dat opslagtechnologieën het niet kunnen bijhouden. Elke vijf jaar, de hoeveelheid data die we produceren vertienvoudigt, inclusief foto's en video's. Niet alles hoeft te worden opgeslagen, maar fabrikanten van gegevensopslag maken harde schijven en flashchips niet snel genoeg om vast te houden wat we wel willen behouden. Aangezien we niet zullen stoppen met het maken van foto's en het opnemen van films, we moeten nieuwe manieren ontwikkelen om ze te redden.

over millennia, de natuur heeft een ongelooflijk informatieopslagmedium ontwikkeld - DNA. Het is geëvolueerd om genetische informatie op te slaan, blauwdrukken voor het bouwen van eiwitten, maar DNA kan voor veel meer doeleinden worden gebruikt dan alleen dat. DNA is ook veel dichter dan moderne opslagmedia:de gegevens op honderdduizenden dvd's zouden in een DNA-pakket ter grootte van een luciferdoosje passen. DNA is ook veel duurzamer – gaat duizenden jaren mee – dan de huidige harde schijven, die jaren of decennia kan duren. En hoewel formaten van harde schijven en verbindingsstandaarden achterhaald zijn, DNA zal nooit tenminste zolang er leven is.

Het idee om digitale data op te slaan in DNA is al tientallen jaren oud, maar recent werk van Harvard en het European Bioinformatics Institute toonde aan dat vooruitgang in moderne DNA-manipulatiemethoden dit vandaag zowel mogelijk als praktisch zou kunnen maken. Veel onderzoeksgroepen, onder meer aan de ETH Zürich, de University of Illinois in Urbana-Champaign en Columbia University werken aan dit probleem. Onze eigen groep aan de Universiteit van Washington en Microsoft heeft het wereldrecord voor de hoeveelheid gegevens die met succes zijn opgeslagen in en opgehaald uit DNA - 200 megabyte.

Bits voorbereiden om atomen te worden

Traditionele media zoals harde schijven, USB-sticks of dvd's slaan digitale gegevens op door de magnetische, elektrische of optische eigenschappen van een materiaal om nullen en enen op te slaan.

Om gegevens in het DNA op te slaan, het concept is hetzelfde, maar het proces is anders. DNA-moleculen zijn lange opeenvolgingen van kleinere moleculen, nucleotiden genoemd - adenine, cytosine, thymine en guanine, meestal aangeduid als A, C, T en G. In plaats van reeksen van nullen en enen te maken, zoals in elektronische media, DNA-opslag maakt gebruik van sequenties van de nucleotiden.

Er zijn verschillende manieren om dit te doen, maar het algemene idee is om digitale gegevenspatronen toe te wijzen aan DNA-nucleotiden. Bijvoorbeeld, 00 kan gelijk zijn aan A, 01 tot C, 10 tot T en 11 tot G. Om een ​​foto op te slaan, bijvoorbeeld, we beginnen met de codering ervan als een digitaal bestand, zoals een JPEG. Dat bestand is, in essentie, een lange reeks van nullen en enen. Laten we zeggen dat de eerste acht bits van het bestand 01111000 zijn; we breken ze in paren – 01 11 10 00 – die overeenkomen met C-G-T-A. Dat is de volgorde waarin we de nucleotiden verbinden om een ​​DNA-streng te vormen.

Digitale computerbestanden kunnen behoorlijk groot zijn - zelfs terabytes groot voor grote databases. Maar individuele DNA-strengen moeten veel korter zijn - elk met slechts ongeveer 20 bytes. Dat komt omdat hoe langer een DNA-streng is, hoe moeilijker het is om chemisch te bouwen.

Dus we moeten de gegevens opsplitsen in kleinere stukjes, en voeg aan elk een indicator toe van waar in de reeks het valt. Als het tijd is om de in het DNA opgeslagen informatie te lezen, die indicator zorgt ervoor dat alle stukjes gegevens in de juiste volgorde blijven.

Nu hebben we een plan voor het opslaan van de gegevens. Vervolgens moeten we het daadwerkelijk doen.

De gegevens opslaan

Na te hebben bepaald in welke volgorde de letters moeten komen, de DNA-sequenties worden letter voor letter vervaardigd met chemische reacties. Deze reacties worden aangedreven door apparatuur die flessen A's opneemt, C's, G's en T's en mengt ze in een vloeibare oplossing met andere chemicaliën om de reacties te beheersen die de volgorde van de fysieke DNA-strengen specificeren.

Dit proces brengt ons nog een ander voordeel van DNA-opslag:reservekopieën. In plaats van één streng tegelijk te maken, de chemische reacties maken veel identieke strengen tegelijk, voordat hij veel kopieën maakte van de volgende streng in de serie.

Zodra de DNA-strengen zijn gemaakt, we moeten ze beschermen tegen schade door vocht en licht. Dus we drogen ze uit en stoppen ze in een bak die ze koud houdt en water en licht blokkeert.

Maar opgeslagen gegevens zijn alleen nuttig als we ze later kunnen ophalen.

De gegevens teruglezen

Om de gegevens uit de opslag te lezen, we gebruiken een sequencing-machine precies zoals die wordt gebruikt voor analyse van genomisch DNA in cellen. Dit identificeert de moleculen, het genereren van een letterreeks per molecuul, die we vervolgens decoderen in een binaire reeks van nullen en enen in volgorde. Dit proces kan het DNA vernietigen terwijl het wordt gelezen, maar dat is waar die reservekopieën in het spel komen:er zijn veel kopieën van elke sequentie.

En als de reservekopieën opraken, het is gemakkelijk om dubbele kopieën te maken om de opslag aan te vullen - net zoals de natuur de hele tijd DNA kopieert.

Momenteel, de meeste DNA-ophaalsystemen vereisen het lezen van alle informatie die is opgeslagen in een bepaalde container, ook al willen we er maar een klein deel van. Dit is hetzelfde als het lezen van de informatie van een hele harde schijf om maar één e-mailbericht te vinden. We hebben technieken ontwikkeld – gebaseerd op goed bestudeerde biochemische methoden – waarmee we alleen de specifieke stukjes informatie kunnen identificeren en lezen die een gebruiker nodig heeft om uit DNA-opslag te halen.

Resterende uitdagingen

Momenteel, DNA-opslag is experimenteel. Voordat het gemeengoed wordt, het moet volledig geautomatiseerd zijn, en de processen van zowel het bouwen van DNA als het lezen ervan moeten worden verbeterd. Ze zijn allebei foutgevoelig en relatief traag. Bijvoorbeeld, met de huidige DNA-synthese kunnen we een paar honderd bytes per seconde schrijven; een moderne harde schijf kan honderden miljoenen bytes per seconde schrijven. Een gemiddelde iPhone-foto zou enkele uren nodig hebben om op te slaan in het DNA, hoewel het minder dan een seconde duurt om op de telefoon op te slaan of naar een computer over te zetten.

Dit zijn belangrijke uitdagingen, maar we zijn optimistisch omdat alle relevante technologieën snel verbeteren. Verder, DNA-gegevensopslag heeft niet de perfecte nauwkeurigheid nodig die biologie vereist, dus onderzoekers zullen waarschijnlijk nog goedkopere en snellere manieren vinden om informatie op te slaan in het oudste gegevensopslagsysteem van de natuur.

Dit artikel is oorspronkelijk gepubliceerd op The Conversation. Lees het originele artikel.