Alle digitale informatie ter wereld opslaan in een wijnkistje? DNA-opslag lijkt dé manier om de buitensporig groeiende hoeveelheid computerdata veilig en eeuwenlang te bewaren.
Computergegevens worden doorgaans opgeslagen in microscopisch kleine magnetische vlekjes, in elektrische stroompjes of in patronen van minuscule stipjes die het licht van een laserstraal reflecteren. Maar uiteindelijk belanden de data misschien ooit wel in de bouwstenen van het leven zelf en worden ze in de organische moleculen geëtst die samen DNA-strengen vormen.
Dat is de conclusie die getrokken kan worden uit twee recente experimenten, één door informatici van de University of Washington en Microsoft, het andere uitgevoerd door een groep wetenschappers aan de University of Illinois. Beide onderzoeken tonen aan dat DNA-moleculen geschikte informatiedragers zijn, waarop alle digitale informatie ter wereld zou kunnen worden opgeslagen in een vochtoplossing van pakweg negen liter. Alle informatie ter wereld in één doosje wijn.
De experimenten bewezen dat specifieke digitale bestanden gericht kunnen worden opgevist uit een potentieel oneindige hoeveelheid data. En volgens de onderzoekers kunnen met deze nieuwe opslagtechniek onafzienbare hoeveelheden informatie voor ten minste duizend jaar veilig worden opgeborgen. Dat is immers de grote tekortkoming van alle bestaande micro-elektronische systemen voor dataopslag: op magnetische schijven of tape en zelfs op optische dragers [zoals de compact disc of cd] kunnen data voor hooguit enkele decennia worden bewaard.
In de versmelting van computertechnologie en biologie kan nog grote vooruitgang worden geboekt
De nieuwe onderzoeksresultaten bieden zicht op een methode om de exponentieel groeiende hoeveelheid computerdata eeuwenlang te kunnen opslaan. En vergeleken met de capaciteit van zelfs de meest geavanceerde elektronische of magnetische opslagsystemen, is de opslagcapaciteit van DNA duizelingwekkend hoog. In theorie kun je daarmee een exabyte aan informatie opslaan in een volume ter grootte van een zandkorrel. Een exabyte staat ongeveer gelijk aan de opslagcapaciteit van tweehonderd miljoen dvd’s.
DNA-moleculen zijn de dragers van de genetische instructies die de ontwikkeling en het functioneren van levende organismen aansturen. De kosten van de zogenaamde sequencing, het uitlezen van de genetische code, dalen sneller dan de kosten van computergeheugen. Daarnaast wordt vooruitgang geboekt met het synthetiseren van strengen van willekeurige sequenties kleine organische moleculen, zogenaamde oligonucleotiden, de bouwstenen van het DNA. Als de kosten van sequencing en van het synthetiseren van DNA blijven dalen, komen nieuwe soorten hybride opslagsystemen volgens informatici binnen handbereik.
‘Het afgelopen jaar drong ineens het besef door dat in die versmelting van computertechnologie en biologie nog grote vooruitgang kan worden geboekt,’ zegt Douglas M. Carmean, op dit moment onderzoeker bij Microsoft en vroeger ontwerper van microprocessoren bij Intel. De ontwikkeling van beide vakgebieden dateert van de tijd van de eerste interactieve computers. De eerste echte personal computer, de LINC, werd in 1961 door Wesley A. Clark ontworpen voor biomedische onderzoekers. ‘Biotech heeft in het verleden geprofiteerd van de informatietechnologie,’ zegt Luis Ceze, een informaticus van de University of Washington en een van de bedenkers van het nieuwe DNA-opslagsysteem. ‘Nu moet de biotech iets terugdoen.’
Nieuw systeem
De eerste tekenen van het samengaan van biologie en computertechnologie zijn te vinden in het kleine laboratorium in de kelder van de informaticafaculteit van de University of Washington. Dat lab staat volgestouwd met apparatuur die je eerder in een biologielab zou verwachten: een desktopapparaat voor de sequencing van DNA en een apparaat dat van kleine stukjes DNA miljarden exacte kopieën kan maken. Die twee vormen samen het prototype van een methode voor dataopslag die over vijf jaar misschien al veel wijder verbreid is. Volgens de onderzoekers zou de methode een uitkomst zijn voor Hollywoodstudio’s en moderne ziekenhuizen, die oplossingen zoeken voor de langdurige opslag van digitale films respectievelijk röntgenfoto’s en MRI-opnamen.
Eerdere proeven, uitgevoerd aan Harvard in 2012 en door onderzoekers van het European Bioinformatics Institute in het Britse Hinxton in 2013, wezen uit dat het mogelijk is om databestanden in DNA op te slaan en ook weer als digitale informatie uit te lezen. De onderzoeksgroep van Harvard haalde wereldwijd de media door op die manier miljarden exemplaren van Regenesis op te slaan, een boek van geneticus George Church en wetenschapsjournalist Ed Regis. De onderzoeksteams van de University of Illinois en van de University of Washington en Microsoft borduren daarop voort door informatie in DNA-vorm op te slaan en vervolgens één specifiek bestand uit die massa informatie te halen.
De onderzoekers in Illinois hebben de Wikipedia-pagina’s van zes universiteiten in DNA weggeschreven, en slaagden er vervolgens in om specifieke delen van die tekst te selecteren en te bewerken. De onderzoekers van de University of Washington en Microsoft redeneerden dat men in potentie zo ongelooflijk veel informatie in DNA kwijt kan, dat het beter kan worden gebruikt om data alleen op te slaan, zonder die verder te bewerken. Zij slaagden erin om vier kleine afbeeldingen op te slaan en die met slechts één foutje onafhankelijk van elkaar weer uit te lezen.
Computeropslagsystemen zijn net grote steden met straten waarin alle gegevens een exact adres krijgen toegewezen. Bij DNA-opslag wordt gebruikgemaakt van de mogelijkheid om de moleculen waarin informatie is opgeslagen met elkaar te combineren. De basisfunctie van DNA, replicatie binnen levende organismen, is de basis van alle leven. Zo kan een digitale afbeelding worden opgedeeld in duizenden stukjes, die vervolgens weer worden opgeslagen in duizenden afzonderlijke DNA-strengen. Daarbij voegen de onderzoekers aan elk stukje een uniek kenteken toe, zodat een compleet bestand of een complete afbeelding later weer als een legpuzzel bij elkaar kan worden gezocht. Om de gezochte informatie vervolgens eenvoudiger te kunnen terugvinden, maken de wetenschappers gebruik van de zogenaamde polymerasekettingreactie of PCR (polymerase chain reaction), een techniek om specifieke stukjes DNA te kopiëren (amplificeren, in jargon). Met dit procedé, in 1983 bedacht door de scheikundige Kary Mullis, kan men één enkele DNA-molecuul amplificeren tot miljoenen exemplaren.
Het is mogelijk om databestanden in DNA op te slaan en ook weer als digitale informatie uit te lezen
Behalve aan de verfijning van methoden voor het uitlezen van informatie werken de onderzoekers ook aan verbetering van de opslagtechnologie. ‘We zijn nu al een factor honderd verder dan in 2012,’ zegt Church. Zijn laboratorium werkt samen met Technicolor SA, een Frans bedrijf dat veel doet aan digitale dataopslag en filmarchivering. ‘Ons streven is nu om de kosten nog eens met een factor duizend te verlagen,’ zegt Church.
In het laboratorium van Harvard experimenteert men met het opslaan en weer uitlezen van Méliès’ stomme film Le voyage dans la lune uit 1902. De onderzoekers van de University of Washington en Microsoft werken samen met Twist Bioscience, een start-up uit San Francisco die een systeem heeft ontwikkeld om met behulp van halfgeleiders de productie van DNA-strengen voor dataopslag te versnellen.
Knelpunt
Het wegschrijven van informatie in DNA is momenteel het grootste knelpunt, geven de onderzoekers toe. Maar ze verwachten op dat vlak snel verbeteringen. Volgens Emily Leproust, directeur van Twist, ‘draait het allemaal om technologie en het verder verkleinen van de processen’. Data wegschrijven naar of uitlezen van magnetische tape is nog steeds een populaire methode voor de archivering van data bij bedrijven en vergt maar een paar seconden. Maar de tapes zelf worden vaak opgeslagen in kasten of nog grotere gemechaniseerde opbergsystemen. De benodigde tape daaruit ophalen en uitlezen kan uren duren.
De kosten van digitale dataopslag in DNA zullen volgens Leproust binnenkort gigantisch dalen en de snelheid zal enorm toenemen. En dan kan deze methode concurreren met magnetische opslag. Vergeleken met het uitlezen van elektronisch of magnetisch geheugen gaat het uitlezen van DNA-geheugen met een slakkengang. Maar DNA laat de conventionele methoden ver achter zich wat betreft de hoeveelheid data die kunnen worden opgeslagen en de duur van de houdbaarheid.
‘DNA is een heel bijzonder medium voor opslag op lange termijn,’ zegt Karin Strauss, computerontwerper bij Microsoft. ‘Je hoeft alleen maar voor een koele en droge omgeving te zorgen.’
Auteur: John Markoff
Vertaler: Frank Lekens
John Markoff is vast auteur voor The New York Times en schreef o.a. boeken en artikelen over de vervolging en gevangenname van hacker Kevin Mitnick.
The New York Times
Verenigde Staten | oplage 1.120.402
De krant der kranten, met als motto ‘All the news that’s fit to print’. Won meer journalistieke prijzen dan enig ander medium.

