Drie jaar lang beten wetenschappers uit de hele wereld hun tanden stuk op de uitdaging om verborgen data uit een staal DNA te halen. Tot de Antwerpse bio-ingenieur en doctoraatsstudent Sander Wuyts er zich mee kwam bemoeien. Hij won de DNA Storage Bitcoin Award, haalde daarmee het zelfs het wereldnieuws, en is er zeker van dat we binnen enkele tientallen jaren de harde schijf gewoon vervangen door DNA. De toekomst is aan de biologische opslagschijf, die onze data eeuwenlang en hypercompact bewaart. Sander Wuyts is één van de 55 topsprekers tijdens de Big Data Expo op 26 april in Mechelen.

DNA Storage Bitcoin Award

In de niet eens zo verre toekomst zullen alle data van de hele wereld in de koffer van één auto passen. Dat is de stellige overtuiging van de Britse wetenschapper Nick Goldman, die al jaren onderzoek doet naar de mogelijkheid om data op te slaan in synthetisch DNA. Zijn redenering is simpel: als DNA onze eigen genetische gegevens eeuwenlang en tot in het kleinste detail kan bewaren, moet dat ook kunnen voor andere data.

Om zijn stelling kracht bij te zetten lanceerde hij in januari 2015 op het Wereld Economisch Forum in het Zwitserse Davos – de jaarlijkse hoogmis voor toppolitici, topondernemers en topacademici uit de hele wereld – een speciale uitdaging: de DNA Storage Bitcoin Award. Iedereen die zijn lezing bijwoonde, kreeg een DNA-staal mee naar huis waar Goldman een boodschap in verstopt had. Wie die boodschap als eerste vond én kon ontcijferen, won een Bitcoin.

De Antwerpse bio-ingenieur Sander Wuyts, momenteel doctoraatsstudent aan de Universiteit Antwerpen (UA) en aan de Vrije Universiteit Brussel (VUB), stapte pas mee in de race toen de deadline al opdoemde. “Ik had drie jaar geleden over de challenge gehoord, maar ik zag pas een paar maanden terug dat er nog steeds niemand in geslaagd was om de data uit het DNA-staal te krijgen. Ik heb professor Goldman een mail gestuurd, en hij heeft me last minute nog een proefbuis DNA opgestuurd.”

Eureka!

Normaal verdiept Wuyts zich in het labo microbiologie in probiotica. ‘Goede’ bacteriën, zeg maar. “Op het eerste zicht staat dat mijlenver af van data uit DNA-stalen halen, maar ook in de microbiologie gebruiken we DNA om deze gezondheidsbevorderende bacteriën te ontcijferen. We hadden de juiste skillset, we beschikten ook over de nodige apparatuur, het leek ons een leuk zijprojectje om in het DNA-staal op zoek te gaan naar de boodschap die Goldman er had ingestopt.

“Het DNA uitlezen, lukte tot onze eigen grote verbazing binnen de week. Als je de juiste apparatuur hebt, is dat redelijk straightforward. Stap twee – de code kraken - was een ander paar mouwen. Een DNA-molecuul bestaat uit twee lange strengen van zogenaamde nucleotiden – A(denine), T(hymine), G(uanine) en C(ytosine) – die in de vorm van een dubbele helix met elkaar verbonden zijn. Bij het decoderen komt het er dus op aan om de DNA-code om te zetten naar de binaire code waarmee we met de computer data schrijven. A, T, G en C moeten dus gedecodeerd worden, naar 0 en 1.”

“In het wereldvermaarde wetenschapsmagazine Nature is al eens een handleiding verschenen om data om te zetten naar DNA. In theorie moesten we dat procedé dus gewoon omkeren. Maar er is natuurlijk niemand die je zegt welke scripts en programma’s dat je daarvoor moet gebruiken. Die moesten we zelf schrijven.”

Dat lukte aardig, want Sander Wuyts vlamde alle andere deelnemers voorbij en slaagde er als eerste in om de code te ontcijferen. Hij haalde de boodschap van Goldman uit het DNA: een tekst-document en een PDF instructies om aan de Bitcoin te geraken, en een paar foto’s. “Dat was echt een Eureka!-moment, een beetje zoals in de stripverhalen.”

Biologische opslagschijf

De data die Goldman op het synthetische DNA-staal schreef, zijn slechts het tipje van de ijsberg. Microsoft slaagde er al in om 200 megabyte aan literatuur op een DNA-staal te schrijven, en maakt zich sterk dat het perfect mogelijk moet zijn om alle films die ooit gemaakt zijn op te slaan op een ‘biologische opslagschijf’ zo groot als amper één suikerklontje. Ook universiteiten over de hele wereld experimenteren volop met data-opslag in DNA.

Sander Wuyts is na zijn geslaagd experiment alvast een believer. “Data opslaan op DNA heeft een aantal enorme voordelen. Om te beginnen is DNA extreem duurzaam en stabiel. Van organismen die al 500 jaar lang op de zeebodem liggen, kunnen we nog altijd perfect het DNA ontleden. Een videocassette van nog geen 20 jaar oud krijgen we amper nog afgespeeld, en een dvd staat na een paar jaar ook gegarandeerd vol krassen.

“De densiteit van DNA is een tweede geweldige troef. Nu worden data bewaard in gigantische warehouses, die massaal veel energie opslorpen. Op DNA zo groot als een waterdruppel of een korrel zout kan je al ontzettend veel informatie kwijt. En je bewaart het gewoon in de diepvries, eeuwen aan een stuk.”

“De wedstrijd van Goldman had nog een hoog gimmick-gehalte. Maar ik geloof dat data storage binnen veertig à vijftig jaar wel eens gemeengoed kan zijn. Zeker voor heel grote hoeveelheden data die we niet vaak of niet meteen nodig hebben. Ik denk nu spontaan aan de data van de deeltjesversneller van het CERN. Die zijn zo belangrijk dat ze lang moeten meegaan, maar die we pas over een langere termijn gaan analyseren. Ideaal om te saven op DNA.”

USB-stick nog niet weggooien

Toch wachten we best nog even voor we onze harde schijven buitengooien, waarschuwt Wuyts. “Het is momenteel nog moeilijk en duur om DNA aan te maken. Je hebt een grote chemische printer nodig, die dingen kosten geld. Ook het (de)coderen vraagt nog veel tijd, in beide richtingen. Computertaal vertalen naar DNA-taal is niet evident en een DNA-code uitlezen ook niet. De data op een USB-stick tover je binnen een paar seconden tevoorschijn, een DNA-staal uitlezen kost al snel één tot twee dagen. (lacht) Als je een belangrijke vergadering hebt, sla je je presentatie best nog niet op DNA op. Maar dat zijn tijdelijke obstakels, die sneller dan we denken weggewerkt kunnen zijn.”

Sander Wuyts heeft de komende tijd nog doctoraatswerk op de plank liggen – de Bitcoin was een aardig extraatje, maar nu ook weer niet van die aard om al te gaan rentenieren – maar is naar eigen zeggen getriggerd om zich op termijn verder te verdiepen in de opslagmogelijkheden van DNA. “Ik ben bio-informaticus, en data opslaan op DNA is een uitstekend voorbeeld waarin twee interessante domeinen samenvloeien; biologie en informatica. Had ik voor de wedstrijd van Goldman samengewerkt met een straffe informaticus, dan denk ik dat we nog veel sneller de DNA-code hadden gekraakt. Dat soort kruisbestuivingen kan nog veel meer innovaties opleveren.”

Benieuwd naar de lezing ‘DNA: de toekomst voor data-opslag’ die Sander Wuyts zal geven op de Big Data Expo? Tijdens dit event in de Nekkerhal in Mechelen kan je nog 54 andere topsprekers aan het werk zien. Gratis inschrijven kan hier.