В молекула, която може да се побере на върха на молив, са поместени 200 мегабайта данни, а именно видеоклип на групата OK Go на песента „И това ще мине“ на английски, копие от Всеобщата декларация за правата на човека на различни езици, 100 от най-четените книги от проекта Гутенберг и база данни на World Wide Fund от култивирани растения.
Учените в продължение на няколко години се опитват да създадат устройство за съхранение на данни на основа на ДНК. През 2012 г. на ДНК верига е записана първата книга, през 2013 г. Европейския институт по биоинформатика записва върху ДНК 739 килобайта информация, включително текст, изображения и аудио запис на речта на Мартин Лутър Кинг „Имам една мечта“. Наскоро учени от Харвард са успели да запишат и след това да прочетат 22 мегабайта, включително френския ням филм „Пътуване до Луната“.
Снимка: Тара Браун/ Университет на Вашингтон
За да се чете информация от ДНК, тя трябва бъде секвенирана по същия начин, както се прави при декодиране геномите на живи същества. Търсенето на определени последователности в цялата молекула също е възможно, което е много важно за бъдещето на „ДНК флашките“.
Какъв ще е максималният капацитет памет на такова устройството, е трудно да се каже. Миналата година бе публикувана една статия, в която авторите оценяват потенциала на устройство с размерите на песъчинка за съхранение на един екзабайт (1018 байта, или около един милион терабайта). Това означава, че целият интернет, записан с помощта на нуклеотиди, ще се вмести в кутия за обувки.
Въпреки това, дори и ако някой измисли такова устройство, то неговото използване би било много скъпо, защото записът на информация на ДНК изисква много големи инвестиции, копиране на информацията от нея е доста трудно, четенето става бавно.
Въпреки това, експертите от Вашингтонския университет и Майкрософт не виждат основателни причини, поради които процесът да не бъде поевтинен и ускорен.
Луис Енрике Сезе, доцент по компютърни науки и инженерство и главен изследовател на университета на проекта, казва, че биотехнологичната промишленост е направила големи постижения в двете – синтезиране (кодиране) и секвениране (декодиране) на данни, през последните години. Дори и така, каза той, екипът все още има да извърви дълъг път, за да я превърне в жизнена технология за архивиране.
Учените казват, че техният разнообразен екип от компютърни специалисти, компютърни архитекти и молекулярни биолози вече е увеличил капацитета за съхранение хиляди пъти през последната година. И те смятат, че могат да направят големи постижения и в скоростта чрез прилагане на принципи на компютърната наука като корекция на грешки към процеса.
Съхраняването на цифрови данни за ДНК работи по следния начин:
Първо данните се превежда от 1 и 0 в „буквите“ на четирите основни нуклеотиди на ДНК нишката – (А)денин, (С)итозин, (G)уанин и (Т)имин.
След това те иползват Twist Bioscience, който да преведе тези букви, които все още са в електронен вид, в самите молекули, и да ги изпрати обратно. Това е по същество една епруветка, в която е почти невъзможно да се види какво има в нея. Прилича малко на сол, която се суши в дъното.
За четене на данните се използва биотехнологично „издърпване“ към памет с произволен достъп (RAM), друга концепция взета назаем от компютърните науки. Екипът използва полимеразна верижна реакция (PCR) – техника, която молекулярните биолози използват рутинно за манипулиране на ДНК, за да размножат или „усилят“ нишките, които иска да възстановят. След като увеличат рязко концентрацията на желаните откъси, те вземат проба, секвенират или декодира ДНК и след това пускат изчисление за корекция на грешката.