Хранение информации в молекуле ДНК бьет все рекорды
Ученым удалось закодировать в молекулу ДНК целую книгу с иллюстрациями: 5,27-мегабитный том содержит 53246 слов, 11 фотографий в формате JPEG, программу JavaScript и представляет собой крупнейший массив небиологической информации, закодированной таким способом.
Молекула ДНК способна хранить огромные массивы информации. Теоретически, в одном нуклеотиде (азостистом основании, являющимся единицей нити ДНК) можно закодировать два бита данных – таким образом, каждый грамм двунитевой молекулы ДНК может хранить 455 экзабит данных (1 экзабит = 1018 байт). Такая плотность упаковки превосходит неорганические устройства хранения информации, такие как флэш-память, жесткие диски или даже методы квантовой вычислительной техники.
Книга (которая является монографией о синтетической биологии) была закодирована в молекулу ДНК генетиками Джорджем Черчем (George Church) и Шрирам Косури (Sriram Kosuri) из Института Биоинженерии Висса (Wyss Institute for Biologically Inspired Engineering) в Бостоне (Массачусетс, США), и Яном Гао (Yuan Gao), инженером по биомедицине из Университета Джонса Хопкинса в Балтиморе (Johns Hopkins University) (Мэрилэнд, США). Результаты исследования были опубликованы в журнале Science.
Проведенная работа является наиболее успешной среди подобных проектов, в крупнейшем из которых в молекулу ДНК было закодировано менее чем 1/600 нынешних данных. Однако время, когда человечество сможет пользоваться органическими дисковыми накопителями, еще довольно далеко. Существует множество причин, по которым этот метод не подойдет для повседневного использования. К примеру, как сохранение, так и извлечение данных пока требует многодневной работы в лаборатории – для считывания информации необходимо провести секвенирование ДНК или ее синтез de novo.
«Проведенная работа демонстрирует потенциал нетрадиционных подходов к решению проблемы хранения данных», - говорит Стюарт Паркин (Stuart Parkin), разрабатывающий твердые формы неорганических носителей информации в Центре Спинтронных Наук и Устройств IBM-Стэнфорд (IBM-Stanford Spintronic Science and Applications Center) в Сан-Хосе (Калифорния, США). «Можно сказать, что область физической науки истощила свой потенциал, и теперь нам приходится выходить за ее пределы, - рассказывает Паркин, - Объединение биологии и физики приведет к созданию очень интересных устройств для хранения информации в следующем десятилетии».
«Кодирование книги в ДНК не потребовало овладения фундаментально новыми технологиями, - объясняет Энн Кондон (Anne Condon), специалист в области вычислительной техники Университета Британской Колумбии (University of British Columbia) в Ванкувере (Канада), исследующая возможности использования ДНК в компьютерных системах.
Предыдущие попытки хранить информацию в ДНК были сопряжены с трудностями в создании длинной молекулы ДНК. С короткими молекулами меньше проблем, поэтому Черч и его коллеги конструировали нити ДНК длиной 159 нуклеотидов и создавали множественные копии каждой, для того чтобы упростить процесс выявления и коррекции мутаций.
Девяносто шесть нуклеотидов из каждой одноцепочечной молекулы ДНК представляли собой закодированные двоичным кодом данные, 19 нуклеотидов хранили информацию о том, как эти данные должны быть организованы, и 44 нуклеотида облегчали процесс секвенирования. В двоичном коде «0» соответствовал нуклеотидам А (аденин) и С (цитозин) и «1» – нуклеотидам G (гуанин) и T (тимин).
По словам Кондон, новая технология больше подойдет для решения специализированных задач, когда нужно долгое время хранить данные без необходимости считывания.
«Таким образом, время хранения информации может достигать нескольких веков, - говорит Косури, - Даже если другие технологии хранения устареют, как устарели магнитная лента и флоппи-диски, исследователи всегда будут пытаться улучшить технологию для считывания и записи ДНК, поскольку это основная молекуля биологии».
Со временем стоимость секвенирования и синтеза ДНК снизится, что позволит технологии хранения данных в молекуле ДНК выйти за пределы области демонстрационных проектов. За 4 года стоимость методик секвенирования уже упала в тысячу раз, а стоимость синтеза ДНК сейчас составляет доли от ее стоимости 8 лет назад.
По материалам NatureNews