Microsoft записала в ДНК 200 МБ данных

Техника
мобильная версия
, Текст: Сергей Попсулин

Команда Microsoft записала 200 МБ данных в ДНК размером с крупинку соли. Исследования в этой области крайне перспективны, так как информация, записанная таким способом, занимает очень мало места и может храниться тысячи лет.


200 ГБ в песчинке

Исследовательская группа Microsoft при участии ученых из Вашингтонского университета поместила в цепочку ДНК в цифровом виде видеоклип This Too Shall Pass группы OK Go, Всеобщую декларацию прав человека на более 100 языках, 100 книг из общественной библиотеки «Гутенберг» и генетический банк семян Svalbard Global Seed Vault — всего около 200 МБ данных.

Указанные данные были записаны посредством процесса под названием синтезирование ДНК. ДНК (дезоксирибонуклеиновая кислота) — это длинная молекула, которая содержит команды для роста, развития, функционирования и репродукции любого живого организма на Земле.

«Это потрясающее хранилище данных, в котором хранится все относительно того, как работает живая система, — пояснил руководитель проекта от Вашингтонского университета Луис Энрике Цезе (Luis Henrique Ceze). — Мы просто взяли этот тип хранилища и поместили в него видео, изображения и документы».

Принцип записи

Цифровые данные представляют собой последовательность единиц и нулей. Исследователи из Microsoft и Вашингтонского университета придумали, как данные закодировать в молекуле ДНК (в биологии этот процесс называется синтезированием) и как их оттуда затем извлечь (секвенирование). Для этого они задали, как единицы и нули соответствуют четырем видам азотистых оснований в ДНК. Затем они обратились к компании Twist Bioscience, специализирующейся на генетике и производстве лекарств. Она синтезировала молекулу ДНК с помощью представленного алгоритма.

Молекула ДНК размером с крупинку соли помещена в пробирку (справа)

Помещенная в пробирку, молекула получилась похожей на крупинку соли. Она в разы меньше по сравнению с заточенным концом грифеля карандаша. 

Перспективы

Команда Microsoft — далеко не единственная, кто занимается исследованиями в области синтезирования и секвенирования цифровых данных. За последний год ученым удалось в тысячу раз увеличить плотность их записи. Интерес к этой области обусловлен двумя причинами.

Первая причина - эти технологии позволяют создавать хранилища с крайне высокой плотностью записи данных. В молекулу размером с крупицу соли вмещается 200 МБ, в молекулы объемом с кубик сахара-рафинада способны поместиться все данные, которые хранятся в одном дата-центре, а в объем размером с коробку под обувь — все данные, которые находятся в интернете на сегодняшний день. 

Вторая причина - данные, записанные в ДНК, можно будет прочесть через тысячи лет. Во-первых, ДНК - это такой тип хранилища, который не меняется. Он будет актуален всегда. Не нужно будет добиваться совместимости стандартов, как это происходит обычными технологиями хранения данных на магнитных, оптических и прочих накопителях. Во-вторых, ДНК очень долго хранится не разрушаясь - тысячи лет.