Microsoft построила хранилище данных на основе ДНК

Техника
мобильная версия
, Текст: Валерия Шмырова

Microsoft смогла автоматизировать процесс записи данных в ДНК и последующего прочтения этой информации компьютером. Это открывает возможность хранения информации в виде ДНК в дата-центрах в будущем. Однако пока что весь процесс является дорогостоящим и занимает много времени.


Открытие Microsoft

Компания Microsoft и исследователи из Вашингтонского университета успешно автоматизировали процесс перевода цифровой информации в ДНК и обратно в биты, создав первое в своем роде полностью автоматизированное хранилище данных на базе ДНК.

До этого уже проводились успешные эксперименты по записи данных в ДНК, однако полностью автоматическим процесс стал только теперь. Результаты эксперимента были опубликованы в журнале Nature Scientific Reports, также Microsoft сообщила о них на своем сайте.

Старший исследователь Microsoft Карин Штраус (Karin Strauss) пояснила, почему в процессе записи и извлечения данных из ДНК так важна автоматизация. «Наша глобальная цель — запустить в производство систему, которая для конечного пользователя будет выглядеть как любой другой облачный сервис: биты отсылаются в дата-центр и хранятся там, а потом просто появляются на компьютере, когда они нужны клиенту. Чтобы сделать это, мы должны были доказать, что это осуществимо с точки зрения автоматизации».

Хранилище еще будет совершенствоваться, но сама концепция уже доказана, и компания надеется, что это приведет к развитию технологий хранения информации с применением ДНК. К концу текущего десятилетия Microsoft намерена развернуть в дата-центре полностью функциональную систему хранения данных на базе ДНК.

Ход эксперимента

В качестве эксперимента исследователи зашифровали в ДНК слово «hello». Сперва потребовалось перевести его в биты, то есть представить в виде нулей и единиц, после чего слово приобрело вид 01001000 01000101 01001100 01001100 01001111.

Microsoft создала первую в мире автоматизированную систему записи данных в виде ДНК

Затем биты были перекодированы с помощью четырех базовых оснований ДНК: аденина (A), гуанина (G), цитозина (C) и тимина (T). Напомним, в молекуле ДНК с помощью сочетаний базовых оснований можно закодировать любую информацию. При этом используется не двоичная, а четверичная система, поскольку базовых оснований четыре.

Затем получившаяся цепочка ДНК была синтезирована в лаборатории и сохранена в виде жидкости. Компоненты, потребовавшиеся для синтеза, стоят недорого, оборудование для этого также используется не очень сложное, имеющееся в большинстве лабораторий, отмечает компания. После этого исследователи смогли прочитать сообщение с помощью ДНК-секвенсора, а затем посредством дешифрующей программы перевести его обратно в биты. Все ПО было разработано самой Microsoft.

Когда системе необходимо извлечь информацию, она добавляет другие химические вещества для подготовки ДНК, а затем использует микрофлюидные насосы для проталкивания жидкостей в другие части системы, которые «читают» последовательности ДНК и преобразуют ее обратно в информацию, понятную компьютеру.

Проблема времени и денег

Объем информации, с которой работали ученые, составлял 5 байт. Чтобы конвертировать данные в ДНК и обратно, понадобился 21 час. Однако исследователи уже нашли способ обработать таким же образом в два раза больше информации всего за 12 часов. Создание образца ДНК с записанным в нем «hello» обошлось в $10 тыс., но ученые уже также смогли предложить пути снижения стоимости на несколько тысяч долларов.

Как поясняет Крис Такахаши (Chris Takahashi), старший исследователь в Школе компьютерных наук и инженерии имени Пола Аллена Вашингтонского университета, синтезаторы и секвенсоры, хоть и выполняют ключевые функции в процессе, все еще недостаточно самостоятельны. На определенных этапах эксперимента требуется ручная работа сотрудников лаборатории. Эту проблему нужно решить для коммерческого использования находки. «У вас по дата-центру не может бегать толпа людей с пипетками — слишком велик риск человеческой ошибки, это слишком дорого, и они будут оставлять за собой слишком большой след», — поясняет он.

Зачем это нужно

В ходе преобразование «hello» в нуклеотиды было получено примерно 1 мг ДНК, и ещё около 4 микрограммов было использовано для записи последовательности действий. Как отмечает Technology Review, при таких объемах все данные, размещенные сегодня в обычном ЦОДе размером со склад, с помощью ДНК можно уместить в пространство размером с несколько игральных костей. В этом и заключается одно из преимуществ записи данных в ДНК.

Кроме того, в усовершенствованном виде технология позволит хранить информацию гораздо дольше, чем это возможно сейчас. Microsoft отмечает, что некоторые образцы ДНК хранились на протяжении десятков тысяч лет в бивнях мамонтов и костях древних людей — при том, что условия хранения были далеки от идеальных.

Прежние достижения

В июле 2016 г. Microsoft объявила, что впервые поместила в ДНК 200 Мб информации, включая музыкальное видео. По размеру фрагмент ДНК получился как крупица соли. Компания характеризовала процесс изготовления нитей ДНК, из которых состоят спирали, как трудоемкий и дорогой. В своем демонстрационном проекте по размещению 200 Мб Microsoft использовала более 13 тыс. уникальных фрагментов ДНК. На свободном рынке этот объем, по оценке экспертов, стоит примерно $800 тыс. Еще одной проблемой являлась автоматизация записи информации в ДНК.

Также в 2016 г. компания Technicolor, празднуя 100-летний юбилей, представила проект по переводу классики мирового кинематографа на молекулярный уровень. В работе были использованы технологии специалистов Гарвардского университета, которые в 2012 г. сохранили в одном грамме ДНК 5,5 Петабит данных.

Первым переведенным в ДНК фильмом стала одна из первых картин в истории кино «Путешествие на Луну» Жоржа Мельеса (Maries-Georges-Jean Melies). Из нулей и двоичного кода он был переведен в код искусственной ДНК и превращен в молекулу. По мере необходимости его можно расшифровать в обратном порядке и перевести в обычную «цифру». Таким образом, занимающий квадратные километры киноархив «можно уместить в одном кирпичике Lego».