21.06.2021

Для хранения данных в ДНК разработали цифровую файловую систему Это может быть шагом к использованию ДНК в качестве хранилища файлов

Текст Александр Пономарёв

Американские ученые из Массачусетского технологического института разработали способ поиска и извлечения отдельных файлов, хранящихся в виде ДНК

На сегодняшний день человечество успело сгенерировать около 10 триллионов гигабайтов данных — большая их часть хранится в центрах обработки данных, которые могут занимать несколько футбольных полей, а их строительство и обслуживание стоит около миллиарда долларов. Ученые считают, что альтернативным способом хранения данных может быть молекула ДНК, которая способна вмещать огромное количество информации. Цифровые системы хранения кодируют текст, изображения или любую другую информацию как последовательность нулей и единиц.

Эту же информацию можно закодировать в ДНК с использованием четырех нуклеотидов, составляющих генетический код: A, T, G и C. Есть у ДНК и несколько других особенностей, которые делают ее оптимальным носителем информации: она стабильна, ее легко синтезировать и секвенировать, она обладает высокой плотностью. Благодаря этому 1 эксабайт (миллиард гигабайтов) данных, хранящихся в виде ДНК, может уместиться на человеческой ладони. Одним из препятствий для такого типа хранения данных — высокая стоимость синтеза больших объемов ДНК. В настоящее время запись одного петабайта данных будет стоить около триллиона долларов.

Стоимость синтеза ДНК, по оценкам ученых, должна снизиться примерно на шесть порядков, чтобы хранить информацию в таком виде было выгодно. Это должно произойти в течение одного-двух десятилетий. Еще одна проблема — сложность поиска нужного файла среди всех остальных. Американские ученые заключили каждый файл данных в частицу диоксида кремния, помеченную короткими последовательностями ДНК, раскрывающими содержимое файла. Чтобы извлечь конкретное изображение, исследователи удаляли образец ДНК и добавляли праймеры, соответствующие нужным ярлыкам.

Праймеры помечены флуоресцентными или магнитными частицами, что позволяет легко извлечь и идентифицировать нужные файлы, не повреждая остальную часть ДНК. Этот процесс ученые сравнили с поиском изображений в Google по ключевым словам. Для этого они использовали одноцепочечные последовательности ДНК из библиотеки в 100 тысяч последовательностей длиной около 25 нуклеотидов каждая. Авторы исследования полагают, что новый метод инкапсуляции ДНК будет полезен для хранения больших объемов архивных данных, к которым обращаются довольно редко.

Использованные источники: