Рубрики
Татар-информ
©2023 ИА «Татар-информ»
Учредитель АО «Татмедиа»
Новости Татарстана и Казани
420066, Республика Татарстан, г. Казань, ул. Декабристов, д. 2
+7 843 222 0 999
info@tatar-inform.ru
Ученые сумели сохранить в ДНК четыре графических файла
Хранение цифровой информации в ДНК привлекает исследователей из-за высокой плотности и надежности.
(Казань, 9 апреля, «Татар-информ»). Сотрудники исследовательского подразделения Microsoft и Вашингтонского университета усовершенствовали методику хранения данных в молекулах ДНК. В эксперименте им удалось сохранить и впоследствии прочитать четыре графических файла размером от 5 до 24 Кбайт. Результаты работы опубликованы в ASPLOS, пишет N+1.
Хранение цифровой информации в ДНК привлекает ученых из-за высокой плотности (по примерным расчетам – до 1 млрд. Гбайт на кубический миллиметр) и надежности (период полужизни более 500 лет). Обращение к хранилищу производится существующими методиками синтеза ДНК (запись), ПЦР-амплификации и секвенирования (считывание). Пока эти технологии слишком дороги, но их стоимость быстро снижается.
Физической единицей хранения данных является последовательность из 100-200 нуклеотидов, содержащих 50-100 бит. Соответственно, для хранения объекта данных (например, файла) понадобится множество таких фрагментов, собранных в пул. Исследовали выбрали простую архитектуру ключ-значение (имя файла – содержимое файла). Ключом служит пара праймеров ПЦР, указывающих, какие именно фрагменты ДНК подлежат считыванию, то есть позволяют проводить адресацию с произвольным доступом.
Еще одна проблема, стоявшая перед учеными, заключается в том, что существующие технологии синтеза и секвенирования ДНК не защищены от ошибок, которые составляют до 1 процента нуклеотидной последовательности. Чтобы преодолеть ее, использовали модифицированное кодирование Голдмэна. Каждый олигонуклеотид с праймерами сохраняли в трех копиях. Доступ к ним производили с помощью логического оператора XOR, который позволяет по двум любым фрагментам ДНК восстановить третий. Исследователи отмечают, что уровень избыточности хранения поддается настройке для достижения необходимой точности воспроизведения данных.
В ходе эксперимента ученым удалось записать в ДНК четыре графических файла. Каждый файл сохранили в двух копиях – кодированием Голдмэна и XOR-кодированием. В сумме восемь операций записи произвели 45 тыс. 652 последовательности из 120 нуклеотидов общей емкостью 151 Кбайт. После этого файлы успешно восстановили.
«Кремниевые технологии, разработанные компьютерной индустрией, внесли значительный вклад в развитие биотехнологий. Возможно, сейчас приходит время отдать долг», - пишут исследователи.
Следите за самым важным в Telegram-канале «Татар-информ. Главное», а также читайте нас в «Дзен»