ДНК — многофункциональная биомолекула с множеством природных ролей. Ранее ученые смогли найти для нее еще и ряд технических приложений: например, в качестве хранилища данных. Теперь им удалось увеличить емкость и повысить надежность «ДНК-флешки» за счет введения в нее семи дополнительных букв-нуклеотидов.
Представьте ДНК, на которую вместо генов человека или, скажем, бактерии записаны музыка, изображения и другие медиафайлы. Сейчас такие устройства становятся реальностью. Технология «ДНК-флешки» существует уже несколько лет, однако в новой статье в Nano Letters ученые изменили химический состав этой молекулы и усовершенствовали технологии ее «чтения» (секвенирования). Благодаря этому они создали более емкий и устойчивый накопитель данных.
Эпоха цифровой информации сопровождается постоянным накоплением новых больших данных. При этом старые бумажные носители постоянно оцифровывают, чтобы сохранить в случае опасности и сэкономить пространство.
«ДНК — один из лучших, если не самый лучший вариант, особенно для хранения архивных данных», — говорит Чао Пань (Chao Pan), участвовавший в новом исследовании. Его коллега Касра Табатабаи (S. Kasra Tabatabaei) добавляет: «Ежедневно интернет генерирует несколько петабайт данных (десять в пятнадцатой степени байт. — Прим. ред.). Всего одного грамма ДНК достаточно, чтобы сохранить этот объем информации. Настолько велика емкость ДНК как цифрового хранилища».
К тому же ДНК очень устойчива и долговечна. Эта биомолекула сохраняется в окружающей среде десятки и даже тысячи лет, не теряя закодированную в ней информацию. Благодаря этому ученые извлекают и секвенируют ДНК из давно погибших и окаменевших организмов.
Обычно ДНК представляет собой спираль из двух цепочек, каждая из которых образована «буквами» четырех видов — это так называемые нуклеотиды: A, T, C и G. Именно в их последовательности — или, как говорят молекулярные биологи, первичной структуре — закодирована генетическая информация.
Однако авторам новой статьи этого показалось недостаточно. Они дополнили четыре природных нуклеотида ДНК семью новыми, которые имеют другую структуру. Выходит, их версия ДНК состоит из 11 различных букв — это намного повысило информационную емкость молекулы.
«Мы опробовали 77 разных комбинаций этих 11 нуклеотидов и выяснили, что наш метод их превосходно различает», — утверждает Пань. Он назвал задействованную платформу универсальной и способной успешно различать химически модифицированные нуклеотиды при решении других задач.