Британские исследователи сообщили о том, что им удалось закодировать сонеты Шекспира, речь Мартина Лютера Кинга и множество фотографий в ДНК, а позже — успешно расшифровать закодированные данные и восстановить всю записанную информацию. Плотность «записываемой» на ДНК информации составила 2,2 петабайт на 1 грамм, что в 3 раза компактнее предыдущих аналогичных методик. Результаты этой работы представлены в журнале Nature.
Впервые хранить цифровые данные на ДНК попробовали Шрирам Косури (Sriram Kosuri) и Джордж Черч (George Church) из Гарвардской медицинской школы в 2011 году. Они сообщили о том, что записали копию одной из книг Черча на ДНК и еще некоторые данные с плотностью 700 терабит на 1 грамм. Это в 6 раз превышает возможности современных компьютеров. Однако молекулярные биологи Ник Голдман (Nick Goldman) и Иван Бирни (Ewan Birney) из Европейского биоинформационного института (European Bioinformatics Institute) в Хинкстоне превзошли этот рекорд.
Голдман и Бирни сперва перевели всю подлежащую записи информацию в обычный бинарный код, состоящий из 0 и 1. Затем код был переведен в троичный (0, 1 и 2), чтобы избежать ошибок при декодировании. Затем эти данные были записаны последовательностями азотистых оснований ДНК — А, Г, Ц и Т. Таким образом им удалось записать 2,2 миллиона гигабит информации, что эквивалентно 468 тысячам полных DVD-дисков. Добавление дополнительных коррекционных схем позволило избежать ошибок при декодировании и восстановить всю записанную информацию со 100-процентной точностью.
Теперь ученые размышляют, как можно применить эти гигантские возможности для хранения информации, которые предоставляет им ДНК. По их словам, один только Большой Адронный Коллайдер, находящийся в Женеве, ежегодно генерирует 15 петабайт различной научной информации. В настоящее время эти данные хранятся на магнитных лентах, однако такой способ хранения дорогостоящ и требует периодической перезаписи данных. ДНК же остается в стабильном состоянии тысячи лет при хранении в сухом прохладном месте. При этом стоимость записи и расшифровки данных с нее значительно ниже, и постоянно продолжает снижаться.
Однако и у новой методики есть некоторые минусы. Например, записанную на ДНК информацию уже нельзя подкорректировать или перезаписать новые данные поверх. Кроме того, если вам нужен только один определенный кусок информации, вам все равно придется расшифровать весь записанный на ДНК объем данных и потом искать среди них нужную вам информацию. Но исследователи надеются, что в ближайшее время им удастся исправить эти недочеты.
Ссылки по теме:
— Nature, 23.01.2013, doi:10.1038/nature11875
Создана «тайнопись» кишечной палочкой — 05.10.2011
Фото © shutterstock.com
|