В последние несколько лет, ученые расшифровали геном мамонта и лошади возрастом 700 000 лет, используя фрагменты ДНК, извлеченные из останков. ДНК, безусловно, остается гораздо дольше, чем организмы, для которых она несет в себе генетические коды. Компьютерные ученые и инженеры давно мечтают, чтобы сдерживать миниатюрные и устойчивость ДНК для хранения цифровых данных. Они хотят, чтобы у всех этих нулей и единиц в молекулы, A, C, G и T, которые образуют винтовую лестницу полимеров ДНК и достижения этого десятилетия, в области синтеза и секвенирования ДНК, привели к серьезному прорыву. Недавние эксперименты показали, что в один прекрасный день мы будем быть в состоянии код все цифровой информации в мире в несколько литров ДНК и прочитать его снова, спустя тысячи лет.
Интерес со стороны Microsoft и других технологических компаний увеличивает напряжение в этой области. В прошлом месяце, Microsoft Research сказал, что будет платить стартапу в области синтетической биологии Twist Bioscience определенную сумму, чтобы создать 10 миллионов цепей ДНК разработанных компьютерных ученых компании Microsoft для хранения данных. Ведущий производитель памяти Micron Technology также финансирует исследования хранение данных в ДНК, чтобы определить, является ли система на основе нуклеиновой кислоты, расширить границы электронной памяти. Этот приток денег и интерес может постепенно уменьшить непомерные расходы, и, что хранение данных в ДНК позволило уже через десять лет, говорят исследователи.
Люди сгенерируют более 16 трлн гигабайт цифровых данных до 2017 года. года, и большую часть этого вам нужно будет архивировать. Правовые, финансовые и медицинские данные, и, конечно, мультимедийные файлы. Сегодня данные хранятся на жестких дисках, оптических дисков в энергоемких дата-центрах размером со склад. В лучшем случае, эти данные хранятся тридцать лет, в худшем случае — несколько. Кроме того, как говорит компьютерный архитектор Microsoft Research Кэрин Штраус, «мы производим гораздо больше данных, чем есть время, чтобы промышленность по производству устройств для хранения данных, как и прогнозы показывают, что этот разрыв будет расти».
А теперь добавим ко всему этому ДНК. Она живет века, если держать его в сухом прохладном месте. Теоретически, с ее помощью вы можете упаковать млрд. гигабайт данных в объем кубика сахара. Магнитной ленты, плотнейшая из современных носитель для хранения данных, умещают 10 мб в одном и том же объеме пространства. «ДНК — это невероятно крепкий, прочный и энергонезависимый носитель данных», говорит Ольгица Миленкович, профессор электротехники и вычислительной техники Университета штата Иллинойс в Урбана-Шампейн.
Все потому, что каждый из четырех строительных молекул — аденин (А), цитозин (C), гуанин (G) и тимин (T) — необходимо кубический нанометр в объеме. С помощью системы кодирования — скажем, где И представляет битов «00», C представляет «01» и так далее — ученые могут, что ряды нулей и единиц, формирование цифровых файлов с данными, и создать цепочку ДНК, которая содержит фото или видео. Конечно, эта техника кодирования гораздо сложнее, чем мы тут вам писали. Синтез дизайнер цепи ДНК — это процесс записи данных. Затем ученые могут их прочитать, секвенируя цепи.
Генетик Гарвардского университета Джордж Церкви основал эту область исследований в 2012 году. году, закодировав 70 миллиардов экземпляров книги — один миллион gigabit — в кубическом миллиметре ДНК. Спустя год, ученые из Европейского института биоинформатики показали, что могут читать без единой ошибки, 739 килобайт данных, заключенных в ДНК.
В прошлом году несколько команд ученых показали, полностью функционирование системы. В августе ученые Е. Т. H Цюрих инкапсулировали синтетические ДНК в стекло, подвергнуты условиям, моделирующим истечении 2000 лет, и полностью восстановлен закодированные данные. Параллельно с этим, Миленкович и ее коллеги сообщили о сохранении страниц Википедии силами шести американских университетов в ДНК, и — давая последовательностям конкретные «адреса» — выборочно читаете и изменение произведения, написанные текста. Случайный доступ к данным очень важно, чтобы избежать необходимость «секвенировать всю книгу, чтобы прочитать только один абзац», — говорит Миленкович.
В апреле Штраус и ученые Джорд Силиг и Луис Цезе из Вашингтонского университета сообщили о том, что они смогли записать три файла изображения, каждый в несколько десятков килобайт, в 40 000 цепей ДНК, используя свою схему кодирования, и после того, как их считать по отдельности, не признают ошибки. Работы были представлены в апреле на конференции Ассоциации вычислительной техники. С более чем 10 миллионов цепочек, которые Microsoft покупает от Twist Bioscience, ученые планируют доказать, что данные ДНК может храниться в гораздо более широких масштабах. «Наша задача — показать конечную систему, в которой мы кодируем файлы ДНК, синтезируем молекул, мы храним их в течение длительного времени, а затем исправили, секвенируя ДНК, — говорит Он. — Мы начинаем с биты и вернулись к бит».
Производитель памяти Micron исследования ДНК, как посткремниевой технологии. Компания финансирует работы Черча и учеными Университета штата Айдахо, чтобы создать без ошибок система хранения данных в ДНК. «Рост стоимости хранения данных будет стимулировать альтернативные решения и хранения ДНК является одним из наиболее перспективных решений», — говорит Гуртей Санду, директор департамента разработки перспективных технологий в Micron.
Ученые все еще ищут способы, чтобы уменьшить количество ошибок при кодировании и декодировании данных. Но основные части технологии уже на земле. Итак, что же мешает нам перейти от хранения данных размером с обувную коробку до стекла капсулы с ДНК? Стоимость. «Процесс записи в миллион раз дороже», — говорит Силиг.
И вот почему: создание ДНК включает в себя нанизывание молекул нанометров размером один на один с высокой точностью — это задача не из легких. И хотя цена на порядок упал из-за быстро развивающегося спроса на эту услугу, синтез ДНК не имел такого водителя на рынке. Миленкович заплатила около 150 долларов, чтобы создать массив из 1000 синтезированных нуклеотидов. Последовательности миллионов нуклеотидов стоит около цента.
Интерес для хранения данных от Microsoft и Micron может быть именно то, что импульс, что необходимо для начала снижения затрат, говорит Силиг. Умная инженерия и новые технологии микрофлюидики и нанопорового секвенирования ДНК, которые помогают уменьшить и ускорить процесс, а также будет способствовать продвижению. Сейчас занимает несколько часов, чтобы секвенировать несколько сотен пар нуклеотидов — и дни, на их синтез — используя кучу оборудования. Я хотел бы потратить все это в небольшой коробке, в противном случае преимущество плотности хранения данных будет потерян.
Если все работает, Он воображает, что появление компаний, которые предлагают услуги для хранения архивных ДНК в течение следующего десятилетия. «Вы сможете открыть браузер и загружать файлы на свой сайт или забрать байт назад, как на облаке», говорит она. Или может быть купить диск ДНК вместо жесткого диска.
В один прекрасный день, мы будем в состоянии получить код, вся информация мира в несколько литров ДНК
Илья Хель