Цифровое бессмертие
Способы хранения и использования данных в течение миллионов лет
НЛО, июнь 2015 | Должен ли умный знать то, что знает каждый дурак? |
Используя свойство информации быть инвариантной относительно своего материального носителя, данные, содержащиеся в мозге человека, можно воспроизвести на другой физической основе, скажем при помощи некой кибернетической машины… (памятник себе)
Чтобы хранить данные нужно всего лишь иметь носитель, на котором эти данные и хранятся. Все просто. Правда, еще нужно данные эти записать, а потом - извлечь. Мы уже знаем много всяких носителей: бумага, магнитная лента, дискета, жесткий диск, оптический диск, флэшка, ну и т. д. Как всегда, здесь есть две беды: сохранность самого носителя и плотность записи. Правда есть еще две важные характеристики запоминающих устройств: время доступа и скорость передачи данных.
Сохранность носителя, это Проблема. Бумага долго не храниться, но если принять специальные меры, архивы служат долго. Камень, как носитель информации, более надежен – наскальным рисункам тысячи лет. Вот только плотность записи на них очень невысокая. Если информацию записывать в нечитаемом для человека виде, то можно значительно повысить плотность «упаковки» и использовать иные носители - магнитные ленты, диски и др. Для повышения этой плотности, можно использовать различные ухищрения – изменить способ представления информации – как усложняя (используя различные коды и иные преобразования «алфавита»), так и упрощая представления (оцифровка в простейшем случае, используя 0 и 1), а можно придумать носители на иных физических принципах, отличных от систем восприятия человека. Чем люди уже давно и занимаются.
Например, исследователи IBM недавно продемонстрировали технологию записи данных на поверхности линейной магнитной ленты с рекордной плотностью 123 млрд бит несжатых данных на квадратный дюйм при минимальных затратах. Такую емкость можно сравнить с ленточным картриджем объемом 220 Тб, который помещается на ладони. 220 Тб данных сопоставимы с 1,37 трлн мобильных сообщений или текстов 220 млн книг, для размещения которых потребовались бы книжные полки общей длиной в 2200 км. Примерно столько же составляет расстояние от Лас Вегаса до Хьюстона (штат Техас).
Или, например, для НМД (накопителей на магнитных дисках – винчестеров) технологию SOMA - самоорганизующиеся магнитные решетки. Данная технология предусматривает формирование на поверхности диска монодисперсного слоя "самоорганизующихся магнитных массивов" из мельчайших однородных железно-платиновых конгломератов размером около 3 нм (3 нм - это 10-15 атомов твердого вещества, выложенных в ряд). Применение этой "нанотехнологии" позволит существенно снизить уровень нестабильности отдельных магнитных зерен и уменьшить размеры домена.
Ученые из университета Тохоку, Япония, создали устройство, позволяющее записать 4 Тб данных на один квадратный дюйм, используя экспериментальный метод "магнитоэлектрической" записи и считывания данных. Установленный рекорд, согласно данным журнала Applied Physics Letters, издаваемым американским Институтом физики, в восемь раз превышает значения плотности записи данных в самых современных накопителях на жестких магнитных дисках. Записывающее и считывающее устройство, по сути, представляет собой острый наконечник, который движется в контакте с поверхностью носителя информации. Для записи данных используют электрические импульсы, действующие через наконечник на магнитоэлектрический материал носителя. Эти импульсы изменяют электрическую поляризацию и нелинейную диэлектрическую константу небольшой круглой области материала в месте соприкосновения с наконечником. Для чтения данных используется тот же самый наконечник, с помощью которого обнаруживаются изменения нелинейной диэлектрической константы материала в месте контакта с поверхностью.
В общем – нужно что-то делать.
Носитель информации
Изучая окружающий мир, ученые инженеры неожиданно обратили внимание на естественную природу. Любой человек с низким уровнем развития ума (дурак) знает, что гены хранят ИНФОРМАЦИЮ о наследственности и храниться эта информация в ДНК. Осталось только записать нужную нам информацию в ДНК и все.
Однако, такой простой вывод получился в результате столетних изысканий. Наука о химических процессах, лежащих в основе жизнедеятельности живых клеток и организмов и о их химическом составе называется Биохи́мия (биологи́ческая, или физиологи́ческая хи́мия). Возникнув как наука о химии жизни в конце XIX века, чему предшествовало бурное развитие органической химии, биохимия отличается от органической химии тем, что исследует только те вещества и химические реакции, которые имеют место в живых организмах, прежде всего в живой клетке. Согласно этому определению, биохимия охватывает также многие области клеточной биологии и включает в себя молекулярную биологию. После выделения последней в особую дисциплину, размежевание между биохимией и молекулярной биологией в основном сформировалось как методологическое и по предмету исследования. Молекулярные биологи преимущественно работают с нуклеиновыми кислотами, изучая их структуру и функции, в то время как биохимики сосредоточились на белках, в особенности на ферментах, являющихся катализаторами биохимические реакции. В последние годы термины «биохимия» и «молекулярная биология» часто используются как синонимы.
В 1953 году американский биолог Дж. Уотсон и английский физик Ф. Крик опираясь на работы М. Уилкинса и Р. Франклин описали структуру ДНК — ключ к пониманию принципов передачи наследственной информации. С химической точки зрения ДНК — это длинная полимерная молекула, состоящая из повторяющихся блоков — нуклеотидов – мономеров биополимерных молекул нуклеиновых кислот, находящихся в ядре клетки. Основная функция этих кислот - хранение и кодирование генетической информации. С молекулами ДНК связаны два основополагающих свойства живых организмов — наследственность и изменчивость. В ходе процесса, называемого репликацией ДНК, образуются две копии исходной цепочки, наследуемые дочерними клетками при делении, отсюда следует, что образовавшиеся клетки оказываются генетически идентичны исходной. Это – только начало размножения клеток!
В 2013 г. швейцарские ученые предложили новый способ хранения ДНК, позволяющий этому соединению стать реальным средством хранения информации на протяжении нескольких тысячелетий. Новую технологию представили в журнале Angewandte Chemie, а коротко о ней сообщает New Scientist.
Исследователи постарались воссоздать условия консервации ДНК в окаменелостях. Они закрыли кислоту от воды и других факторов внешней среды с помощью микроскопических шариков из диоксида кремния. Для проверки своего метода ученые записали на ДНК два документа — Федеративную хартию 1291 года и палимпсест Архимеда (всего они занимают 83 килобайта). ДНК-версии текстов держали по неделе при различных температурах, моделируя процесс старения. По мнению ученых, при температуре около 10 градусов Цельсия тексты могут храниться в неприкосновенности примерно две тысячи лет. При минус 18 (такова температура во Всемирном хранилище семян на Шпицбергене) ДНК-данные продержатся несколько миллионов лет.
Всего одного грамма ДНК в принципе хватит для записи 455 эксабайт (это умножить на 1018, или около 260 байт данных), для сравнения, объем всех цифровых данных в мире к 2009 году достиг 800 эксабайт. Прочность и долговечность ДНК также внушает оптимизм: ее успешно извлекли для расшифровки из костей лошади возрастом 700 тысяч лет. Однако для сохранности этого носителя необходимы специфические условия.
Грасс хотел бы записать на ДНК все, что создало человечество, однако при
нынешнем уровне развития технологии это слишком дорого. Для записи 83
килобайтов потребовалось около полутора тысяч долларов — а кодировка данных всего
лишь ресурса Wikipedia обойдется уже во много миллиардов.
Согласно прогнозу агентства IDC, к 2020 году объем данных, созданных и сохраненных человечеством, достигнет 40 000 эксабайт. Это 40 трлн гигабайт, или 5200 гигабайт на душу населения. Для хранения всей этой информации было бы достаточно менее 100 г ДНК.
Запись информации
Всем известен геном — совокупность генов в нашей ДНК. Есть намного более сложная совокупность человеческих белков под названием протеом — с куда более обширным алфавитом, чем четыре буквы генома. Есть также производные от них — эпигеном, то есть совокупность, невообразимо более мощная, чем геном — список всех его возможных состояний с теми или иными включенными и выключенными генами. Можно упомянуть и фолдом (foldome) — совокупность всех вариантов сворачивания вышеупомянутых белков.
Уровни упаковки ДНК.
1 - молекула (цепь) ДНК; 2 - нуклеотиды (азотистые основания); 3 - двухнитчатая спираль ДНК; 4 - ген (участок спирали выделен красным цветом); 5 - гистон; 6 - упаковка ДНК в хроматине; 7 - упаковка ДНК в хромосоме; 8 – хромосома. Обозначения нуклеотидов: A - аденин; C - цитозин; G - гуанин; T - тимин (или U - урацил)
Роберт Грасс (Robert Grass) и его коллеги из Швейцарского федерального технологического института в Цюрихе работали с простейшим методом кодирования информации в ДНК: аденин (А) и цитозин (С) воспринимаются как 0, а гуанин (G) и тимин (T) как 1. Чтобы физическое повреждение ДНК не привело к возникновению невосполнимых пробелов, ученые применили известный метод коррекции ошибок — код Рида — Соломона (создание избыточных блоков информации, помогающих при восстановлении поврежденных данных).
От памяти – к вычислениям
Биокомпьютер — компьютер, который функционирует как живой организм или содержит биологические компоненты. Создание биокомпьютеров основываются на молекулярных вычислениях - это направление в исследованиях. В качестве вычислительных элементов используются белки и нуклеиновые кислоты, реагирующие друг с другом. Для создания вычислительных элементов используется генетическая инжене́рия (генная инженерия) — совокупность приёмов, методов и технологий получения рекомбинантных РНК и ДНК, выделения генов из организма (клеток), осуществления манипуляций с генами и введения их в другие организмы.
Генетическая инженерия не является наукой в широком смысле, но является инструментом биотехнологии, используя методы таких биологических наук, как молекулярная и клеточная биология, цитология, генетика, микробиология, вирусология. Генная инженерия служит для получения желаемых качеств изменяемого или генетически модифицированного организма. В отличие от традиционной селекции, в ходе которой генотип подвергается изменениям лишь косвенно, генная инженерия позволяет непосредственно вмешиваться в генетический аппарат, применяя технику молекулярного клонирования.
Молекулярные компьютеры — вычислительные системы, использующие вычислительные возможности молекул (преимущественно, органических). Можно сказать, что молекулярные компьютеры — это молекулы, запрограммированные на нужные свойства и поведение. Молекулярные компьютеры состоят из сетевых нанокомпьютеров. Нанокомпьютер — вычислительное устройство на основе электронных (механических, биохимических, квантовых) технологий с размерами порядка нескольких нанометров. Нанокомпьютер — это запрограммированная нано-частица на нужные химические свойства и поведение. В работе обычной микросхемы, например, используют отдельные молекулы в качестве элементов вычислительного тракта.
В частности, молекулярный компьютер может представлять логические электрические цепи, составленные из отдельных молекул; транзисторы, управляемые одной молекулой, и т. п. В микросхеме памяти информация может записываться с помощью положения молекул и атомов в пространстве.
Одним из видов молекулярных компьютеров можно назвать ДНК-компьютер, вычисления в котором соответствуют различным реакциям между фрагментами ДНК. От классических компьютеров ДНК-компьютеры отличаются тем, что химические реакции происходят сразу между множеством молекул независимо друг от друга – аналог параллельных вычислений.
|
|
|
В современных лабораториях процесс создания коротких фрагментов ДНК с заданным кодом полностью автоматизирован. |
Полимеразная цепная реакция широко применяется в медицинской диагностике, криминалистике, для установления отцовства, клонирования и генной инженерии. |
Электрофорез ДНК используется для сортировки цепочек ДНК по длине. |
В 1994 году Леонард Адлеман, профессор университета Южной Калифорнии, продемонстрировал, что с помощью пробирки с ДНК можно весьма эффективно решать классическую комбинаторную «задачу о коммивояжере» (кратчайший маршрут обхода вершин графа). Классические компьютерные архитектуры требуют множества вычислений с опробованием каждого варианта. Биокомпьютер Адлемана отыскивал оптимальный маршрут обхода для 7 вершин графа.
Метод ДНК позволяет сразу сгенерировать все возможные варианты решений с помощью известных биохимических реакций. Затем возможно быстро отфильтровать именно ту молекулу-нить, в которой закодирован нужный ответ. Проблемы, возникающие при этом:
Требуется чрезвычайно трудоёмкая серия реакций, проводимых под тщательным наблюдением. Эдлмен решил эту задачу биохимическими методами, последовательно удалив сначала цепочки ДНК, которые не начинались с первого города - точки старта - и не заканчивались местом финиша, затем те, что содержали более семи городов или не содержали хотя бы один. И дураку понятно, что любая из оставшихся после такого отбора молекула ДНК представляет собой решение задачи.
Существует проблема масштабирования задачи. Но чем больше вершин графа, тем больше биокомпьютеру требуется ДНК-материала.
В 2002 году исследователи из Института Вейцмана в Реховоте, Израиль, представили программируемую молекулярную вычислительную машину состоящую из ферментов и молекул ДНК. 28 апреля 2004 года, Эхуд Шапиро, Яаков Бененсона, Биньямин Гил, Ури Бен-Дор, и Ривка Адар из Института Вейцмана сообщили в журнале "Nature", о создании ДНК-компьютера с модулем ввода-вывода данных.
В январе 2013 года исследователи смогли записать в ДНК-коде несколько фотографий JPEG, набор шекспировских сонетов, и звуковой файл.
В марте 2013 года, исследователи создали Транскриптор (биологический транзистор).
Конечный биоавтомат Бененсона-Шапиро — технология многоцелевого ДНК-компьютера, разрабатываемая израильским профессором Эхудом Шапиро (en:Ehud Shapiro) и Яаковом Бененсоном из Вейцмановского института. Его основой являются уже известные свойства биомолекул, таких как ДНК и ферменты. Функционирование ДНК-компьютера сходно с функционированием теоретического устройства, известного в математике как «конечный автомат» или машина Тьюринга.
Нанокомпьютер — вычислительное устройство на основе электронных (механических, биохимических, квантовых) технологий с размерами порядка нескольких нанометров. Нанокомпьютер — это нано-частица запрограммированная на нужные химические свойства и поведение. Сам компьютер, разрабатываемый на основе нанотехнологий, также имеет микроскопические размеры. На данный момент создан нанотранзистор — основа нанопроцессора.
Нанотехнологии – надежда человечества
Потенциал биокомпьютеров очень велик. По сравнению с обычными вычислительными устройствами они имеют ряд уникальных особенностей. Во-первых, они используют не бинарный, а тернарный код (так как информация в них кодируется тройками нуклеотидов). Во-вторых, поскольку вычисления производятся путем одновременного вступления в реакцию триллионов молекул ДНК, они могут выполнять параллельные вычисления (правда, извлечение результатов вычислений предусматривает несколько этапов очень тщательного биохимического анализа и осуществляется гораздо медленнее). В-третьих, вычислительные устройства на основе ДНК хранят данные с плотностью, в триллионы раз превышающей показатели оптических дисков. И наконец, ДНК-компьютеры имеют исключительно низкое энергопотребление.
Однако в разработке биокомпьютеров ученые столкнулись с целым рядом серьезных трудностей. Первая - проблема считывания результата - современные способы секвенирования (определения кодирующей последовательности) не совершенны: нельзя за один раз определить цепочки длиной хотя бы в несколько тысяч оснований. Кроме того, это весьма дорогостоящая, сложная и трудоемкая операция.
Вторая проблема - ошибки в вычислениях. Для биологов точность в 1% при синтезе и секвенировании оснований считается очень хорошей. Для ИТ она неприемлема: решения задачи могут потеряться, когда молекулы просто прилипают к стенкам сосудов; нет гарантий, что не возникнут точечные мутации в ДНК, и т. п. И еще - ДНК с течением времени распадаются, и результаты вычислений исчезают на глазах! Клеточные компьютеры работают медленно, и их легко “сбить с толку”. Со всеми этими проблемами ученые активно борются. Насколько успешно - покажет время.
Возможностями биокомпьютеров заинтересовались и военные. Американское агентство по исследованиям в области обороны DARPA выполняет проект, получивший название Bio-Comp (Biological Computations, биологические вычисления). Его цель - создание мощных вычислительных систем на основе ДНК. Попутно исследователи надеются научиться управлять процессами взаимодействия белков и генов. Для этого планируется создать мощный симулятор Bio-SPICE, способный средствами машинной графики визуализировать биомолекулярные процессы. Bio-SPICE планируется развивать на принципах открытых исходников (open source). Программа рассчитана на пять лет.
Компьютер или человек: кто кого?
В 2007 году производительность всех компьютеров мира составила 6.4 x 1018 (в18 степени!) действий в секунду. Для моделирования реализации участка мозга с 1 млрд. нейронов специалистам из IBM потребовался компьютер, в котором 147 456 процессоров, 144 терабайта оперативной памяти. Максимальная вычислительная мощность системы составляет 415,7 триллионов операций с плавающей запятой (выполнение таких операций требуют больше времени, чем операции с целыми числами). По своим параметрам эта система была на 11-том месте среди самых мощных компьютеров в мире.
Мозг человека – это аналоговая (не цифровая) электрохимическая система! Наши органы чувств способны принять до 11 Мбит/с, а вот осознанно человек усваивает не более 40 бит/с. Более того, большую часть времени наш осознанный информационный поток составляет всего 16 бит/с. Большинство нейробиологов, как правило, оценивает потенциал мозга где-то между 10 и 100 терабайтами, хотя полный спектр предположений варьирует от 1 терабайта до 2,5 петабайт, считая, что каждый синапс хранит около 1 байта информации. Мозг является на удивление энергоэффективным, потребляя 12 ватт.
В мозгу 10-30 миллиардов нейронов и 90 миллиардов других клеток. Нейрон – это микроконтроллер: может находиться в двух состояниях - возбужден / не возбужден, нейрон соединен не с двумя, а с 10000 других нейронов. Нейрон – ретранслятор и обработчик - может передать сигнал как есть, может на один пришедший сигнал выдать серию импульсов, и, наоборот - вместо полученной серии отправить дальше одиночный сигнал. Может преобразовать сигнал, то есть отправить на выход не совсем то, что пришло на вход. Быстродействие нейронов (т.е. скорость переключения из одного состояния в другое) - около 1/100 секунды. Скорость передачи информации - порядка 30 м/сек. У каждого нейрона есть "тактовая частота" порядка килогерца. Одновременно в мозге обычно задействованы не более 2-3% нервных клеток.
В черепномозговых нервах в мозг входит 2.600.000 нервных волокон, а выходит 140.000. Из входящих нервных волокон два миллиона – зрительные. Около половины выходящих волокон несут приказы к мышцам глазного яблока, управляя тонкими, быстрыми и сложными движениями глаз. Остальные нервы управляют мимикой, жеванием, глотанием и деятельностью внутренних органов.
Глаза человека уступают видеосистемам по количеству воспринимаемых цветов: глаз – 2 миллиона оттенков, видеосистема ПК – 16 миллионов цветов (зачем?). В глазу находится 7 миллионов колбочек – клеток, отвечающих за цветное зрение и 130 миллионов (!!!) палочек – клеток, отвечающих за черно-белое зрение. Эти 137 миллионов клеток расположены на поверхности не более 10 квадратных сантиметров, Разрешение глаза для колбочек примерно равно 2646х2646 точек, а для палочек – 11402х11402 точки. Каждую секунду через человеческий глаз в мозг поступает порядка 100Мб зрительной информации.
В мозге человека нет конкретного участка, отвечающего за память, – и запоминание, и распознавание свойственно всем нейронам. Биологическая память человека не представима моделью компьютера. Она закодирована в 10 млрд. нервных клеток, образующих наш мозг, и триллионах связей между ними - синапсов. Существуют две формы памяти - кратковременная память и постоянная долговременная память. Кратковременная - это такая память, в которой следы появляются сразу же, она зависит от электрической активности нейронов мозга, и если активность прерывается, то следы исчезают. Через некоторое время следы могут перейти в долговременную память. Здесь уже информация не утрачивается после прекращения электрической активности нейронов. Она теперь закреплена в нервных связях и может храниться долго, иногда всю жизнь. Выделяют еще две формы памяти: память, связанная с приобретением навыков, условных рефлексов, запоминающихся реакций на окружающую среду и требующих ответного действия, так сказать, память действия, моторная память. Она называется процедурной памятью и проявляется у человека в виде навыков движения (бег, плавание, лыжи, велосипед и т.д.) и декларативная абстрактная память, память на название, которой нет даже у животных. Можно выделить еще три формы биологической памяти: генетическую, иммунологическую и обычную, которая является функцией мозга и проявляется в топографической схеме связей между нейронами и в динамике нейронной системы.
Мозг обладает способностью изменять свою структуру, физические, химические и физиологические процессы, свою реакцию в результате приобретения опыта и случайных обстоятельств в процессе развития. Мозг человека, как и его организм в целом, представляет собой открытую систему, сформированную собственной историей и находящуюся в непрерывном взаимодействии с природной и общественной окружающей средой, которая изменяет ее, но и сама система при этом подвергается изменению. В процессе жизни каждая клетка многократно заменяется, одни гибнут, рождаются новые, рвутся старые связи между ними и устанавливаются новые, причем это происходит миллионы раз.
Скорость обработки информации для сознательного мышления составляет 2 Кбит информации в секунду, та же скорость у подсознания доходит до 4 Гбит в секунду.
Человеческий геном на 98,5% идентичен геному шимпанзе. Мозг тоже проектировался эволюцией в основном под нужды животного. А что нужно животному? Найти еду, убежать от хищника, победить соперника в стае, спариться с самкой. Ничего сложнее, чем групповая иерархия и история взаимоотношений с сородичами обезьяне запоминать не приходится. Поэтому и наш мозг оптимизирован не для размышлений (фокусировка на интеллектуальных задачах требует больших усилий) и запоминания больших объемов данных, а прежде всего для управления телом.
Итак, цифровое бессмертие:
Если тенденции развития синергетики, кибернетики, нейронаук, сетевой, компьютерной и биотехнологии - сохранятся на сегодняшнем уровне, то мечты Тейара де Шардена, гипотезы В.И.Вернадского, Н.М.Амосова, В.М.Глушкова, Э.М.Куссуля, Е.А.Либермана, А.Болонкина, В.И.Бодякина, братьев Н.Латыповых, М.Мора, и др., могут воплотиться в реальность.
Я. И. Корчмарюк, г. Волгоград, РФ.
Обработка информации в природном молекулярном компьютере. На генном уровне