Мир вокруг нас сложен и удивителен. Все, от величественных гор до мельчайших частиц, подчиняется нерушимым законам природы, в оркестре которой важен каждый участник, но лишь математика, физика и химия могут претендовать на роль первой скрипки. Полагаясь на основы этих наук, можно объяснить практически все объекты, явления и эффекты, наблюдаемые где-либо. Но важным словом в этом вполне утвердительном выражении является «практически». Одной из самых сложных и важных загадок остается происхождение жизни на нашей планете. Самая распространенная теория заключается в спонтанном возникновении. Самой же нестандартной — инопланетяне, но е лучше оставить для Малдера и Скалли. Гипотеза, которая до сих пор претендует на звание верной, гласит, что жизнь в своем первородном виде попала на Землю извне в виде микроорганизмов, а затем начался процесс ее развитии и эволюции уже на планете. Ученые из Имперского колледжа Лондона (Великобритания) разработали математическую модель, которая заставляет усомниться в теории спонтанного возникновения жизни и поверить в панспермию. Как работает данная модель, и каковы ее результаты? Ответы на эти вопросы мы найдем в докладе ученых.

Генезис

Фраза «Все клетки происходят из клеток» приводит к классической дилемме «что было раньше — курица или яйцо»: откуда появилась первая клетка?
Либо она возникла откуда-то извне, либо сформировалась из законов физики и химии на молодой, хаотичной и геологически активной Земле. Как только появилась примитивная протоклетка или репликатор, процесс дарвиновской эволюции мог вступить в действие — отбор и разнообразие постепенно вели к возрастанию сложности, биоразнообразия и, в конечном счете, к современной биосфере: от золотых рыбок до ускорителей частиц и социальных сетей. Это начало рассуждения наглядно показывает, насколько мало известно о нашем происхождении — и о Вселенной в целом.

Что касается гипотезы о «внеземном происхождении», то научная фантастика давно рассматривает сценарии терраформирования. В фильме «Космическая одиссея 2001» непостижимый черный монолит дает древним гоминидам загадочный толчок к развитию сознания и использованию орудий труда. В Стартреке целые планетарные экосистемы создаются продвинутыми цивилизациями или сбойными искусственными интеллектами — зачастую с поразительной скоростью. В Секретных материалах предполагалось, что инопланетные вирусы могли занести жизнь на Землю. В Прометее одинокий инопланетянин, известный лишь как «Инженер», растворяет себя в водопаде, предположительно запуская земную биохимию. Однако прародителем всех историй о терраформировании остается Книга Бытия. В ней утверждается, что жизнь была создана за шесть дней — утверждение, глубоко повлиявшее на человеческое мышление, хотя и не поддающееся научной проверке.

На шаг ближе к науке (хотя не обязательно — к определенности) подошли Фрэнсис Крик (сооткрыватель структуры ДНК) и Лесли Орджел, предложившие в 1973 году идею направленной панспермии. Согласно их сценарию, развитая внеземная цивилизация, оказавшаяся на грани вымирания или движимая научным интересом, могла отправить микробные «стартовые наборы» на обитаемые планеты, подобные Земле. Хотя Крик и Орджел пытались придать этой концепции форму проверяемой гипотезы, по сути она лишь изящно перекладывает объяснительное бремя на чью-то иную биохимию.

Изображение №1

Тем временем современные байесовские анализы возникновения жизни сталкиваются с крайне ограниченными и неопределенными данными: выборка состоит всего из одного примера, а априорные допущения формируются не только на основе эмпирических наблюдений, но и под сильным влиянием субъективности. Существует также проблема временного масштаба — жизнь возникла на Земле довольно рано, однако разумный наблюдатель, способный осознать этот факт, появился гораздо позже, что вносит значительное наблюдательное смещение. В данной работе происхождение жизни рассматривается сквозь призму современных клеточных моделей и инструментов, основанных на искусственном интеллекте, с целью более глубокого понимания информационной и физической сложности, необходимой для формирования протоклетки. Сначала приводятся общие соображения и предлагается качественная теоретическая структура. В завершение ученые следуют наставлению Ричарда Фейнм��на о том, что «сомнение и неопределенность не следует бояться — их нужно приветствовать», и предпринимается попытка осторожно подвести некоторые выводы.

Геологические ограничения могут быть гибкими

Когда появилась жизнь и какие существуют «жесткие» и «гибкие» ограничения? Известно о двух колоссальных ударах, имевших глобальный стерилизующий эффект. Первый произошел около 4.51 миллиарда лет назад, когда в Землю врезалось тело размером с Марс, получившее название «Theia» — это событие привело к образованию Луны. Второй, также стерилизующий, удар произошел примерно на 40 миллионов лет позже и известен как «Moneta».

Минералогические данные, полученные из цирконов, указывают на то, что атмосфера и жидкая вода уже существовали на поверхности Земли около 4.404 миллиарда лет назад. Самые ранние предполагаемые следы жизни обнаружены в обедненных по изотопу 13C углеродных включениях в цирконовых отложениях возрастом 4/1 миллиарда лет. Самые древние прямые и бесспорные свидетельства жизни представлены микрофоссилиями, сохранившимися в породах возрастом 3.465 миллиарда лет, найденных в Западной Австралии.

Недавнее исследование, объединяющее методы молекулярных часов, филогенетическую реконструкцию с учетом горизонтального переноса генов и существующие биогеохимические модели, было направлено на изучение природы последнего универсального общего предка (LUCA от last universal common ancestor). Согласно полученным данным, возраст LUCA оценивается примерно в 4.2 миллиарда лет — на основе калибровки по ископаемым и изотопным данным. Что еще более поразительно, LUCA, по всей видимости, представлял собой анаэробного ацетогена — по метаболизму сходного с современными прокариотами. Он уже обладал механизмом синтеза АТФ, циклом трикарбоновых кислот (ЦТК), ранними элементами иммунной защиты, включая белки системы CRISPR-Cas, и существовал в составе микробного сообщества. Недавний консенсус, достигнутый по результатам восьми геномных и протеомных исследований, в целом подтверждает эту точку зрения. Это позволяет предположить, что протоклетка, вероятно, гораздо более простая, должна была возникнуть еще раньше, возможно, опираясь на РНК или иные примитивные системы репликации.

Лишь в последнем «мгновении» планетарного времени, около 100 000 лет назад, появились анатомически современные люди, наделенные любопытством и способностью к созданию поразительных технологий. Хотя контролируемое использование огня более древними гоминидами восходит примерно к 1 миллиону лет назад, в геологическом масштабе времени интеллект возник исключительно поздно. Тем не менее антропный принцип необходимо учитывать: без человеческих наблюдателей невозможно было бы и размышление над самим этим феноменом. Примечательно, что столь позднее появление человечества может быть ограничено и с другой стороны временной шкалы — прогнозы указывают, что биосфера Земли может коллапсировать примерно через 100 миллионов лет из-за надвигающегося «голодания по CO2» (задолго до того, как Солнце станет красным гигантом и поглотит Землю). По мере увеличения светимости Солнца ускоряется выветривание силикатов, что приводит к снижению концентрации CO2 в атмосфере. При уровне ниже примерно 150 ppm (от parts per million, т. е. частей на миллион) фотосинтез прекращается, вызывая экологический коллапс. Таким образом, если для возникновения разумной жизни требуется слишком много времени, многие планеты, особенно вращающиеся вокруг более горячих и недолговечных звезд, могут просто не успеть пройти этот путь, что создает смещение наблюдений в пользу необычно раннего старта.

В более оптимистичном свете, модифицированное уравнение Дрейка, обновленное с учетом современных данных об экзопланетах, устанавливает нижнюю границу вероятности того, что хотя бы одна иная технологическая цивилизация когда-либо возникала во Вселенной, доступной для наблюдения. Если вероятность того, что планета в обитаемой зоне породит технологически развитый вид, составляет не менее 10−24 (примерно такие же шансы, как восемь раз подряд выиграть в лотерею), то человечество, с высокой степенью вероятности, не одиноко. Иными словами, статистически говоря, мы, вероятно, не единственные, кто задается вопросом, одиноки ли мы во Вселенной.

Физические принципы возникновения жизни

С момента выхода знаковой работы Эрвина Шредингера 1944 года «Что такое жизнь?» физики задавались вопросом, не потребуются ли для возникновения жизни физические принципы, выходящие за рамки уже известных. Шредингер предположил существование еще не открытых законов, управляющих порядком и организацией в живых системах, что вдохновило несколько поколений исследователей на изучение физики саморганизации. С тех пор эта область исследований продвинулась существенно. Ниже приведены примеры подобных работ:

  • Работа Алана Тьюринга по системам реакция–диффузия предложила математическую основу для объяснения того, как пространственные узоры, наблюдаемые при морфогенезе, могут спонтанно возникать из простых правил.

  • Принцип Ландауэра–Беннета выявил глубокую связь между информацией, энтропией и термодинамическими затратами на вычисления — ключевые концепции для понимания живых систем как информационно-обрабатывающих структур.

  • Теория диссипативных структур Ильи Пригожина показала, как локальный порядок может возникать в открытых системах, которые экспортируют энтропию.

  • Концепция автокаталитических множеств Стюарта Кауфмана предложила убедительную модель того, как химические сети могут самоподдерживаться и усиливать сами себя.

Последние два примера наглядно демонстрируют, что сложные системы обладают новыми коллективными свойствами, которые возникают сверх суммы их частей и не предсказуемы из первых принципов.

В более недавних исследованиях, находящихся на стыке популярной науки, Джереми Инглэнд предложил, что жизнеподобный порядок может возникать как естественное следствие направленного рассеяния энергии в условиях, аналогичных отбору в физической системе, тогда как Сара Уокер подчеркнула ключевую роль потока информации и причинной структуры в определении того, что значит быть живым. Оба исследователя утверждают, что для понимания происхождения жизни необходимо выходить за рамки простого учета молекулярных компонентов и сосредоточиться на динамике информации, энергии и организации в физических системах. Если жизнь возникла через последовательность квазистабильных, далеких от равновесия состояний — каждое из которых менее вероятно, чем предыдущее, но каким-то образом термодинамически выгодно — тогда переход перестает быть чудом и становится термодинамически допустимым. Происхождение жизни можно рассматривать как продолжение классического правила о том, что «экзергонические реакции происходят спонтанно».

В широком смысле, исследования, связанные с происхождением жизни, относятся к богатым и быстро развивающимся областям активной материи, стохастической термодинамики и неравновесных фазовых переходов. Эти направления существенно расширили наше понимание того, как системы, находящиеся далеко от равновесия, способны поддерживать структуру и совершать работу. Тем не менее несмотря на достигнутый прогресс, до сих пор не существует полностью удовлетворяющего объяснения механизма спонтанного возникновения протоклетки из хаотической химии.

Догмы и искусственный интеллект

В науке догмы определяют области общепринятых знаний, что облегчает структурированное рецензирование и принятие решений о финансировании. Вместе с тем, они могут препятствовать новым открытиям. Например, выражение «в биологии ничто не имеет смысла, кроме как в свете эволюции», хотя и является фундаментальным для лабораторной работы и биоинформатики, может непреднамеренно создавать границы, затрудняющие нестандартное мышление о происхождении жизни. Аналогично, постулат «все клетки происходят из клеток» часто затмевает бо��ее глубокий вопрос о том, как возникла первая клетка.

Одно можно сказать с уверенностью: с появлением мощных инструментов искусственного интеллекта и механистических моделей открылись совершенно новые способы изучения биологической сложности. Такие инструменты, как AlphaFold для предсказания сворачивания белков и комплексные модели целой клетки, позволяют оценивать информационное содержание жизни с помощью колмогоровской (алгоритмической) сложности. Этот подход измеряет кратчайшее описание, необходимое для воспроизведения системы — чем более структурирована или регулярна система, тем больше ее можно сжать и тем легче ее воспроизвести. В настоящей работе, сочетая такие оценки сложности с базовой теорией скорость–искажение (rate-distortion theory), предпринимается попытка пролить новый свет на правдоподобность быстрого возникновения жизни.

Теоретическая основа

Проблема происхождения жизни рассматривается через оценку правдоподобия того, что химические процессы могли спонтанно собрать достаточно сложную протоклетку в течение доступного времени на ранней Земле. Этот временной интервал принимается равным примерно 500 миллионов лет, что интерполировано между «оптимистичной» оценкой (304 млн лет) и «консервативной» (939 млн лет). Применяется эвристическая версия теории скорость–искажение Шеннона, которая количественно оценивает минимальную информационную скорость R(D), необходимую для построения функционирующей системы при допустимом уровне искажения D. Здесь D характеризует степень потерь (ошибок или деградации), которые могут быть допущены при формировании жизнеспособной протоклетки. Скорость искажения зависит от энтропии хаотической предбиологической среды, обозначенной как Hprebiotic, которая отражает информационное содержание химического «супа» в пруду или гидротермальном источнике.

Изображение №2

Для успешного формирования протоклетки скорость R(D) должна быть как минимум равна макроскопической информационной скорости, необходимой для сборки протоклетки сложности Iprebiotic за доступное время Tavailable = 500 млн лет (график выше). Математически это можно записать следующим образом:

В этом упрощенном представлении R(D), обычно выпуклая и убывающая функция, аппроксимируется отношением энтропии предбиологической среды Hprebiotic к времени молекулярной устойчивости D, при этом η выступает в роли коэффициента эффективности (иногда называемого «fudge factor»). Этот коэффициент учитывает, что не все молекулярные взаимодействия приводят к полезным результатам. Молекулы могут быть структурно несоосными, химически нестабильными или неспособными интегрироваться в согласованную систему из-за отсутствия механизмов восстановления или пространственных ограничений в локальной среде.

Стоит отметить, что все величины в уравнении №1, за исключением, возможно, Tavailable, остаются крайне неопределенными. Тем не менее исходя из этой логики, спонтанное возникновение жизни остается правдоподобным, если левая часть уравнения превышает правую. Если это не так, возможно, отсутствует какой-то ключевой компонент, например, дополнительные эволюционные пути, неизвестные физические принципы или внешние воздействия, такие как направленная панспермия Крика и Орджела (или, более колоритно, инопланетяне, терраформирующие планету). Для аргументации ученые намеренно отбросили «простое» статистическое объяснение, что редкие события неизбежно происходят где-то во Вселенной.

Энтропия предбиологического «супа» и допустимая скорость ошибок при сборке

Без машины времени условия на Земле примерно 4 миллиарда лет назад оцениваются приблизительно. Левую часть уравнения №1 используют для определения энтропии химического «супа» Hprebiotic и допустимой скорости ошибок D, характеризующей продолжительность жизни сложных органических молекул до разрушения. Важно, что Hprebiotic относится не ко всему океану или гидротермальной системе, а к объему, доступному для формирующейся протоклетки. Хотя объем одной протоклетки может составлять около 1 фемтолитра (10−15 л), молекулы могли диффундировать из более крупной окружающей капли. Для оценки используются порядковые величины, основанные на химических экспериментах, имитирующих условия ранней Земли, данных метеоритов и планетарной спектроскопии.

В экспериментах Миллера–Юри разряды искры в восстановительной газовой смеси приводили к образованию различных аминокислот и других небольших органических молекул. Во время миссии Cassini–Huygens анализ атмосферы Титана показал, что сложная фотохимия способна создавать тысячи органических соединений, включая нитрилы, углеводороды и возможные предбиологические прекурсоры. Аналогично, углистые хондриты (например, Мурчисон) содержат более 60 аминокислот, нуклеобазы, полиолы, карбоновые кислоты и родственные соединения. Это согласуется с данными миссии OSIRIS-REx, вернувшей образцы с астероида Бенну, где была обнаружена богатая коллекция органики, включая включения в солевых растворах в филоcиликaтных минералах, возраст которых оценивается примерно в 4.5 миллиарда лет.

Комбинаторная химия в различных геохимических условиях могла потенциально создавать тысячи уникальных органических молекул, что предполагает «химическую библиотеку» порядка 105–106 небольших молекул в предбиологической среде. При средней информационной емкости около 10 бит на молекулу, отражающей функциональную или структурную специфичность, это дает примерно 103 различимых состояний на молекулу (например, разные боковые цепи, склонность к сворачиванию или реактивность). Эта оценка согласуется с аннотациями белковых доменов и значениями бит на остаток в картах «последовательность–функция», а также с описателями на основе сжатия, такими как SMARTS или InChI. В результате энтропия предбиологической среды оценивается как Hprebiotic ∼ 106–107 бит.

Далее рассматривается время искажения D, интерпретируемое как средняя продолжительность жизни сложной органической молекулы до разрушения гидролизом, UV-излучением, окислением или дальнейшей трансформацией. Это определяет «скорость ошибок» или окно устойчивости для полезных молекулярных структур. В реалистичных условиях ранней Земли сложные органические молекулы, такие как рибоза и пептиды, имеют периоды полураспада от нескольких часов до дней. Например, рибоза разрушается с периодом полураспада ∼3 часа при pH 7 и 37 °C. Малые пептиды разрушаются в течение часов или дней в зависимости от последовательности и pH. Нуклеобазы, такие как аденин, чувствительны к солнечному UV и разрушаются за дни–недели. Без озонового слоя разрушение может происходить еще быстрее — в пределах часов–дней. Консервативно принимается средняя продолжительность жизни ∼1 день, или около 105 секунд, для умеренно стабильных молекул в теплой, водной, анаэробной среде с UV-облучением. В криогенных или минерал-защищенных условиях, например, внутри астероидов, органические молекулы могут сохраняться миллиарды лет. Наличие таких «космических холодильников» показывает, что D может сильно варьироваться в зависимости от локального геохимического контекста.

Объединяя Hprebiotic ∼ 106–107 бит с D ∼ 105 с и предполагая оптимистично коэффициент эффективности η = 1, получается:

R(D) ≈ Hprebiotic / d ∼ 100 бит/с

Таким образом, химическая эволюция должна извлекать или сохранять около 100 бит в секунду, чтобы успешно преодолеть информационный порог, необходимый для возникновения жизни.

Для наглядности было использовано две метафоры. Во-первых, можно представить «бассейн» с 107 бит потенциально полезных молекул, каждая из которых живет около 105 секунд. Чтобы информация не исчезла навсегда, необходимо стабилизировать или интегрировать примерно 100 бит в секунду.

Во-вторых, более образно: «таю��ая библиотека» — библиотека с 10 миллионами книг (Hprebiotic), каждая из которых самоуничтожается через 24 часа после взятия. Задача — составить руководство по «созданию жизни». Чтобы успеть сохранить информацию до ее исчезновения, нужно «сканировать» примерно 100 книг в секунду.

Если бы средняя продолжительность жизни молекул была значительно короче, например, D ∼ 1 с из-за быстрой диффузии или отсутствия защитных механизмов, требуемая информационная скорость увеличилась бы соответственно. Ключевая идея остается прежней: если R(D) слишком мала, чтобы достигнуть Rmin = Iprotocell / Tavailable, то абиотическое возникновение жизни становится маловероятным без привлечения направленной эволюции, внешних вкладов (например, панспермии) или неизвестных принципов саморганизации. Поставка относительно стабильных и сложных молекул, через метеориты или межзвездную пыль, могла бы выступать в роли «пускового импульса» для предбиологической эволюции. Учитывая большие неопределенности в значениях параметров, цель работы не в том, чтобы дать окончательный вывод, а в том, чтобы структурировать количественное обсуждение.

Информационное содержание протоклетки

Правая часть уравнения №1 требует оценки сложности протоклетки, (Iprotocell). Как можно количественно определить эту сложность, включая ее структурную и динамическую организацию? Не должно вызывать удивления то, что клетки — это не просто мешки со случайно перемешанными молекулами, а высокоорганизованные системы, структура которых прослеживается вплоть до сворачивания и взаимодействия их белков. Более того, клеточные процессы координированы во времени. Если представить, что белки — это музыканты, то сигнальные, метаболические и генетические пути выступают в роли дирижера и партитуры, определяя ритм, гармонию и переходы.

«Код» природы встроен в физические законы и часто может быть выражен в изящных математических уравнениях, порой достаточно компактных, чтобы уместиться на одном листе бумаги. В отличие от вычислительных моделей, природа не «вычисляет» саму себя, она просто разворачивается. Чтобы понять эту сложность, ученые обращаются к символическим и алгоритмическим представлениям, таким как уравнения или компьютерный код. Однако этот перевод от физической причинности к познавательному описанию вносит неоднозначность: невозможно четко отделить то, что является сущностным, от того, что лишь описательное. В результате оценки колмогоровской сложности по своей природе остаются неточными. Снизу сложность ограничена простыми универсальными законами, а сверху — объемом сжатого кода, необходимого для реалистичного моделирования системы. Но даже эта верхняя граница несовершенна: она включает избыточность реализации и исключает неизвестные биологические детали. Иными словами, чем сильнее сжимается реальность, тем выше риск исказить ее подлинную сложность.

Чтобы продолжить, исследователи условно разделили общее информационное содержание протоклетки на отдельные компоненты:

Iprotocell = Ig + Is + Id

где Ig — генетическая информация, Is — структурная информация (например, свертки белков, клето��ная организация), а Id — динамическая информация, закодированная в биохимических путях. Каждая из этих величин оценивается через колмогоровскую (алгоритмическую) сложность, определяемую как длина кратчайшей программы, которая может, по крайней мере концептуально, сгенерировать соответствующий компонент.

Геномная информация является самой простой для оценки и, что любопытно, вносит наименьший вклад. Например, минимальный саморазмножающийся организм Mycoplasma genitalium содержит около 500 генов, каждый длиной примерно 1000 пар оснований. Поскольку на одну пару оснований (A, T, C, G) приходится два бита, это дает оценку Ig ~ 500 х 1000 х 2 = 106 бит. Эта оценка подтверждается синтетической минимальной клеткой JCVI-syn3.0, созданной на основе Mycoplasma mycoides и содержащей всего 473 гена. Примечательно, что функции 149 из этих генов до сих пор остаются неизвестными, что подчеркивает, насколько многое еще предстоит понять даже в устройстве минимальной формы жизни.

Чтобы оценить Is, была рассмотрена структура и сворачивание белков. Биологическая функция белка напрямую зависит от его формы. Хотя алгоритм сворачивания белков на основе искусственного интеллекта AlphaFold2 занимает около 556 ГБ, в этот объем входят тысячи структур, избыточные данные и метаданные. Более реалистичная нижняя граница для минимальной клетки, по оценкам, может находиться в диапазоне 106–108 бит, в зависимости от количества уникальных сверток, белковых доменов и объема информации, необходимой для описания каждой из них.

Чтобы оценить динамическую составляющую Id, ученые обратились к моделям целых клеток. Первая комплексная симуляция клетки Mycoplasma genitalium включала 28 субмоделей, охватывающих репликацию ДНК, транскрипцию, трансляцию, метаболизм и другие процессы. Размер сжатого кода модели составлял около 140 МБ, или приблизительно 109 бит. Модель использовала более 1900 параметров, собранных из 900+ научных публикаций, и позволяла предсказывать фенотипы на основе генотипов. Хотя эта оценка почти наверняка завышена из-за избыточности кода и параметров, она остается показательной. Важно отметить, что модель не учитывала пространственную организацию, механическую обратную связь и эффекты «памяти». Другие модели целых клеток, такие как симуляции E. coli и синтетической клетки JCVI-syn3A, имеют несколько меньшие кодовые базы, но основаны на тех же принципах.

В совокупности исследователи оценивают общее информационное содержание протоклетки как (Icell ~ 109) бит. Это дает минимально необходимую скорость накопления информации, равную:

Rmin = Iprotocell / Tavailable ≈ 6.34 x 10−8 бит/с, что соответствует примерно 2 битам в год.

По сравнению с R(D) ~ 100 бит/с (с учетом коэффициента эффективности η), это значение крайне мало, однако оно отражает огромный временной масштаб, в течение которого могла зародиться жизнь. Для наглядности: молекула ДНК увеличивается на 2 бита с каждой парой оснований. При скорости 100 бит/с это соответствует 50 парам оснований в секунду, или более чем 500 метрам длины молекулы ДНК за год. Удивительно низкий порог накопления информации в 6.34 х 10−8 бит/с указывает на то, что абиогенное возникновение жизни вполне возможно, даже при чрезвычайно низкой эффективности (η ~ 10−8) или коротком времени жизни молекул (D ~ 1 с).

Дрейф или случайный диффузионный процесс в самоорганизации

Минимальная скорость накопления информации, необходимая для сборки протоклетки со сложностью Iprotocell = 109 бит за Tavailable = 500 миллионов лет, составляет υmin = Rmin = 6.34 х 10−8 бит/с. Это подчеркивает, что даже крайне неэффективные или спорадические процессы могли бы накопить требуемую информацию за геологические временные масштабы. Однако данная оценка предполагает однонаправленный, устойчиво прогрессивный процесс (баллистический или с направленным дрейфом). А что если процесс накопления информации ведет себя скорее как случайное блуждание, с флуктуациями и откатами, а не как направленный дрейф?

Изображение №3

Была рассмотрена стохастическая модель накопления информации: смещенное случайное блуждание со скоростью υ и временем сохранения направления τ, аналогичное динамике «run-and-tumble» при хемотаксисе бактерий. Эффективная константа диффузии задается как Deff = υ2τ / d, где d — размерность пространства поиска. Если υ = υmin, то среднеквадратичное смещение (MSD) за время Tavailable равно:

⟨I2protocell⟩ = (υminTavailable)2 = 2dDeffTavailable = 2υ2minτTavailable, и не зависит от d.

Решение для кроссоверного времени τc, при котором этот диффузионный процесс накопит ту же информацию, что и направленный дрейф, дает τc = Tavailable/2. Таким образом, если τ < τc = 250 млн лет, рандомизация слишком велика, и процесс не достигает цели за Tavailable (изображение №3). Высокая сохранность направления, то есть сильная «память» о направлении, является критически важной.

Для иллюстрации чувствительности к временному масштабу: при τ = 1 с время ожидания сборки клетки составляет примерно 1024 года — это сравнимо с «стопкой» около ста триллионов вселенных, поставленных друг на друга. Даже при τ = 1 год, необходимое время все равно T' ~ 1017 лет, что примерно в десять миллионов раз превышает нынешний возраст Вселенной. Другими словами, без огромной сохранности направления возникновение жизни становится космологически маловероятным, что может указывать на необходимость альтернативных механизмов.

В целом, правдоподобие накопления информации через смещенное случайное блуждание критически зависит как от времени сохранения направления τ, так и от эффективной скорости накопления информации υ. Сильно направленные или управляемые процессы существенно превосходят полностью диффузные в достижении информационного порога, необходимого для появления жизни.

Поглощение веществ и потребление энергии не являются ограничивающими факторами

Чтобы оценить, могло ли доорганическое окружение обеспечивать скорость поглощения молекул, необходимую для информационно-теоретической модели, исследователи сравнили ее с классической оценкой Берга и Перселла для молекулярного потока к сферической клетке. Для клетки радиусом a = 1 мкм, с коэффициентом диффузии D = 300 мкм2/с и концентрацией c = 1 мМ диффузионный поток вычисляется как J = 4πDac ≈ 2.27 x 109 молекул/с.

В то же время, оценка на основе теории скорости и искажения требует скорости накопления информации R(D) ≈ 100 бит/с, при этом каждая молекула вносит около 10 бит. Это означает, что необходимое поглощение составляет всего R(D)/10 = 10 молекул/с. Следовательно, фактический молекулярный поток превышает требуемую скорость примерно в 108 раз. Таким образом, доорганическое химическое окружение не было ограничено транспортом даже при наномолярных концентрациях. Настоящей проблемой оставалось фильтровать, стабилизировать и удерживать небольшое количество молекул, несущих полезную информационную нагрузку, на фоне огромного молекулярного потока.

Используя минимально необходимую скорость накопления информации υmin ≈ 6.34 х 10−8 бит/с и снова предполагая по 10 бит на полезную молекулу, соответствующая скорость захвата составляет υmin/10 ≈ 6.34 х 10−9 молекул/с. Это означает, что в среднем требуется захватывать менее одной молекулы каждые пять лет. По сравнению с лимитом Берга и Перселла в 109 молекул/с, эта скорость ниже на 13 порядков. Следовательно, даже крайне редкий и избирательный захват молекул мог бы обеспечить информационные потребности возникновения жизни, при наличии достаточного времени.

Если протоклетка требует Iprotocell ~ 109 бит, а каждая молекула вносит около 10 бит, то общее число необходимых молекул равно Nprotocell = Iprotocell/10 = 108 молекул, что согласуется с оценками для E. Coli.

При предположении поглощения, ограниченного диффузией, время, необходимое для накопления Nprotocell молекул, равно Δt = Nprotocell / J = 108 / (2.27 x 109) ≈ 0.044 с или около 1.4 х 10−9 года.

Теоретически протоклетка могла бы собрать все необходимые компоненты менее чем за 50 миллисекунд, если бы каждая поступающая молекула сохранялась и была полезной. На практике же большинство молекул было бы нефункциональным, деградировало или не включалось в систему, поэтому именно отбор и удержание молекул, а не поток, становились настоящим узким местом в доорганическом накоплении информации.

Для оценки энергии, необходимой для сборки системы с Iprotocell ~ 109 бит, исследователи сравнили три подхода: предел Ландауэра, биологический синтез на основе АТФ и технологические процессы, такие как ПЦР.

Во-первых, принцип Ландауэра утверждает, что стирание одного бита информации требует минимальной энергии Emin = kBT ln 2 ≈ 2.8 x 10−21 Дж/бит при T ≈ 300 K. Следовательно, теоретическая минимальная энергия для сборки протоклетки составляет ELandauer ≈ 109 x 2.8 x 10−21 = 2.8 x 10−12 Дж.

Во-вторых, биологические энергетические затраты, основанные на гидролизе АТФ, дают около 10−19 Дж на молекулу. Если синтез одной информационной молекулы (содержащей примерно 10 бит) требует одного АТФ (консервативное предположение), то EATP = 108 х 10−19 = 10−11 Дж.

В-третьих, технологический синтез с помощью ПЦР потребляет примерно 1–10 Дж для амплификации ДНК в микрограммовых масштабах. Конструкт из 109 бит соответствует около 50 мкг ДНК, что дает EPCR ~ 1 Дж, или примерно 10−9 Дж/бит. Даже 1 Дж — это небольшое количество энергии, сопоставимое с поднятием яблока массой 100 г на 1 метр или питанием смартфона в течение 1 секунды.

Таким образом, минимальная жизнь функционирует примерно в пределах одного-двух порядков величины от термодинамического предела, в то время как современные технологии (например, ПЦР) уступают по эффективности до 109 раз. Этот контраст подчеркивает выдающуюся энергетическую эффективность биологических систем и задает термодинамическую основу для оценки реализуемости доорганической сборки.

Может ли информация накапливаться внезапно?

Ранее исследователи оценили информационное содержание минимальной протоклетки с помощью колмогоровской сложности, опираясь на подробные почти-реалистичные описания клеточных процессов, закодированные в современных вычислительных моделях. Это поддерживает представление о том, что жизнь возникала через постепенное, стабильное увеличение организации и сложности вещества — от неживого к живому. Такой процесс можно сравнить со сборкой гигантского пазла и он выглядит как логическое завершение редукционистской системы взглядов. При этом требуемые времена сохранения направленности процесса оказываются крайне большими, почти невероятными.

Альтернативная возможность состоит в том, что жизнь возникла через внезапный, взрывоподобный переход — благодаря еще неизвестному принципу самоорганизации, основанному на коллективной динамике, который преодолел бы разрыв между случайной химией и селективной эволюцией, потенциально обходя информационный «узкий коридор» ранней саморепликации. Эта идея не нова. Наиболее глубоко она разработана в исследованиях коллективно автокаталитических сетей, впервые предложенных Каффманом в 1986 году.

В таких сетях каждая молекула катализируется другим членом множества, что позволяет системе в целом реплицироваться без необходимости, чтобы отдельная молекула самореплицировалась, или чтобы существовала мембранная протоклетка. Эта концепция предлагает решение парадокса Эйгена: длинные молекулы с большой информационной нагрузкой требуют механизмов исправления ошибок для сохранения, однако сами механизмы исправления ошибок предполагают такую же сложность. Автокаталитические множества позволяют увеличивать функциональную сложность еще до появления шаблонной репликации.

Математические модели показывают, что по мере роста химического разнообразия вероятность формирования автокаталитического множества испытывает резкий фазовый переход — внезапное появление самоподдерживающейся автокаталитической активности. Это аналогично фазовому переходу перколяции в случайных графах.

Подобные переходы могут также объяснять последующие скачки в сложности, включая появление мозга. Проще говоря, мозг функционирует как внутренняя модель внешнего мира, обучаемая опытом и используемая для предсказания будущих событий. Например, адаптацию параметров в «игрушечном» мозге можно моделировать, используя обратную температуру (β) в системе, аналогичной Изингу, вместо связности или размера, в качестве критического управляющего параметра. В таких моделях эволюционная приспособленность достигает пика при критическом значении β, когда окружающая среда динамична, неоднородна и непредсказуема. Хотя фазовые переходы формально применимы к бесконечным системам, резкие переходы при больших конечных системах также часто проявляют свои преимущества.

В духе данной статьи вернемся к ИИ. Предположим, что химические реакционные сети в клетке можно рассматривать как своего рода нейронную сеть. Тогда возникает вопрос: сколько информации должно быть закодировано в такой сети для достижения сложности, аналогичной жизни? Недавние работы по рекуррентным нейронным химическим реакционным сетям (RNCRN) показали, что искусственные рекуррентные нейронные сети могут быть отображены на химические реакционные сети. Эти сети способны аппроксимировать произвольные динамические системы, управляемые обыкновенными дифференциальными уравнениями. В отличие от прямых нейронных сетей, которые аппроксимируют статические отображения вход–выход, RNCRN моделируют зависимые от времени поведения, такие как переключения в мультустабильных системах или колебания, часто наблюдаемые в биологии.

Это указывает на то, что достаточно сложные химические реакционные сети могут имитировать нейронные сети и, следовательно, аппроксимировать почти любое поведение — от быстрой сигнализации до медленной регуляции генов и контроля клеточного цикла. Это основано на теореме об универсальной аппроксимации, которая гарантирует, что нейронная сеть достаточного размера способна аппроксимировать любую непрерывную функцию с произвольной точностью. С этой точки зрения, совокупность взаимодействующих молекул превращается в клетку, как только она способна аппроксимировать адаптивные функции, необходимые для выживания.

В настоящее время такие RNCRN остаются небольшими (менее 10 видов или узлов), и пока не ясно, какой размер сети необходим для вычисления полного набора клеточного поведения. Тем не менее можно попытаться оценить требуемый размер сети. Теорема об универсальной аппроксимации утверждает, что для любой непрерывной вещественной функции и любого целевого отклонения ε > 0 существует нейронная сеть, аппроксимирующая функцию f с точностью ε на компактном множестве.

Недавние результаты дают верхнюю границу числа нейронов (M), необходимого для такой аппроксимации:

M(ε) ≤ C ∙ ε−n/k

где n — размерность входа, k — гладкость класса функций, а C — константа, зависящая от f. Более гладкие функции (с большим k) требуют меньшего числа нейронов. Однако по мере увеличения размерности входа n аппроксимация становится сложнее.

Как размер такой сети соотносится с информационным содержанием? Если каждый параметр (например, вес или смещение) должен быть задан с точностью p бит, то общее количество информации, необходимое для определения сети, равно:

INN ≈ M ∙ p

Объединяя два уравнения выше, получаем:

Iprotocell(ε) ~ p ∙ ε−n/k

Это напрямую связывает ошибку аппроксимации ε с информационной сложностью, при условии одинаковой точности p. Следует отметить, что эта оценка относится только к динамическому регуляторному ядру протоклетки, а не к ее полному геномному, ст��уктурному или метаболическому описанию.

Данный подход предоставляет принципиальный способ оценки минимального информационного содержания систем, имитирующих жизнь, с ограничениями, накладываемыми теорией аппроксимации и пределами кодирования. В сочетании с теорией скорости и искажения это может помочь формализовать, сколько структуры, памяти и устойчивости должна иметь протоклетка, чтобы быть функционально полной. При этом здесь нет предсказания внезапного перехода к более высокой сложности.

Теперь рассмотрим другой подход и исследуем, насколько большой и связной должна быть сеть, чтобы вычисления возникли спонтанно. Линейная пороговая модель демонстрирует переход перколяции при критической средней степени zc = 1. Это означает, что когда в среднем каждый узел соединен с одним другим, возникает гигантская связная компонента (GCC), способная к нетривиальным вычислениям.

Минимальная сеть примерно из 104 компонентов при достаточной связанности и правильном балансе активации и ингибирования может начать вычислять сложные булевы функции. Это поддерживает идею, что протоклетка, способная принимать решения, может требовать лишь около 104 взаимодействующих компонентов. Если каждый из них вносит по 10 бит, общий объем информации составляет всего 105–106 бит, что значительно меньше ранее оцененных 109 бит. Однако здесь учитывается только логическая способность, без структурной или биохимической реализации, поэтому это следует рассматривать как нижнюю границу.

В совокупности, достаточно сложные химические реакционные сети могут имитировать динамику рекуррентных нейронных сетей или делать возникновение сложных логических функций практически неизбежным. Это открывает интересную возможность: биологические системы — даже на молекулярном уровне — могут приближаться к универсальной вычислительной мощности в своем выразительном потенциале. Действительно, химическая кинетика, при правильной структуре, способна реализовывать универсальные вычисления. Более конкретно, химические реакционные сети, управляемые кинетикой массового действия, могут симулировать произвольные вычисления и, таким образом, являются Тьюринг-полными.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых.

Эпилог

В рассмотренном нами сегодня труде ученые попытались понять вероятность спонтанного возникновения жизни на ранней Земле. Используя подход, основанный на теории информации и алгоритмической сложности, они оценили, насколько трудно формировать структурированную биологическую информацию в доорганических условиях. Даже при крайне ограниченных ресурсах и низкой эффективности молекулярных процессов накопление информации, необходимой для появления жизни, могло происходить на геологических временных масштабах.

Геологические данные позволяют предположить, что жизнь могла появиться уже около 4 миллиардов лет назад, однако механизмы ее спонтанного возникновения остаются неясными. Возможные сценарии включают коллективную автокатализу и другие формы самоорганизации, которые позволяют обходить информационные «узкие места» ранней саморепликации, делая появление жизни более вероятным.

Современные методы моделирования клеточных процессов, включая искусственный интеллект и алгоритмы прогнозирования структуры белков, помогают количественно оценить информационное содержание жизни и выявить физические и информационные ограничения, с которыми сталкивается формирование жизнеспособной протоклетки.

В итоге, несмотря на значительные достижения в изучении происхождения жизни, фундаментальные вопросы остаются открытыми. Применение теории информации и алгоритмической сложности создает новые концептуальные рамки, позволяющие понять, как простые химические системы могли перейти к организованной, самовоспроизводящейся жизни.

Немного рекламы

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Комментарии (4)


  1. saag
    29.10.2025 08:32

    " - Неизвестный корабль, назовите себя!"

    " - Неизвестный корабль, слушаю вас"

    " - Как вы называетесь?", следует непереводимый набор звуков, очевидно означающий какое-то самоназвание. " - Как возникла наша Вселенная?"

    " - В результате взрыва."

    " - Как возникла жизнь на нашей планете?"

    " - Из пробирки"

    ...из любительского радиообмена с инспекторским кораблем...


  1. atues
    29.10.2025 08:32

    Почему-то хочется верить, что жизнь на нашей планете появилась не благодаря "оплодотворению" занесенным из космоса мусором. Т.е. мы - не следствие пикника на обочине (да-да, отсылка к Стругацким), а следствие физических и химических процессов. Да даже если мы и произошли от такого мусора, то как тогда возник этот самый мусор? От протомусора? Это точно ничего не обьясняет, ибо не видно где же надо остановиться. Останется только отбросить рациональные доводы, сложить лапки и обратиться к идее Творца ))) Как-то не интересно


  1. roqin
    29.10.2025 08:32

    Лишь в последнем «мгновении» планетарного времени, около 100 000 лет назад, появились анатомически современные люди, наделенные любопытством и способностью к созданию поразительных технологий.

    А не более 300 тысяч лет назад эти Homo Sapiens появились?


  1. ash_lm
    29.10.2025 08:32

    Второй, также стерилизующий, удар произошел примерно на 40 миллионов лет позже и известен как «Moneta».

    Гипотеза с протопланетой Theia известна давно. А вот информация про "удар произошел примерно на 40 миллионов лет позже и известен как «Moneta»." - это у вас откуда? Какие-то секретные научные статьи? Может быть какие-то очевидцы рассказали или просто нейронка сгаллюцинировала? Просто я впервые про это слышу и поверхностный поиск ничего не даёт.