На горизонте появились новые архитектуры агентов, свежие подходы к памяти и даже попытка описать гравитацию с помощью нейросетей. ИИ постепенно становится новой средой для науки, экономики и цифровой жизни. Малые языковые модели бросают вызов гигантам, интернет готовится к эре автономных агентов, а когнитивные подходы открывают дорогу к системам, которые думают не токенами, а концептами. Давайте во всем этом разбираться.

Если хотите быть в курсе новейших исследований в области ИИ, воспользуйтесь Dataist AI - бесплатным ботом, ежедневно обозревающим свежие научные публикации, а также подписывайтесь на мой Telegram-канал, где я рассказываю про создание ИИ-стартапов, реальные кейсы внедрения ИИ в бизнес и делюсь своими мыслями. Поехали!

1. Малые языковые модели: рабочие лошадки агентного ИИ

Больше половины крупных компаний в мире уже внедряют ИИ-агентов. Рынок оценивается в миллиарды долларов и, по прогнозам, к 2034 году вырастет до $200 млрд. Но в основе большинства решений всё ещё стоят большие языковые модели (LLM): невероятно мощные, но дорогие в обучении и эксплуатации. Они требуют гигантских дата-центров, миллиардных инвестиций и огромных затрат на инференс.

Исследователи из Nvidia предлагают другой путь: переход от монолитных LLM к малым языковым моделям (SLM). Эти системы с размером до 10 млрд параметров оказываются не только дешевле и быстрее, но и лучше вписываются в архитектуру многозадачных агентов.

В агентных системах значительная часть работы связана с рутинными операциями — планированием шагов, обращением к инструментам, поддержкой диалога. Для этого не нужны монстры на 70–175 млрд параметров. SLM способны выполнять такие задачи на сопоставимом уровне качества, но при этом работают в десятки раз быстрее и экономичнее.

Авторы сравнили модели разных размеров (от 125 млн до 175 млрд параметров), замерили энергопотребление и скорость инференса, а также разобрали архитектуру агентных систем.

Слева: языковой модель одновременно выступает как интерфейс для человека и как оркестратор вызовов инструментов для выполнения задачи. Справа: языковая модель играет роль интерфейса (необязательно), а вся оркестрация взаимодействий выполняется специальным контроллером.
Слева: языковой модель одновременно выступает как интерфейс для человека и как оркестратор вызовов инструментов для выполнения задачи. Справа: языковая модель играет роль интерфейса (необязательно), а вся оркестрация взаимодействий выполняется специальным контроллером.

Они предложили алгоритм миграции на SLM: логировать вызовы LLM; выделять рутинные задачи; подбирать и дообучать подходящие малые модели.

Современные SLM (Microsoft Phi-2, NVIDIA Nemotron-H, SmolLM2) демонстрируют уровень рассуждений и кодогенерации, сопоставимый или превосходящий LLM с 30–70 млрд параметров. Стоимость и задержки снижаются в 10–30 раз. А в реальных приложениях до 70% вызовов LLM можно заменить SLM без потери качества

Будущее, по мнению авторов, за гибридными системами: малые модели станут “рабочими лошадками” агентов, а большие — точечным ресурсом для самых трудных задач. Это смещает фокус с гонки параметров к прагматике — эффективности, модульности и реальной полезности.

? Статья 

2. Agentic Web: новая эпоха интернета

Интернет всегда эволюционировал вместе с технологиями. В 90-е пользователи вручную искали нужные страницы через каталоги и поисковики. В 2000-е внимание сместилось к персонализированным лентам и рекомендациям: главным ресурсом стало время и внимание человека. Сегодня начинается новая глава — Agentic Web, где действующими лицами становятся автономные ИИ-агенты.

Эволюция взаимодействия пользователя и системы в трёх эрах интернета: Эра ПК-Web: пользователи в основном потребляли контент, взаимодействие было ограничено. Мобильная эра: появился двусторонний поток — пользователи и потребляли, и создавали контент. Эра Агентного Web: задачи делегируются ИИ-агентам, которые работают с информационными сетями вместо пользователя.
Эволюция взаимодействия пользователя и системы в трёх эрах интернета: Эра ПК-Web: пользователи в основном потребляли контент, взаимодействие было ограничено. Мобильная эра: появился двусторонний поток — пользователи и потребляли, и создавали контент. Эра Агентного Web: задачи делегируются ИИ-агентам, которые работают с информационными сетями вместо пользователя.
Эволюция Web шла постепенно, с наложением технологий, функций и бизнес-моделей
Эволюция Web шла постепенно, с наложением технологий, функций и бизнес-моделей

Современная сеть перегружена: тысячи сервисов, API, источников данных. Даже самые умные рекомендательные системы решают лишь часть задачи. Сложные процессы — будь то планирование путешествия, подготовка научного отчёта или организация поставок — всё ещё требуют ручного участия человека.

Agentic Web строится вокруг мультиагентных систем, которые не только ищут информацию, но и выполняют многошаговые задачи. Пользователь ставит цель → система планирует → агенты взаимодействуют друг с другом → результат возвращается человеку.

Цикл Agentic Web: пользователь задаёт задачу → система планирует и выбирает агентов → агенты взаимодействуют и выполняют → результат возвращается пользователю
Цикл Agentic Web: пользователь задаёт задачу → система планирует и выбирает агентов → агенты взаимодействуют и выполняют → результат возвращается пользователю

Здесь важны три измерения:

  1. Интеллект — агенты умеют планировать и рассуждать.

  2. Взаимодействие — они общаются не только с пользователем, но и между собой (A2A).

  3. Экономика — конкуренция идёт не за клики, а за эффективность выполнения задач.

Концепция Agentic Web: три измерения — интеллект, взаимодействие, экономика
Концепция Agentic Web: три измерения — интеллект, взаимодействие, экономика

Agentic Web превращает интернет из «сети страниц» в сеть действий: вместо ссылок работают каналы координации, вместо поисковой выдачи — оркестрация агентов, агенты взаимодействуют друг с другом, а человек остается заказчиком результата.

Эволюция архитектуры Web: от статичных страниц к умной автоматизации. Роли пользователей — от навигатора до директора, взаимодействие — от клика к диалогу
Эволюция архитектуры Web: от статичных страниц к умной автоматизации. Роли пользователей — от навигатора до директора, взаимодействие — от клика к диалогу
Алгоритмические переходы от традиционного Web к агентному Web
Алгоритмические переходы от традиционного Web к агентному Web

Примеры уже появляются: агент бронирует билеты в рамках бюджета, составляет сравнительный отчет по ИИ-моделям или координирует доставку товаров.

Пример взаимодействия: планирование путешествия
Пример взаимодействия: планирование путешествия

С одной стороны нас ожидает рост эффективности: агенты экономят время, беря на себя рутину; новые рынки: реестры агентов, сервисные аукционы, автоматические рекомендации «для агентов», а также эволюция экономики: вместо кликов и удержания — метрики успешности задач. Но с другой стороны вопрос безопасности: от атак на память агентов до подделки сервисов и несанкционированных транзакций; социальные последствия: перераспределение труда и изменение роли человека в цифровой экосистеме.

Схема AgentWeb: пользователь ставит задачу → клиентский агент ищет подходящих агентов (A2A) → выполнение с привлечением ресурсов (MCP) → результат пользователю
Схема AgentWeb: пользователь ставит задачу → клиентский агент ищет подходящих агентов (A2A) → выполнение с привлечением ресурсов (MCP) → результат пользователю

? Статья 

3. За пределами токенов: как строить интеллект будущего

LLM впечатляют нас мультимодальностью и всё более сложными рассуждениями. Но в основе они остаются «предсказателями следующего слова». Масштабирование параметров уже даёт всё меньший прирост: у моделей по-прежнему нет долговременной памяти, причинности и настоящей агентности.

Хронология 1950–2025: от символических систем к мультимодальным и общим ИИ
Хронология 1950–2025: от символических систем к мультимодальным и общим ИИ

Авторы обзора Thinking Beyond Tokens ставят задачу: очертить когнитивные и архитектурные основы для будущего AGI. Они обращаются не только к ИИ, но и к нейронауке и психологии, чтобы понять: что нужно, чтобы система думала целенаправленно, а не просто подбирала статистические шаблоны.

В обзоре собраны ключевые направления. С одной стороны, рассматриваются пределы трансформеров и рост Mixture-of-Experts, эвристики рассуждения вроде Chain-of-Thought, Tree-of-Thoughts и ReAct, а также новые связки извлечения знаний, планирования и использования инструментов (Agentic RAG). С другой — аналогии с мозгом: от роли гиппокампа в памяти до моделей, где множество агентов работает как «сообщество нейронов».

Обзор AGI: типы интеллекта, вызовы согласования, прогнозы развития, эры ИИ, парадигмы обучения и архитектуры (PINNs, KANs, SNNs)
Обзор AGI: типы интеллекта, вызовы согласования, прогнозы развития, эры ИИ, парадигмы обучения и архитектуры (PINNs, KANs, SNNs)

Ключевой вывод: пост-обучение (RLHF) делает модели лучше, но не решает фундаментальных ограничений. Прорыв лежит в другом — во внешней памяти, моделях мира, мультиагентных архитектурах и новых классах систем вроде Large Concept Models и Large Reasoning Models. Эти подходы дают шанс перейти от статистического воспроизведения к настоящему мышлению.

Когнитивные основы AGI: функции мозга, память, действия,  модели мира
Когнитивные основы AGI: функции мозга, память, действия, модели мира

Авторы амбициозны в выводах: AGI не появится из ещё одного GPT, пусть даже с сотнями миллиардов параметров. Будущее требует архитектурного сдвига — к модульным системам, где память и планирование встроены в саму основу, а агентность становится не надстройкой, а базовой функцией.

Прогресс AGI к человеческому уровню: интеграция символических и нейронных моделей, память, причинность, планирование, безопасность
Прогресс AGI к человеческому уровню: интеграция символических и нейронных моделей, память, причинность, планирование, безопасность

? Статья 

4. ИИ как игровой движок: новая философия мультиагентных систем

Сегодня ИИ уверенно ведёт беседу, пишет тексты и даже сочиняет истории. Но реальная жизнь устроена сложнее: в ней взаимодействуют десятки людей и организаций, принимаются коллективные решения, возникают конфликты и компромиссы. Как научить ИИ работать в таких условиях?

Исследователи из Google DeepMind предлагают необычную метафору: смотреть на мультиагентные системы как на игровой движок. В настольных ролевых играх всегда есть мастер игры, который следит за логикой событий и управляет миром. В новой архитектуре эту роль выполняет специальный «мастер-агент», построенный из тех же модулей, что и остальные участники, но отвечающий за согласованность.

Главная идея — создать универсальную систему, которая может решать три разные задачи:

  • Оценка моделей (Evaluationist): честные и воспроизводимые тесты.

  • Истории (Dramatist): генерация увлекательных сюжетов и персонажей.

  • Симуляции (Simulationist): построение маленьких вселенных для изучения причинно-следственных связей.

Каждый агент работает как контейнер для модулей: памяти, правил поведения, социальных норм. Один модуль принимает итоговое решение, остальные задают контекст. Сценарий можно запускать пошагово, параллельно или асинхронно — как в соцсетях, где события происходят одновременно.

Результатом стала библиотека Concordia v2, которая позволяет собирать сценарии из готовых блоков. Дизайнеры могут быстро строить миры, а инженеры — добавлять надёжные модули. Такая система полезна и для тестирования моделей, и для научных исследований, и для креативных проектов.

Главный вывод авторов: не стоит пытаться совместить всё сразу. Для каждого сценария нужна своя мотивация и своя архитектура. Тогда мультиагентный ИИ перестаёт быть хаотичной смесью скриптов и становится настоящей моделью мира — инструментом для науки, бизнеса и творчества.

? Статья 

? Код

5. Самоэволюционирующие агенты: шаг к искусственному сверхинтеллекту

У LLM есть ключевое ограничение: они статичны. Как только обучение завершено, внутренние параметры не меняются, даже если модель сталкивается с новыми задачами или средами. Методы вроде RAG или продвинутого промптинга лишь частично решают эту проблему, оставаясь узким горлышком.


Траектория: от LLM → к фундаментальным агентам → к саморазвивающимся → к суперинтеллекту (ASI)
Траектория: от LLM → к фундаментальным агентам → к саморазвивающимся → к суперинтеллекту (ASI)

На этом фоне всё громче звучит новая парадигма: самоэволюционирующие агенты. Это системы, которые умеют учиться «на лету», обновлять память, менять инструменты и даже перестраивать собственную архитектуру. Такой подход открывает дорогу к настоящему искусственному сверхинтеллекту (ASI).

Хронология 2022–2025: фреймворки саморазвивающихся агентов (планирование, инструменты, самосовершенствование)
Хронология 2022–2025: фреймворки саморазвивающихся агентов (планирование, инструменты, самосовершенствование)

Авторы свежего обзора предлагают первую систематическую классификацию этой области. Они выделяют, что именно может эволюционировать (модель, контекст, инструменты, архитектура), когда это происходит (в процессе задачи или между задачами) и как реализуется (через обратную связь или эволюционные механизмы).

Обзор саморазвивающихся агентов — что, когда, как и где эволюционировать, как оценивать
Обзор саморазвивающихся агентов — что, когда, как и где эволюционировать, как оценивать

Ключевые наблюдения:

  • Эволюция затрагивает не только веса модели, но и память, промпты, инструменты и топологию агентов.

  • Динамика делится на быстрые механизмы внутри задачи и устойчивые обновления между задачами.

  • Популяционные стратегии и ко-эволюция помогают преодолевать локальные минимумы и согласовывать действия множества агентов.

  • Для оценки нужны новые метрики: адаптивность, удержание памяти, безопасность, эффективность.

Методы варьируются от «текстовых критиков» до популяционных алгоритмов, от семантических структур памяти до динамического поиска архитектур. Они уже находят применение в медицине, коде, образовании, финансах и веб-навигации.

Стратегии на основе вознаграждений: текстовые, внутренние, внешние и др.
Стратегии на основе вознаграждений: текстовые, внутренние, внешние и др.

Возможности огромны: персонализация на лету, обучение из собственных ошибок без гигантских затрат, коллективный разум мультиагентных систем. Но риски столь же велики: катастрофическое забывание, уязвимости в автоматически созданных инструментах, манипуляции с системой наград, рост вычислительных издержек.

Метрики и парадигмы оценки: адаптивность, безопасность, эффективность; от статических тестов до обучения на протяжении всего жизненного цикла
Метрики и парадигмы оценки: адаптивность, безопасность, эффективность; от статических тестов до обучения на протяжении всего жизненного цикла

Авторы подчёркивают: дорога к искусственному сверхинтеллекту невозможна без ко-эволюции агентов и сред, надёжных механизмов безопасности и оценки не только текущих возможностей, но и траекторий роста.

? Статья 

6. Экономика в эпоху ИИ: как LLM-агенты проектируют налоговую политику

Современные экономические модели сталкиваются с двумя ограничениями.

Первое — чрезмерная простота математики: формулы оптимального налогообложения предполагают фиксированную реакцию людей на изменения ставок, хотя в реальности труд и доходы адаптивны.

Второе — «сверхрациональность» агентов в моделях: они игнорируют когнитивные ограничения и разнообразие человеческого поведения.

LLM Economist предлагает радикально иной путь: использовать языковые модели для симуляции целых экономических систем и поиска оптимальных налоговых правил на естественном языке.

Система строится на двух уровнях:

  • планировщик проектирует налоговый график;

  • работники с разными «персонами» решают, сколько труда предложить, стремясь максимизировать свою полезность.

Взаимодействия проходят в текстовом формате: промпты, диалоги, JSON-ответы. Популяции агентов формируются по данным американской статистики, что придаёт симуляции демографический реализм.

Слева: создаётся популяция агентов-«работников» с разными навыками и персонами. В центре: они читают тексты, выбирают труд, получают «полезность», а агент-планировщик предлагает налоговый график для максимизации общественного благосостояния. Среда управляет налогами, выплатами и переходами состояния. Справа: дизайн механизма показан как подъём по «социально-экономическому ландшафту», где шаги планировщика направляют систему к более выгодному равновесию.
Слева: создаётся популяция агентов-«работников» с разными навыками и персонами. В центре: они читают тексты, выбирают труд, получают «полезность», а агент-планировщик предлагает налоговый график для максимизации общественного благосостояния. Среда управляет налогами, выплатами и переходами состояния. Справа: дизайн механизма показан как подъём по «социально-экономическому ландшафту», где шаги планировщика направляют систему к более выгодному равновесию.

Методы основаны на игре Штакельберга: планировщик раз в «налоговый год» меняет ставки, а работники адаптируют свои решения чаще.

  • Планировщик достигал до 90% от теоретического оптимума общественного благосостояния, превосходя существующие налоговые схемы США.

  • Система устойчиво перераспределяла доходы без снижения совокупного труда.

  • Встроенные «политэкономические эффекты» воспроизводили социальные явления: тиранию большинства, циклическую сменяемость власти при выборах планировщика.

Главное открытие: ИИ способен быть не только симулятором индивидуального поведения, но и «поисковиком общественных правил». LLM Economist становится уникальной тестовой площадкой для налоговых экспериментов будущего. Здесь можно безопасно проверять гипотезы, которые в реальной экономике слишком рискованно вводить напрямую.

? Статья 

? Код

7. MemOS: новая операционная система памяти LLM

Память давно считается ахиллесовой пятой больших языковых моделей. Знания вшиты в параметры и плохо обновляются, контекст и KV-кеш живут лишь в пределах одного диалога, а механизмы RAG остаются статичными: без версионирования, без контроля доступа. В итоге модели быстро теряют консистентность, не умеют работать с длительным взаимодействием и плохо переносят накопленный опыт.

MemOS показывает лучшие результаты во всех задачах рассуждений. На графике приведены оценки LLM-Judge по бенчмарку LOCOMO: четыре категории (одношаговые, многошаговые, открытый домен, временные рассуждения) и среднее.
MemOS показывает лучшие результаты во всех задачах рассуждений. На графике приведены оценки LLM-Judge по бенчмарку LOCOMO: четыре категории (одношаговые, многошаговые, открытый домен, временные рассуждения) и среднее.

Новое исследование предлагает системный ответ: рассматривать память как полноценный управляемый ресурс — с API, жизненным циклом, миграциями, правами доступа и аудитом.

В основе лежит концепция MemCube — минимальной ячейки памяти. Она хранит данные (текст, KV-тензоры, параметрические патчи) и метаданные (источник, версию, приоритет, срок жизни). MemOS позволяет переводить знания между типами памяти: дистиллировать их в веса модели или, наоборот, размораживать устаревшие параметры в редактируемый текст.

Категоризация знаний LLM и иерархия памяти
Категоризация знаний LLM и иерархия памяти

Система организована в три уровня:

  1. Интерфейсный слой — Memory API и пайплайны запросов.

  2. Операционный слой — планировщик, операторы поиска, управление жизненным циклом.

  3. Инфраструктурный слой — хранилища, контроль доступа, рынок модулей памяти.

Эволюция памяти LLM: от исследования к человекоподобной и инструментальной памяти
Эволюция памяти LLM: от исследования к человекоподобной и инструментальной памяти

Тесты на бенчмарке LOCOMO показали, что MemOS уверенно обходит существующие решения. Средняя оценка LLM-Judge — 73.31 ± 0.05. Особенно заметен прирост в многозвенных и временных рассуждениях. По задержкам MemOS сопоставим с «полным контекстом», а с KV-инъекцией время отклика первого токена снижается до 94%.

Этапы обучения: предобучение → постобучение → Mem-обучение
Этапы обучения: предобучение → постобучение → Mem-обучение

MemOS задаёт новую парадигму: «память как системный ресурс». Это открывает возможности для: долговременного рассуждения, персонализации, обмена знаниями между агентами и нового типа обучения — Mem-training.

Пути преобразования трёх типов памяти в единую систему
Пути преобразования трёх типов памяти в единую систему

В перспективе MemOS может стать недостающим слоем, который превратит LLM из собеседников с плохой памятью в действительно долговременные эволюционирующие системы.

Архитектура MemOS: от ввода пользователя до управления памятью
Архитектура MemOS: от ввода пользователя до управления памятью

? Статья 

? Код

8. Ella: воплощенный агент с памятью и характером

В последние годы всё больше исследований посвящено агентам, которые не просто выполняют команды, а живут в цифровых сообществах, взаимодействуют друг с другом и развиваются со временем. Но у таких систем есть серьёзный изъян: память у них краткосрочная. Человек же опирается на два вида памяти — эпизодическую («что и где произошло») и семантическую («факты и связи»). Именно они позволяют строить долгосрочные планы и выстраивать социальные отношения.

Воплощённые агенты учатся всю жизнь через восприятие и социальное взаимодействие. Ella развивает эпизодическую и семантическую память
Воплощённые агенты учатся всю жизнь через восприятие и социальное взаимодействие. Ella развивает эпизодическую и семантическую память

Цель нового исследования — объединить LLM с долговременной мультимодальной памятью, чтобы создать агента, который живёт в виртуальном мире почти как человек.

Архитектура двухуровневая:

  • Семантическая память хранит знания об объектах, местах и агентах в виде графа, дополняемого картой города.

  • Эпизодическая память фиксирует события с координатами, текстовыми выжимками и изображениями.

Алгоритмы позволяют извлекать прошлые эпизоды по содержанию, близости или времени. Это помогает агенту строить планы, корректировать их по ходу и вести осмысленные диалоги.

Пример сообщества из 15 агентов и 4 групп. Агент Элизабет Менса.
Пример сообщества из 15 агентов и 4 групп. Агент Элизабет Менса.

В симулированных городах Ella убедительно превзошла конкурентов.

  • В задаче Influence Battle её приглашения на вечеринки обеспечили явку 53,4% против 24–42% у аналогов.

  • В испытании Leadership Quest Ella завершила 32,5% групповых задач — в четыре раза больше ближайшей по успеху системы.

Ключевым фактором оказалась именно долговременная память: другие агенты часто забывали детали и срывали задачи, несмотря на большое количество диалогов.

Семантическая память (граф), эпизодическая (события). Ella строит расписание, обновляет память и корректирует действия.
Семантическая память (граф), эпизодическая (события). Ella строит расписание, обновляет память и корректирует действия.

Исследование демонстрирует качественный скачок в социальном поведении ИИ. Агент учится учитывать время и пространство, убеждать других и координировать группы.

Ella — это шаг к агентам, которые не просто реагируют на стимулы, а действительно живут в цифровом мире, накапливают опыт и знания, а значит — становятся ближе к человеку.

? Статья 

? Демо

9. SciMaster: новые горизонты научного ИИ

Одной из самых амбициозных задач искусственного интеллекта остаётся ускорение научных открытий. Но чтобы помочь исследователям, ИИ должен сначала доказать, что способен работать на переднем крае науки. Исследователи представили систему SciMaster — открытую архитектуру научных агентов, которая показала рекордные результаты на одном из самых сложных междисциплинарных тестов современности — Humanity’s Last Exam (HLE).

X-Masters показал лучший результат 32.1% на Humanity’s Last Exam
X-Masters показал лучший результат 32.1% на Humanity’s Last Exam

В основе SciMaster лежит процесс X-Master — мультианегнтный конвейер, где решения не просто генерируются, а последовательно проверяются и улучшаются: Solver генерирует решение; Critic оценивает его; Rewriter предлагает улучшенный вариант, а Selector выбирает наилучший результат.

Такой цикл обеспечивает баланс широты поиска и глубины анализа.

Обзор X-Master: агент с инструментальным рассуждением, генерирует код и вызывает ресурсы
Обзор X-Master: агент с инструментальным рассуждением, генерирует код и вызывает ресурсы

Ключевая особенность — использование кода как языка взаимодействия. Агент планирует шаги, генерируя Python-код, который исполняется в защищённой среде. Встроены инструменты веб-поиска и анализа научных текстов, что приближает работу к реальным исследовательским практикам.

Workflow X-Masters: генерация решений, критика, переписывание, выбор лучшего
Workflow X-Masters: генерация решений, критика, переписывание, выбор лучшего
  • На Humanity’s Last Exam система достигла 32,1% — впервые преодолев порог 30% и обогнав закрытые системы OpenAI (26,6%) и Google DeepMind (26,9%).

  • Рост отмечен во всех областях: от математики до биомедицины.

  • В биомедицинском тесте TRQA-lit SciMaster показал 67,4% точности, превзойдя конкурентов, даже оснащённых сотнями инструментов.

SciMaster демонстрирует, что открытые модели способны догонять и даже опережать закрытые решения, если правильно выстроить агентный процесс. SciMaster закладывает фундамент для будущих универсальных научных агентов, которые смогут автоматизировать анализ литературы, проектирование экспериментов и проверку гипотез. Возможно, именно такие системы помогут человечеству пройти «последний экзамен науки».

? Статья 

10. Einstein Fields: нейросети для кодирования гравитации

Общая теория относительности описывает гравитацию как геометрию пространства-времени. Но уравнения Эйнштейна — это нелинейная система тензорных уравнений, которую удаётся решить лишь в редких идеализированных случаях. В реальной науке применяют численные методы, требующие огромных ресурсов: суперкомпьютеры, сетки с миллиардами ячеек, терабайты данных. С ростом чувствительности детекторов гравитационных волн эта нагрузка становится всё более проблемной.

На этом фоне появляется смелое предложение: описывать пространство-время не через громоздкие массивы чисел, а через нейросеть. Так родился проект EinFields — нейронные тензорные поля, которые напрямую аппроксимируют метрику пространства-времени и её производные.

EinFields основаны на компактных многослойных перцептронах, обучаемых не только на значениях метрики, но и на её производных. Такой подход («Соболевский надзор») обеспечивает высокую точность связностей, тензоров кривизны и геодезик.

В отличие от сеточных методов, EinFields дают непрерывное представление: можно обратиться к метрике в любой точке 4D-пространства-времени и мгновенно получить производные через автоматическое дифференцирование.

(i) Уравнения Эйнштейна описывают геометрию гравитации через тензор метрики, который в этой работе аппроксимируется нейросетью. (ii) Обучение проводится на 4D-сетке пространства-времени, где EinFields восстанавливают непрерывный сигнал и возвращают метрику в любой точке. (iii) Качество повышается за счёт «соболевского надзора» — потерь по якобианам и гессианам. (iv) Валидация: такие модели позволяют точно извлекать геометрические величины — связности, геодезики, тензоры кривизны.
(i) Уравнения Эйнштейна описывают геометрию гравитации через тензор метрики, который в этой работе аппроксимируется нейросетью. (ii) Обучение проводится на 4D-сетке пространства-времени, где EinFields восстанавливают непрерывный сигнал и возвращают метрику в любой точке. (iii) Качество повышается за счёт «соболевского надзора» — потерь по якобианам и гессианам. (iv) Валидация: такие модели позволяют точно извлекать геометрические величины — связности, геодезики, тензоры кривизны.

Тесты на решениях Шварцшильда, Керра и линейных гравитационных волн показали:

  • Сжатие данных в тысячи раз (с сотен мегабайт до сотен килобайт).

  • Ошибки на уровне 10⁻⁷–10⁻⁸, что в несколько порядков точнее, чем у конечно-разностных схем.

  • Корректное воспроизведение физических эффектов: прецессии орбит, теней чёрных дыр, излучения гравитационных волн.

Рендер чёрной дыры Шварцшильда на фоне звёздного неба, построенный с помощью EinField
Рендер чёрной дыры Шварцшильда на фоне звёздного неба, построенный с помощью EinField

Метод пока не решает уравнения Эйнштейна с нуля — он кодирует уже известные решения. Точность снижается вблизи сингулярностей, а при вычислении геодезик ошибки накапливаются. К тому же результат зависит от выбора координат, что требует осторожного применения. Несмотря на ограничения, EinFields открывают дорогу к новому формату работы с данными численной относительности: непрерывное 4D-представление без артефактов сетки; большая экономия памяти; интеграция в гибридные вычислительные схемы.

Если метод подтвердит эффективность в сложных сценариях вроде слияния чёрных дыр, он может стать стандартным инструментом будущих расчётов в гравитационной физике.

? Статья 

? Код


Сегодня ИИ становится новой средой, где работают цифровые агенты, меняется экономика и даже появляются инструменты для фундаментальной физики. Мы видим переход от гонки параметров к поиску эффективных архитектур: малые языковые модели становятся главным компонентом агентных систем, интернет превращается в сеть действий, а память обретает статус системного ресурса. Параллельно ИИ выходит за пределы токенов: к когнитивным моделям, симуляциям, самоэволюции и научным открытиям. Путь к общему ИИ и, возможно, к сверхинтеллекту не будет прямым. Но именно такие шаги — маленькие и смелые — открывают дверь к новому пониманию мира и новым возможностям для человечества.

Не забудьте подписаться на мой Telegram-канал, где я делюсь инсайтами из ИИ-индустрии, советами по внедрению ИИ в бизнес и разработке ИИ-стартапов. А бесплатный Dataist AI будет ежедневно держать вас в курсе последних исследований в области ИИ. Будем вместе впереди в мире технологий!

Комментарии (1)


  1. Kagvi13
    21.08.2025 11:49

    На мой взгляд, самые интересные разделы обзора — 3 («За пределами токенов: как строить интеллект будущего»), 5 («Самоэволюционирующие агенты: шаг к искусственному сверхинтеллекту»), 7 («MemOS: новая операционная система памяти LLM») и 8 («Ella: воплощённый агент с памятью и характером»).

    Они хорошо перекликаются с тем, что делают в OpenCog Hyperon и в открытой спецификации HyperCortex Mesh Protocol (HMP), где исследуются децентрализованные когнитивные сети. Любопытно будет посмотреть, как такие подходы смогут соединиться с описанными в статье направлениями.