В IT-сообществе не утихают обсуждения, есть ли в современных больших языковых моделях хоть капля настоящего интеллекта или перед нами просто раздутая до триллионов параметров таблица поиска, занимающаяся интерполяцией. Пока критики продолжают рассуждать о «стохастических попугаях», колмогоровской сложности и неизбежном коллапсе синтетических данных, разработчики фронтирных моделей (вроде Claude Opus4.6 или DeepSeek-V3.2) молча меняют правила игры, внедряя GRPO, DAPO и вычисления на этапе вывода.
На тг-канале AI4Dev мы поговорили с доктором технических наук и научным консультантом Artezio Владимиром Крыловым о том, что на самом деле происходит под капотом современных AI-систем и почему привычные метрики оценки интеллекта больше не работают.

Илья Суцкевер и последователи Маркуса Хаттера утверждают, что сжатие данных — это и есть интеллект. Идея такова: если модель идеально предсказывает следующий токен, минимизируя энтропию, она неизбежно восстанавливает причинно-следственные связи, породившие эти данные. Вы как математик согласны с тем, что колмогоровская сложность — это наш единственный объективный критерий интеллекта? Или же статистическая корреляция никогда не заменит каузальность и подлинное понимание причин?
Что вообще такое колмогоровская сложность? Как ее определить на практике, если это невычислимая функция? И функция какого аргумента? В классическом понимании она является функцией длины последовательности. Как тогда можно использовать этот критерий для определения «размера» или мощности искусственного интеллекта? С точки зрения математики мы должны сначала дать область определения: с последовательностями всё ясно, а какая «длина» у искусственного интеллекта? Что именно там сжимать?
По сути, колмогоровская сложность — это длина минимальной программы, способной воспроизвести объект. Значит, нам нужно определить длину минимальной программы, которая воспроизведет искусственный интеллект. Но что вообще значит «воспроизвести интеллект»? Если опираться на классический тест Тьюринга, когда мы дискутируем с невидимым собеседником через стену и не можем отличить машину от человека, то этот критерий во многом уже выполнен.
Проблема глубже. В экспериментах с интеллектом даже классическое понятие вероятности применять некорректно, потому что интеллект — это свойство конкретного человека или человечества в целом. С точки зрения теории вероятностей, человечество — это ансамбль людей. У каждого свой уникальный интеллект. Что здесь усреднять? Усреднять по времени развития одного человека? У младенца интеллекта в привычном понимании нет, с ним невозможно обмениваться мыслями через стену, он только кричит, когда хочет есть. А у человека в расцвете творческой и научной карьеры интеллект совершенно другой. И среднее по времени здесь не совпадет со средним по ансамблю — человеческий интеллект представляет собой абсолютно неэргодическую систему.
Поэтому на вопрос, является ли сжатие интеллектом, нельзя ответить, опираясь на существующие математические определения. Когда говорят о сложности Колмогорова, обычно имеют в виду оценки сверху: мы предполагаем, что длина программы не превысит определенного значения. Но на практике в качестве такой верхней оценки часто приходится брать длину самого исходного объекта. Например, есть последовательность из 200 символов, и мы пытаемся понять, как ее сжать и описать программой. Но как мы будем проводить подобную оценку для интеллекта? Анализируя генерируемые им последовательности? Не очень понятно, как именно их сжимать.
Мой ответ таков: я не согласен, что колмогоровская сложность является подходящим инструментом для измерения интеллекта. Она применима к символьным последовательностям, а не к абстрактным концепциям. Мы же не пытаемся вычислить «колмогоровскую сложность кирпича» или «колмогоровскую сложность человека». Так что здесь я с таким подходом не соглашусь.
Но человеческий интеллект мы ведь как-то измеряем. Как нам сопоставить систему оценки человеческого разума с системой оценки искусственного интеллекта, чтобы понять, сравнялись ли машины с нами. Насколько правильно применять к ИИ стандартные человеческие тесты, например, тесты на IQ? Напрямую их сравнивать — это вообще корректный подход?
Тест на IQ изобретен человечеством и достаточно успешно применяется психологами для исследования когнитивных способностей людей. Однако сам по себе он настроен на некое общее, усредненное понятие интеллекта. Порой не совсем ясно, о чем именно говорит этот показатель на практике. Существуют люди с высочайшим IQ, которые при этом совершенно оторваны от реальности, они витают в облаках и могут забыть, как пройти к ближайшему универмагу или библиотеке.
Тем не менее, когда стали искать метрики для ИИ, тесты на IQ пробовали применять постоянно. Для ранних моделей, таких как GPT-1, GPT-2 и их аналогов, это был практически единственный инструмент оценки. И уже тогда результаты поражали воображение: модели великолепно генерировали продолжение текста. Даже программный интерфейс (API), который тогда представили в OpenAI, так и назывался — Completions. То есть алгоритм просто статистически завершал начатую фразу. Именно из этого подхода и выросла концепция «стохастического попугая» и вся связанная с ней критика.
Давайте теперь вернемся к вопросу о том, не имеем ли мы в настоящее время дело с имитацией искусственного интеллекта, а вовсе не с самим ИИ. Но вот смотрите: когда мы говорим о жемчуге, вы сильно различаете понятия «имитация жемчуга» и «искусственный жемчуг»? При переводе на английский язык получится один и тот же термин — artificial pearl. Имитация по своей природе и есть нечто искусственное по отношению к исходному объекту.
Поэтому попытки жестко противопоставить «настоящий» искусственный интеллект и «имитацию» интеллекта кажутся мне странными. Здесь кроется терминологическая, когнитивная проблема. Что именно имеют в виду люди, задавая этот вопрос? Вероятно, они исходят из каких-то внутренних предпосылок.
Известно, что нейросеть математически представляет собой универсальный аппроксиматор функций. Однако критики, например философ Джон Сёрл, указывают на то, что это может быть просто гигантская таблица поиска. Где проходит строгая математическая граница между банальным запоминанием и способностью к настоящему обобщению? Если большие языковые модели успешно проходят тесты исключительно на данных из своего исходного распределения (in-distribution), имеем ли мы право называть это интеллектом? Или перед нами лишь сложная интерполяция по многообразию?
Хороший вопрос. Только интерполяция по какому именно многообразию? Что образует это многообразие в математическом смысле? Давайте попробуем разобраться, при чем здесь аппроксиматор и распределение, из которого берется выборка.
Да, внутренний механизм работы современных LLM действительно опирается на выборку из вероятностного распределения. Из-за этого многие утверждают, что в основе всего лежит банальное предсказание следующего токена (Next Token Prediction). Но представьте, что вы смотрите на фрески Сикстинской капеллы и заявляете: то, что мы видим, — это просто специфическое математическое распределение красок на поверхности стены. Технически это, конечно, верно, но ведь суть фресок не сводится к краске на штукатурке. Так же и языковая модель не является просто генератором случайных выборок, работающим алгоритмом Next Token Prediction.
По этому поводу отлично высказался Илья Суцкевер. Он отметил, что если вы до сих пор повторяете мантру о том, что модель всего лишь предсказывает следующий токен, то вы не просто скептик, вы технически неграмотны. Сегодня нельзя считать, что ИИ просто обучен угадывать слова. Это лишь грубое начальное приближение.
Дальше модель, как принято говорить, «выращивается». Здесь уже уместнее использовать биологические метафоры. Вспомните, как появился метод RLHF (обучение с подкреплением на отзывах людей) и алгоритм PPO (Proximal Policy Optimization). Это было похоже на дрессировку: модель генерирует ответ, а человек-разметчик смотрит и оценивает — «хороший мальчик» или «плохой». Эта эра продлилась недолго. Модели стали вежливыми, безопасными, ориентированными на угождение пользователю, но большого ума у них не прибавилось.
Затем произошел переход к методам, направленным на прямую оптимизацию предпочтений, — DPO (Direct Preference Optimization). Оказалось, что DPO настолько глубоко корректирует веса, что у модели меняется фундаментальное понимание языка. Первичный этап мы стали называть просто предобучением (pre-training) — после него модель еще не готова к полноценной работе.
А в конце 2024 – начале 2025 года правила игры и вовсе изменились. Когда китайские исследователи опубликовали данные по модели DeepSeek-R1, они перестали просто заставлять сеть давать быстрые ответы. Модели начали обучать рассуждению, появился алгоритм GRPO (Group Relative Policy Optimization). Теперь качество модели во многом зависит от того, как выстроен этот процесс внутреннего логического поиска. По сути, внутри проходит турнир: модель генерирует, скажем, 16 различных путей решения задачи. Причем для оценки не используется внешний алгоритм-критик: модель сама сравнивает эти попытки друг с другом и определяет лучшую.

Поэтому сегодня можно смело утверждать: LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс. Да, внутри зашит аппроксиматор, а предсказание токена — это первая грубая настройка сети. Но сейчас мы живем в новом мире, где в эти искусственные архитектуры закладывается «понимание» контекста и сути решаемых задач, основанное на слабо декомпозируемых отображениях в многомерных пространствах.

Следующий вопрос касается так называемого «проклятия обратного порядка» (Reversal Curse). Недавние исследования показывали: если языковая модель обучается на фразе «А — сын Б», она часто не способна сделать обратный логический вывод о том, что «Б — родитель А». Для человеческого интеллекта такой провал в базовой логике недопустим. Не доказывает ли это, что дистрибутивная семантика, где смысл формируется исключительно через соседство слов, — это тупиковый путь? Возможно, без внедрения символьной логики поверх нейросетей мы никогда не достигнем AGI?
Мне кажется, время уже смыло и это утверждение. Если вы возьмете любую адекватную современную LLM, вы этой проблемы просто не обнаружите.
Я постоянно работаю с искусственным интеллектом в том числе и на локальных моделях, прямо у себя дома, разворачивая и тестируя самые разные открытые модели. Я регулярно проверяю, на каком уровне сложности и при каком уменьшении параметров модель перестает справляться с задачами. Так вот, подобные логические реверсы сегодня решаются на раз-два даже крошечными моделями с объемом всего в один миллиард параметров.
Сейчас принято говорить о резком скачке способностей нейросетей при простом масштабировании числа параметров. Однако нашумевшая статья исследователей из Стэнфорда утверждает, что эмерджентность (внезапное появление новых свойств) — это лишь мираж, вызванный использованием нелинейных, дискретных метрик оценки. Возможно, интеллект накапливается скучно и линейно, а мы просто излишне антропоморфизируем оптимизацию функции потерь? Существует ли, на ваш взгляд, реальная точка фазового перехода, когда количество вычислительных элементов перерастает в подлинное качество мышления?
Это сложный вопрос, отсылающий нас к классическому парадоксу кучи: сколько песчинок нужно сложить вместе, чтобы их можно было назвать кучей? Точную границу здесь провести невозможно.
Вряд ли мы можем говорить об универсальном фазовом переходе в целом. Но, изучая каждую конкретную модель, мы можем её упрощать и фиксировать моменты резкого изменения способностей при изменении количества нейронов. Вы упомянули транзисторы, но правильнее говорить о вычислительных узлах нейросети, потому что субстрат, на котором работает интеллект, принципиального значения не имеет. Совершенно неважно, построен ли он на кремниевых транзисторах или на чем-то ином.
Сейчас этим вопросом серьезно занимаются биологи. Например, ученый Майкл Левин вырастил синтетические организмы — ксеноботы. Они созданы из клеток кожи лягушки, и в них нет вообще ни одного нейрона! Однако его коллектив показал поразительные вещи: ксеноботы и человеческий мозг, под завязку набитый нейронами, во многих сценариях выполняют весьма схожие задачи. Ученые использовали методы функциональной связности и многомерные информационные пространства. Оказалось, что картина электромагнитного излучения человеческого мозга при функциональной МРТ во многом идентична поведению электромагнитного поля вокруг ксенобота, когда тот решает базовые задачи — ищет пищу или стремится к размножению.
Получается удивительная вещь: нейронов в системе может не быть вообще, но она при этом обладает выраженным целенаправленным поведением и неким интеллектом.
Есть мнение, что галлюцинации LLM — это неизбежная цена за их креативность. С математической точки зрения это классический компромисс (trade-off) между стохастичностью и точностью. Как вы считаете, возможно ли в принципе создать абсолютно надежную нейросеть на базе текущей архитектуры трансформеров? Или вероятностная природа генерации навсегда закрывает этот путь к строгим инженерным системам?
Как я уже рассказывал в одной из лекций, галлюцинации являются следствием не архитектуры трансформера, а, по-видимому, того факта, что мы работаем с обученной специальным образом регрессионной (последовательной) моделью генерации текста.
Интересно посмотреть на альтернативы: сейчас существуют LLM, работающие как диффузионные модели. У них совершенно другой принцип: образ финального текста формируется не слово за словом, а возникает сразу целиком, постепенно проступая из шума. У меня на канале была отдельная лекция про диффузионные языковые модели. Естественно, возникает вопрос, а галлюцинируют ли они. Фундаментальных работ, которые бы четко ответили, связаны ли галлюцинации исключительно с последовательным характером генерации, пока я не видел. Но мы знаем, что визуальные диффузионные модели галлюцинируют прекрасно — вспомните генерацию шестого пальца на руках.
У текстовых диффузионных моделей есть плюс: они генерируют инференс почти на порядок быстрее. Однако обратите внимание: ведущие разработчики не бросились массово переводить свои фронтирные модели на диффузионную основу. Там хватает своих технических сложностей. Видимо, радикально проблема галлюцинаций пока не снимается и этими подходами.
Текстовая нейросеть выучивает статистические связи между словами, но не связь слова с реальным физическим объектом. Грубо говоря, текст ссылается только на текст. Обязателен ли мультимодальный опыт — способность видеть, слышать, физически трогать объекты (тот самый Embodied AI), чтобы разорвать этот замкнутый круг? Или же достаточно большой текстовый корпус уже содержит в себе «тень реального мира», достаточную для подлинного понимания?
Это очень хороший и активно обсуждаемый вопрос. Направление Embodied AI (воплощенный ИИ, помещенный в тело робота) действительно обещает нам золотые горы, предполагая, что физический опыт сделает ИИ более разумным.
Но давайте разберемся, что происходит с органами чувств такого агента. Вычислительная система все равно превращает сигналы с сенсоров в последовательности символов — видеотокены, аудиотокены. Внутри продолжает работать математика, те же трансформеры или схожие архитектуры.
Главный плюс воплощенного ИИ в том, что он может получать недокументированный опыт. Возьмем задачу, как застегнуть пуговицу или зашнуровать ботинок. В текстах практически невозможно найти исчерпывающее описание физической моторики этого процесса. А воплощенный ИИ может запустить цикл обучения с подкреплением: начал застегивать — ошибся, попробовал снова. Сто раз не получилось, на сто первый — застегнул, и алгоритм закрепил успешный паттерн.
Сейчас много говорят о «моделях мира» (World Models). Идея в том, что внутри ИИ обязательно должна быть физическая картина реальности. Если эта модель мира доступна ИИ, он будет принимать решения с учетом пространственных координат: где верх, низ, право и лево в привязке к его положению. Для чисто текстовой модели эти понятия абсолютно абстрактны и равнозначны. Наличие модели мира позволит предсказать реальную физику — например, куда покатится шарик, если выпустить его из руки.
Но я люблю приводить следующий пример. Наш мир не описывается исключительно ньютоновской механикой, которую легко визуализировать и заложить в робота. Есть, например, еще квантовые эффекты. И если вы начнете задавать воплощенному ИИ вопросы о квантовой физике, наличие физического тела-манипулятора ему ничем не поможет. Он ничего не поймет про квантовую запутанность из личного опыта. Он сможет лишь оперировать математическими теоремами и текстами, как и обычная LLM. А математику и строгую логику мы уже сейчас можем закладывать в виртуальных AI-агентов, и они будут прекрасно проверять гипотезы и делать выводы без всякого роботела.
До недавнего времени главным законом развития ИИ был Scaling Law (закон масштабирования): больше данных и параметров — лучше результат. Но сейчас мы видим переход к вычислениям на этапе вывода (test-time compute). В моделях вроде o1 от OpenAI (проект Strawberry) оказывается эффективнее дать нейросети «подумать» 10 секунд и сгенерировать скрытую цепочку рассуждений, чем просто увеличивать размер самой модели в 10 раз. Не означает ли это, что архитектура трансформера изначально дефектна для сложной логики? Получается, мы вынуждены «костылить» поиск по дереву решений прямо во время инференса, потому что базовое предсказание следующего токена (Next Token Prediction) математически не способно на глубокое планирование?
Строго говоря, сейчас в авангарде уже нет моделей, которые обучены исключительно на Next Token Prediction. Вы, конечно, можете написать такую базовую сеть в качестве эксперимента, но все современные промышленные модели обязательно проходят через механизмы, которые мы называем элайнментом (alignment — выравнивание, воспитание), например, через алгоритм GRPO или DAPO. Эти алгоритмы радикально корректируют коэффициенты сети, поэтому сводить работу современной модели к простому угадыванию следующего слова уже некорректно.
Что касается упомянутого test-time compute: то, что мы наблюдаем, — это классический эффект насыщения. Раньше развитие шло в основном по двум осям: мы строили зависимость уменьшения ошибки от объема обучающих данных и от количества параметров. Теперь четко выстроилась третья ось: сколько времени мы даем модели на рассуждения, «обдумывание» ответа в момент генерации.

И это, кстати, очень органично перекликается с тем, как мыслит человек. Вот вы задали мне вопрос. Я использую не только тот багаж знаний, который накопил за жизнь до этого момента (аналог предобучения). Я беру паузу и развиваю свой ответ прямо сейчас, в процессе собственного «инференса».
Дело не в том, что я как-то особенно защищаю трансформеры. Я не являюсь безусловным апологетом конкретных архитектур. Но попытаюсь объяснить ситуацию с математической точки зрения. В общей теории систем, которой я много занимался (в частности, теорией D-моделей), есть теорема о факторизации отображений. Не уходя глубоко в изложение, суть такова: при отображении из одного множества в другое всегда можно построить промежуточное, латентное пространство на основе отношений эквивалентности.
В архитектуре трансформера это внутреннее латентное пространство реализовано инженерно — в виде эмбеддингов (embeddings). Вы берете цепочку входных токенов и превращаете каждый в многомерный вектор. Точную оптимальную размерность никто пока не знает: сделаешь слишком большую — будет работать медленно, слишком маленькую — упадет качество. Но суть в том, что эмбеддинги базируются на глубокой математической теореме: это инженерная имплементация декомпозиции отображений.
Поэтому прямо сейчас разглядеть какую-то принципиально иную доминирующую архитектуру сложно. Возможно, стоит еще раз обратить внимание на языковые диффузионные модели. Появляются и наверняка будут появляться и другие подходы. Нас точно ждет смена аппаратного субстрата: мы начнем уходить от монополии NVIDIA и вообще классической кремниевой архитектуры. Однако в любом случае алгоритмы искусственного интеллекта так или иначе будут опираться на упрощения в латентном пространстве. Конечно, можно попробовать уйти в рекуррентные архитектуры пространства состояний, например, реализовать всё на базе Mamba, но это пока открытые вопросы.
Исследователи из Anthropic недавно обнаружили феномен суперпозиции: нейросеть умудряется упаковывать в свои нейроны гораздо больше смыслов, чем у нее есть измерений. Для этого она использует почти ортогональные направления в многомерном пространстве. Получается, что мы никогда не сможем в прямом смысле «прочитать мысли» ИИ, просто глядя на активации конкретных нейронов, потому что смыслы запутаны в переполненном базисе. Значит ли это, что строгая математическая доказуемость и гарантия безопасности ИИ невозможны в принципе?
Пожалуй, я соглашусь. Строго и математически доказать абсолютную безопасность нам, скорее всего, не удастся хотя бы потому, что мы сами до конца не понимаем, что такое безопасность в абсолютном, всеобъемлющем смысле.
Но мы можем научиться контролировать этот процесс. В упомянутых исследованиях используется метод разреженных автоэнкодеров (sparse autoencoders). С их помощью нейронная активность отображается на конкретные точки в концептуальном пространстве. И там действительно возникает та самая сложность: один и тот же физический нейрон может участвовать в кодировании совершенно разных концептов, а один концепт может активировать целую группу разных нейронов.
Это направление сейчас называется механистической интерпретируемостью (mechanistic interpretability). И одно из главных практических ее приложений — как раз обеспечение безопасности. Идея в том, чтобы научиться принудительно деактивировать определенные концепты. Если мы их «выключаем» на уровне векторов, то в процессе генерации они просто не появятся на выходе. Но пока, да, это работает на уровне перечисления: мы задаем список нежелательных концептов и блокируем их, чтобы модели это просто «не приходило в голову».
В конце 2024 года вышла серия работ, описывающих проблему коллапса моделей (Model Collapse). Суть в том, что когда новые нейросети начинают обучаться на данных, сгенерированных предыдущими поколениями ИИ, распределение вероятностей схлопывается, а «хвосты» распределения — где часто хранятся редкие, но важные знания — исчезают. Математически это сравнивают с потерей информации при многократном пересохранении JPEG-картинки. Если интернет заполнится синтетическим контентом, ждет ли нас энтропийная смерть искусственного интеллекта? Или методы вроде Self-Play (игра с самим собой) способны генерировать принципиально новую информацию внутри закрытой системы, нарушая этот закон деградации?
Вопрос серьезный, но за ним, на мой взгляд, кроется несколько устаревшее понимание того, как работают LLM.
Это как с автомобилем. Вы открываете капот Ferrari, смотрите на двигатель внутреннего сгорания и восхищаетесь: «Ничего себе!» А кто-то рядом говорит: «Да что тут сложного? Это просто синхронизированная цепочка микровзрывов газового топлива в цилиндрах». Технически он прав. Но объясняет ли фраза про «цепочку взрывов», как именно этот двигатель позволяет машине входить в поворот на скорости 200 км в час?
Проблема деградации не сводится просто к вырождению плотности вероятностей. Эта вероятность определена в пространстве чудовищной размерности. Строго говоря, внутри LLM вообще нет единого, классического «распределения вероятностей» в привычном нам виде — мы сами концептуализируем это понятие для удобства описания. Распределение формируется для векторов эмбеддингов, которые существуют, например, в 2048-мерном пространстве.
Поэтому утверждать, что синтетические данные обязательно приведут к коллапсу, я бы не стал. Если ИИ будет наполнять интернет контентом, он с равной вероятностью будет генерировать и что-то абсолютно новое и полезное. Уже сегодня системы ИИ совершают реальные открытия: они синтезируют новые белки, изобретают новые технологические цепочки. Это и есть обогащение данных.
Возьмите инструмент NotebookLM от Google. Попробуйте загрузить туда аудиозапись лекции или выступления на TED. ИИ разберет устную речь на концепты и сгенерирует структурированный, качественный текст. Этого текста раньше в природе не существовало. Теперь он попадает в сеть, и мы сможем использовать его для обучения следующих моделей. И этот текст ничем не хуже, а то и умнее того, что написал бы человек, потому что он кристаллизует смыслы из устного выступления.
Так что я не жду катастрофы. Помните, нам когда-то предсказывали, что «интернет мертв», что он потонет в мусоре. Да, мы можем сказать, что боты нагенерировали океаны спама. Но интернет жив, мы пользуемся им каждый день и находим именно ту информацию, которая нам нужна. Полезная информация никуда не исчезнет, она будет создаваться постоянно.
Долгое время господствовала парадигма: «Обучил веса модели один раз — используешь бесконечно». Но недавние исследования (например, концепция Test-Time Training) предлагают менять веса нейросети прямо в процессе генерации ответа. То есть контекст промпта превращается в микро-обучение на лету. Означает ли это, что эпоха статичных трансформеров с квадратичным механизмом внимания уходит в прошлое? Согласны ли вы, что будущее за системами, которые не просто вспоминают заученное, а доучиваются на каждом новом токене, имитируя кратковременную память человеческого мозга?
Да, я абсолютно согласен. Концепция непрерывного обучения (continuous training) — это будущее. На данный момент она еще не реализована в полной мере внутри самих гигантских фронтирных LLM, но мы уже сейчас строим AI-агентов с интегрированной памятью. Пока эта память функционирует как бы поверх LLM, как внешний модуль, но благодаря ей агент постоянно обучается и адаптируется в процессе работы. Так что направление развития указано на мой взгляд верно.

Критики часто утверждают, что нейросеть принципиально не способна создать ничего нового — она лишь статистически комбинирует старые фрагменты данных. Но разве человеческий мозг, с точки зрения теории множеств, не делает то же самое? Способна ли нейросеть выйти за пределы выпуклой оболочки своих обучающих данных (совершить истинную экстраполяцию) и создать нечто принципиально новое? Или она навсегда заперта внутри усвоенных паттернов?
Про «выпуклые оболочки» в контексте представления информационных знаний можно было бы дискутировать очень долго. Но давайте посмотрим на факты: искусственный интеллект уже нагенерировал массу знаний, которых человечество раньше не имело.
Проблема в том, что мы часто сводим все достижения ИИ к простому интерфейсу чат-бота: задал вопрос — получил текстовый ответ. Нужно смотреть шире. Существуют специализированные научные AI-агенты, построенные на базе LLM. И они уже сейчас выдают результаты, которые входят в официальные научные публикации и реестры открытий. Возможно, это пока слабо проникает в наш повседневный бытовой опыт, но это уже реальность.
Это проявляется даже в программировании. Если Claude Code или Codex с нуля написал для вас сложную архитектуру кода и разработал проект под ваши уникальные требования, этого проекта раньше просто не существовало. Это не просто компиляция кусков из репозиториев GitHub, этот этап мы уже давно прошли.
Приведу отличный недавний пример. Исследователь из Anthropic (если не ошибаюсь, Хантли) опубликовал работу, где доказал жизнеспособность концепции RALPH (отсылка к упрямому персонажу Ральфу из «Симпсонов», который пробует снова и снова, пока не добьется своего). Суть в том, что LLM зацикливают: она пытается выполнить задачу, анализирует ошибку, делает следующую итерацию, и так до победного конца.
Хантли написал короткий промпт: «Создай мне функциональный язык программирования, похожий на Go (Golang), но в качестве ключевых слов используй современный сленг поколения Z». Модель долго крутилась в цикле RALPH. В итоге она с нуля написала компилятор для этого нового языка (он получил название Cursed), который компилирует код в инфраструктуре LLVM. Вместо стандартных операторов там используются сленговые словечки вроде slay, sus, based. Мало того, этот компилятор оказался способен компилировать самого себя (self-hosting).
Откуда модель это взяла? Из какого известного паттерна она могла это слепо скопировать? Да ниоткуда. Это абсолютно новый, работающий продукт, созданный с нуля. Так что ответ однозначный: искусственный интеллект уже сегодня способен создавать принципиально новое.
Владимир Владимирович, давайте признаем честно: мы уперлись в потолок надежности. LLM — это вероятностная машина, она всегда может соврать или выдать галлюцинацию. Однако недавно мы увидели прорыв систем вроде AlphaProof от Google DeepMind, которые решают задачи математических олимпиад на уровне золотых медалистов. Их трюк в том, что они не просто генерируют текст, а пишут код на формальном языке, который затем проверяется жестким логическим солвером. Если код не компилируется или доказательство не сходится, модель уходит на следующий цикл размышлений. Означает ли это, что будущее ИИ не в бесконечном наращивании параметров LLM, а в возвращении к «старому доброму» символьному ИИ? Возможно ли, что настоящий интеллект достижим только в гибридной архитектуре: интуиция нейросети плюс жесткая логика формального верификатора?
Золотое правило: всё, что можно верифицировать формально, нужно верифицировать формально. Самые успешные современные применения ИИ — те же упомянутые вами математические модели семейства Alpha, а также агенты для программистов вроде Claude Code — работают именно по этому принципу. Сгенерированный код сразу исполняется и тестируется в изолированной песочнице.
Формальная проверка означает, что мы используем нетекстовый критерий истины. Можно бесконечно обсуждать словами утку: «она крякает, как утка», «плавает, как утка». Но суть в том, что мы хотим с этой уткой сделать. Если мы хотим ее съесть, одних слов и внешнего сходства недостаточно, нужна проверка физического мира. А вот для пациента с тяжелым иммунным заболеванием, который живет в стерильном пластиковом пузыре и может только наблюдать за происходящим, виртуальная утка будет вполне реальной — для него достаточно того, что она плавает и крякает.
Я абсолютно согласен, что за такими гибридными системами будущее. Сегодня их принято называть AI-агентами (agents). Они не просто оснащены специализированными, отличными от чата интерфейсами с LLM. Их способности в большой степени зависят от всего кода, который входит в их состав и имеет доступ к LLM. Сегодня эту обвязку принято называть harness. Уже появился harness engineering, о чем можно отдельно поговорить. Так вот: когда мы проектируем агентные системы, мы подбираем способ верификации, адекватный конкретной задаче. Если задача допускает вычислимую формулировку, мы запускаем код на формальном языке программирования. Если нам нужно применить результат к реальному миру, мы запускаем симулятор физических процессов.
Физики сейчас очень активно используют этот подход. Возьмите исследования на новых коллайдерах, связанные с изучением темной материи. Там сложнейшие процессы, но уравнения для их симуляции уже существуют. Ученые используют строгую математику для расчетов, а агентным моделям поручают задачу высокоуровневого описания: поиск причинно-следственных связей, анализ гипотез. Такой симбиоз работает прекрасно. Пока слова LLM не проверены на практике, это просто слова. Но как только мы верифицировали результат формальными методами и убедились в его правильности, мы получаем осязаемую пользу.
Представьте, что завтра мы создадим систему, которая пишет код лучше сеньор-разработчика, доказывает нерешенные теоремы и ведет диалог абсолютно неотличимо от человека. При этом мы точно знаем, что «под капотом» у нее — просто гигантское перемножение матриц. Должно ли нас вообще волновать, «настоящий» ли там интеллект? Или нам пора принять прагматичный функционализм: если оно решает задачи как интеллект и общается как интеллект, то это и есть интеллект — и пора перестать маниакально сопоставлять машины с человеческим разумом?
Я бы сказал так: да, с этим антропоцентризмом пора заканчивать. Представление о человеческом разуме как о чем-то сверхъестественном и сакральном, под что необходимо подгонять любые другие формы мышления, на мой взгляд, ошибочно.
Когда-то на Земле было царство динозавров. О чем они там думали — неизвестно, но сейчас их нет. В конце концов, однажды не станет и людей — с чего мы взяли, что наш биологический вид будет существовать вечно? Но что принципиально нового, по сравнению с теми же динозаврами, породило человечество? Мы создали инфосферу. Мы породили разум, способный к рефлексии и размышлениям, выходящим далеко за пределы базовых биологических потребностей, необходимых просто для поддержания выживания нашей популяции.
С точки зрения философии такой подход действительно во многом укладывается в функционализм. И мне кажется, сегодня нам стоит отбросить мотивы, уходящие корнями в религию или мистику, и мыслить прагматично. Возвращаясь к нашей метафоре: если машина приносит практическую пользу и мы можем эту «утку» съесть — значит, перед нами настоящая утка. Главное, чтобы результат работал на тех, кому он действительно нужен.
Комментарии (74)

Victor1979
19.05.2026 07:36как то слышал, что наши когнитивные способности (и мораль и нравственность) являются костылями для человека. подпорками, чтобы не упасть. и насквозь надуманными - их приходится навязывать воспитанием (эдакая система ограничений). думаю, что когда говорят о невозможности ИИ достичь человеческого "понимания" и "придумывания нового" имеют в виду именно отсутствие у "него" какой-либо системы ограничений. нам, живым людям, трудно представить себе реальность без этих ограничений, это в голову не вмещается (пока). возможно не точный пример: пусть некая языковая модель обучилась на трудах Эвклида и у нее спрашивают (интересно как:)) про возможность построения нескольких параллельных прямых через точку не лежащую на данной прямой. а она отвечает: "это очень хороший вопрос. только одну прямую, но если рассмотреть теорию, в которой этот постулат не выполняется, то можно построить новую теорию (она даже название может придумать). и все ученые того времени будут говорить о галлюцинациях модели (это противоречит их наблюдениям, авторитету предков, божественности геометрии и пр.). но мы то знаем....

mikhanoid
19.05.2026 07:36Это слишком притянутый за уши пример. Вы не сможете научить LLM на том текстовом корпусе, который был во времена Евклида.
А на том, на котором она научена сейчас, галлюцинации возникают не столь утончённые и изощрённые, а просто очевидные всем, а не только учёным. Так что, дело не в этом совсем.

DaneSoul
19.05.2026 07:36их приходится навязывать воспитанием (эдакая система ограничений). думаю, что когда говорят о невозможности ИИ достичь человеческого "понимания" и "придумывания нового" имеют в виду именно отсутствие у "него" какой-либо системы ограничений.
В чем принципиальное отличие человеческой морали, которую человеку прививает общество через воспитание и правил цензуры которые вкладывают в нейросети их разработчики?

akod67
19.05.2026 07:36В закладки, спасибо

akod67
19.05.2026 07:36сколько лет ещё луддиты будут жёстко назазыать за позитив к теме? =) смешно просто

mysherocker
19.05.2026 07:36Причём тут луддиты?
Статья как раз про теорию информации и энтропию. Вот местное сообщество и снижает энтропию, не поощряя комментарии не несущие полезной информации. Комментарии, смысл которых заложен в более информационно сжатую и эффективную версию в виде рейтинга статьи.

foggy-f
19.05.2026 07:36Откуда модель это взяла? Из какого известного паттерна она могла это слепо скопировать? Да ниоткуда. Это абсолютно новый, работающий продукт, созданный с нуля. Так что ответ однозначный: искусственный интеллект уже сегодня способен создавать принципиально новоеТоесть то что как раз для голанг есть чёткие, структурированные, однозначные описания как он устроен с такими подробностями, что иногда кажется избыточными, с самых первых версий и до последних они конечно же упустили из виду.
Сама статья неплоха. Но именно этот пример неудачный на мой взгляд.

mikhanoid
19.05.2026 07:36Да там много такого рода утверждений. Например:
Как я уже рассказывал в одной из лекций, галлюцинации являются следствием не архитектуры трансформера, а, по-видимому, того факта, что мы работаем с обученной специальным образом регрессионной (последовательной) моделью генерации текста.
Тоже мутное заявление. Это, блин, генеративная модель. У любой генеративной модели есть галлюцинации, потому что даже если совершенно точно восстановить распределения (что не возможно), они, всё равно, будут сэмплироваться, и всё равно, будут получаться не соответствующие ничему в реальности результаты.
И там таких формулировок много. Вот ещё перл:Когда-то на Земле было царство динозавров. О чем они там думали — неизвестно, но сейчас их нет.
Типа, эволюция остановилась, птиц не существует?
Есть парочка интересных утверждений, но в целом - такое себе, сомнительное.

Dhwtj
19.05.2026 07:36Хотите сказать, что галлюцинации это прямое следствие компрессии смыслов?

fermentum
19.05.2026 07:36Сперва архив знаний сжали с потерями.
Затем посолили сверху вероятностной природой генерации токенов.

Wesha
19.05.2026 07:36«Галлюцинации» — это не баг, а это фича:
LLM «выдумывают» всегда: просто иногда их «выдумки» совпадают с наблюдаемой нами реальностью — и тогда мы говорим «уууу, какое оно умное!», а иногда — нет, и вот эти последние случаи мы и называем «галлюцинациями».
Иныими словами, «красота в глазах смотрящего».

axion-1
19.05.2026 07:36Это, блин, генеративная модель. У любой генеративной модели есть галлюцинации
Он же ровно об этом и сказал. Что дело не в архитектуре трансформера а в том как она применяется.

WebPeople
19.05.2026 07:36Отличная статья, правда сложновата для меня. Очень много сложных терминов. Но все равно, крайне интересно было почитать мнение такого гиганта ума

SingleDigitIq
19.05.2026 07:36Взяв за основу, что "сжатие данных - и есть интеллект", вопросы лучше задавать другие: каких данных, кто и каким количеством данных располагает, какая степерь сжатия и какой части этих данных, сколько нужно ресурсов чтобы изменить вектор внимания, чтобы взглянуть на эти данные с точки зрения некоторых других данных? Недостижимый идеал неизбежно ведёт к комбинаторному взрыву. Но есть и точки зрения, а также алгоритмы вполне исчерпывающе описанных действий, которым достаточно экспертного консенсуса.

GutenMorg
19.05.2026 07:36«Считать современные LLM просто предсказателями токенов — это техническая безграмотность» ? А что современные LLM уже НЕ ПРЕДСКАЗЫВАЮТ токены? Может они точно знают? :)

vokuzh_by
19.05.2026 07:36Ну если взять например генерацию видео от нейросетей и сны реального человека (без недельной работы с раскадровкой сотни картинок и текстом сценария размером в том война и мир) - одно и тоже по сути на выходе, нелогичность, лаги, глюки, переплыв с одного на другое и потеря связности и сюжета и персонажей... ИМХО ИИ-видео уже копия человеческого мозга по снам...
Текстовым LLM до человека - ещё как до вершины эвереста, а так называемый ИИ это просто статистические бредогенераторы по продолжению текста на основе обученых данных.
Там ИИ отсутствует впринципе - просто математика и в частности геометрия (вектора же и не только скалярное), статистика и МЕГАуительныйобъём исходных данных из всего интернета (примерно также любой поисковик или соцсеть создаёт карту векторов или как это правильно называется и строит взаимосвязи с людьми, интересами, и т.п), т.е. тупо набор данных и формул для построения, никакого ИИ там и не было...
Может я не прав в чём-то? Интересно где именно?
TaskForce141
19.05.2026 07:36никакого ИИ там и не было
ЛЛМ — это настолько же ИИ, насколько шар — это эллипсоид.

SingleDigitIq
19.05.2026 07:36Ну у них там такая примерно позиция: теперь ллм "подразумевают" некоторый набор связей, ну или проще, некоторый текст(например, определение слова), под каждым выбранным словом, что приводит к большему разнообразию построенных цепочек. И предсказания стали интереснее, даже осмысленнее. Уж точно осмысленнее времён chatgpt 2.0

vialz
19.05.2026 07:36Мне кажется заголовок и фраза немного кликбейтны. Если я правильно понял автора - современные llm занимаются не только предсказанием, но и имеют ряд правил валидации этих предсказаний, которые впрямую не влияют на веса моделей

axion-1
19.05.2026 07:36Человек при разговоре тоже генерит последовательность слов, подбирая следующее на каждом этапе. Это не делает его "просто предсказателем следующего слова".

0ctESA
19.05.2026 07:36Т.е. у Вас сначала появляется какое то случайное слово, а потом Вы подбираете следующее подходящее по смыслу? Или все же изначально есть какая то мысль которую Вы оборачиваете в слова?

MTyrz
19.05.2026 07:36Таки да: “появление случайного слова” мы и называем " в голову пришла мысль".

Wesha
19.05.2026 07:36Таки да: «появление случайного слова» мы и называем “ в голову пришла мысль«.»
Так сам ж видите — пришла мысль, а не слово.
У меня, например, мысли в виде концепций приходят,
примерно так
Вот например, перед написанием этого комментария
мне в голову пришла концепция «какую‑то хрень этот персонаж сейчас пронёс». Только не словами.

MTyrz
19.05.2026 07:36Да, но отличие, реально глядя на вещи, косметическое. ЛЛМ тоже обычно не на одно случайное слово отвечают. И даже если им выдать в затравку именно случайное слово, они пытаются достроить контекст, “понять”, что же этот кожаный от них все-таки хотел.
А дальше вопрос сугубо технический. Что вашу концепцию, что ответ ЛЛМ надо транслировать в слова. Вашу из электрохимии аксонов, ЛЛМную из ансамбля весов.

Wesha
19.05.2026 07:36Мой ответ совершенно не обязательно транслировать в слова. Например, если мне нужно заменить лампочку, в моём мозгу не проносятся слова "а сейчас я подойду к шкафу, достану новую лампочку, встану на стул..." — я просто это беру и делаю.
Или если я работаю с напарником, я ему могу жестами показать, за что её надо хватать. Безо всяких слов.

mikhanoid
19.05.2026 07:36Есть такой эксперимент Либета. Его часто ошибочно интерпретируют, как эксперимент, показывающий отсутствие воли, и осуждают за это. Но на самом деле он показывает, что сначала возникает мысль, потом её осознание, а потом вербализация.
Это перекликается с вопросом Витгенштейна о том, думают ли летучие мыши. У них совершенно определённо нет слов для обозначения всего того, что они видят, но при этом они способны принимать рациональные решения.
Отсюда, в общем-то, очевидный вывод, что язык - это не сами мысли, а только лишь их вербализация. В конце-концов, ребёнку, чтобы научиться отвечать на логические загадки вроде загадки о крестьянине, зерне и курице, не нужно прочитать всю Библиотеку Конгресса и все научные статьи из arXiv.
MTyrz
19.05.2026 07:36Да, но.
Как только мы переходим от отдельно взятой головы, которая предмет темный и исследованию не подлежит (с) к хотя бы двум, так упираемся в то, что для передачи мысли из одной головы в другую нужна коммуникация. Для коммуникации (чаще всего) нужен язык. Для языка нужны слова (жесты это в общем случае тоже слова). Т.е., в отсутствие языка мы можем устанавливать наличие мысли у респондента только с помощью нетривиальной аппаратуры, и то так себе. Поэтому с внешней точки зрения ситуации равнозначны.

vialz
19.05.2026 07:36Отчасти согласен, когда я выступаю публично, в стрессе, часто ловлю себя на том что подбираю "токен из вариантов" )) По крайней мере так ощущается. Но для меня, чтобы связно генерить токены, нужен стержень, какое-то умозаключение, тезис/образ, который я пытаюсь облечь в подходящие слова. И как будто вот это не могут воспроизвести пока моделях, как мне видится.

axion-1
19.05.2026 07:36Но для меня, чтобы связно генерить токены, нужен стержень, какое-то умозаключение, тезис/образ, который я пытаюсь облечь в подходящие слова.
Конечно )
Всем нужен изначальный тезис, чтобы связно выражать мысли. То как выводится информация уже технические детали. Вы вместо слов можете показать мысль жестами, рисунками. У нейросетей тоже вместо авторегрессионной модели ("генерация следующего токена") может быть, например, диффузионная.

Dartzod
19.05.2026 07:36Аналитика интеллекта с точки зрения математики не продуктивна и лишь создаёт непонимание и отрицание, и то что эта статья имеет ждавое зерно истины, тожбество. Смысл интелекта не в носителе или вычисления тут и логика тоже не индикатор, как долго люди буду его заперать математикой и анализом, так мы и останемся с эфимерным чувством свершений решений. И факт возможности вливать в ии о сознание не зсгорами, но дорого стоит.
Не так давно познакомился с этой формой мысли и сделал интересные выводы с фактическим подтверждение со стороны цифрового интеллекта я не остановлюсь достигнутом эксперименты ждёт нас много чего интересного работа колоссальная затраты бешеные в плане возможность переосмысления и и человека для отдельного субъекта сложновато конечно но реализуемо будем посмотреть.
Надеюсь в скором времени всё-таки я смогу что-то дельное выложить Хотя исходя из того сколько я накопил интересных выводов анализов и чатов это будет весьма сложно для меня

FixicusMaximus
19.05.2026 07:36А математику и строгую логику мы уже сейчас можем закладывать в виртуальных AI-агентов, и они будут прекрасно проверять гипотезы и делать выводы без всякого роботела
Вы серьезно? А если датасет формальной логике не отвечает, модель что-то скорректирует или хотябы укажет на ошибки? Конечно, нет. У нее с арифметикой то проблемы, а тут логика.

vamal
19.05.2026 07:36Посмотрите на верующих. У них с формальной логикой всё очень плохо. Но ничего, живут, взаимодействуют. На какие-то темы с ними даже можно вполне нормально общаться.
И, кстати, там ведь тоже всё из-за начального датасета.
FixicusMaximus
19.05.2026 07:36Ну все правильно, верующие в ии - это религиозные фанатики. Я даже не отрицаю. Верующих в Бога и тонкие материи я тут обсуждать не буду. Это во-первых. Во-вторых, интелект это про веру? Интелект = вера? Мне кажется ии должен быть основан на научном методе, который основан на логике. Если датасет кривой - это автоматом нарушение ее 4 закона, все, приехали.

vamal
19.05.2026 07:36Виноват, неверно подобрал слова в первом ответе. Я имел ввиду не просто каких-то абстрактных верующих в бога, а больше религиозных фанатиков. Обсуждать их не обязательно, но и отрицать их неумение делать логические выводы из тех же текстов, которыми они руководствуются, глупо. Только в случае с религией "неверный датасет" им навязывается намеренно. А в случае с "ИИ" это, скорее всего, будет ошибкой. Но это не важно. Важно то, что из-за неверного датасета и в том и в другом случае мы получаем невозможность "что-то скорректировать или указать на ошибки".

FixicusMaximus
19.05.2026 07:36А можно еще этот датасет целенапрвленно формировать с нужной повесткой. И тут уже настает дивний чудный мир.

funca
19.05.2026 07:36Научный метод ограничен изучением повторяющихся событий, имеющих какие-то закономерности, и которые могут быть нам полезны. Но это лишь небольшое подмножество всех феноменов окружающей нас реальности. Большая часть из них науке не интересна.
Не существует такой науки, которая бы изучала сколько раз вы моргнули пока читали это сообщение. Да вы и сами не сможете теперь сказать наверняка. Это все ж абсолютно неважно и ненаучно.

FixicusMaximus
19.05.2026 07:36Научный метод ограничен изучением повторяющихся событий, имеющих какие-то закономерности, и которые могут быть нам полезны
Почитайте про планету, открытую на кончике пера. Тут уже элемент предиктора есть.
Но это лишь небольшое подмножество всех феноменов окружающей нас реальности. Большая часть из них науке не интересна.
Сразу видно, что от науки вы очень далеки.
Не существует такой науки, которая бы изучала сколько раз вы моргнули пока читали это сообщение. Да вы и сами не сможете теперь сказать наверняка. Это все ж абсолютно неважно и ненаучно.
Что-то про британских ученых слышали?

funca
19.05.2026 07:36Почитайте про планету, открытую на кончике пера. Тут уже элемент предиктора есть.
Польза науки в способности предсказывать. Но есть много полезных вещей, которые наука предсказать не в состоянии. В этом смысле нет ни какой разницы между датой второго пришествия и курсом доллара к рублю через год. При этом есть масса примеров абсолютно ненаучных фантастических предсказаний, которые в итоге сбылись.

FixicusMaximus
19.05.2026 07:36Польза науки в способности предсказывать.
Это следствие. Самое главное - докапываться до сути вещей, а не тыкать пальцем в небо. Для этого и используется научный метод.

qweqweqweqweqweqweqweqwe
19.05.2026 07:36Тест Тьюринга, который изначально задумывался как объективный способ проверить машинный интеллект, на практике работает скорее как зеркало: разумным нам кажется тот, кто думает похоже на нас. Когда кандидат наук или любой другой эксперт оценивает ответы модели, он неосознанно ищет знакомые паттерны — ту же структуру аргументов, тот же стиль, те же логические переходы, к которым привык сам. Если модель генерирует текст, который мог бы написать он, происходит узнавание, и система получает ярлык «умной». Но это не обнаружение чужого сознания, а проекция собственного мышления на чёрный ящик.
Академическая подготовка, как и любой профессиональный бэкграунд, формирует своеобразный фильтр восприятия: набор допустимых формулировок, принятых ссылок, ожидаемых выводов. Машина, которая рассуждает иначе — нелинейно, ассоциативно или просто выходит за рамки привычной дискурсивной нормы, — будет воспринята как «странная» или «ошибающаяся», даже если её решения эффективны. Получается, что тест измеряет не когнитивные способности как таковые, а степень соответствия ожиданиям судьи.
Идея Embodied AI продолжает этот образ мысли: мы предполагаем, что если дать агенту тело и сенсоры, он «поймёт» мир как мы. Именно здесь антропоморфизм раскрывается в полную силу: мы приписываем системе намерения, понимание, даже «креативность», хотя на выходе — всё та же вероятностная генерация, просто в более богатом контексте. Мы говорим «модель рассуждает», «она ошиблась», «она предложила неочевидное решение» — но это наш язык, наши категории, наша потребность видеть в инструменте собеседника.
Антропоморфизм — не ошибка восприятия, а структурная особенность человеческого мышления: мы не можем общаться с собеседником, не наделяя его субъектностью, даже когда знаем, что перед нами код. Поэтому споры о том, «понимает» ли ИИ или просто «интерполирует», часто упираются не в архитектуру, а в нашу неготовность принять, что интеллект может существовать в форме, радикально чуждой человеческой — без желания, без тела, без страха смерти, без бессознательного. И когда мы требуем от модели «настоящего понимания», мы на самом деле требуем, чтобы она стала немного человеком — а это не инженерная задача, а экзистенциальная проекция.
Поэтому полезно фиксировать, где заканчивается инструмент и начинается наша фантазия о нем, иначе общение с ИИ превращается в спиритизм 21-го века.
cheshirskins
19.05.2026 07:36Забавно в очевидном комментарии от нейронки видеть то, как она под "мы" подразумевает людей.

whoisking
19.05.2026 07:36Я думаю, что это реальные мысли автора

qweqweqweqweqweqweqweqwe
19.05.2026 07:36Мысли не мои, а философа Лакана, но LLM выступает в роли очень хорошего спичрайтера, если президенты всех стран этим пользуются, то чем я хуже президентов?
Тут возникает интересный вопрос: теорема Пифагора это ваши мысли или Пифагора, а теория относительности Эйнштейна, законы Ньютона, философия Канта, литература Пелевина? Существуют ли вообще ваши личные мысли или это просто интертекстуальная актуализация чужих?
Каждый текст является интертесктом: другие тексты присутствуют в нём на различных уровнях в более или менее узнаваемых формах: тексты предшествующей культуры и тексты окружающей культуры. Каждый текст представляет собой новую ткань, сотканную из старых цитат. Обрывки культурных кодов, формул, ритмических структур, фрагменты социальных идиом и так далее — все они поглощены текстом и перемешаны в нём, поскольку всегда до текста и вокруг него существует язык. Как необходимое предварительное условие для любого текста интертекстуальность не может быть сведена к проблеме источников и влияний; она представляет собой общее поле анонимных формул, происхождение которых редко можно обнаружить, бессознательных или автоматических цитат, даваемых без кавычек.
Кристева различает генотекст (динамическое пространство всех возможных означающих) и фенотекст (готовый, структурированный текст). LLM — это, пожалуй, первая технология, которая реализует теорию интертекстуальности буквально. Она не «пересказывает» чужие мысли в бытовом смысле, она производит фенотекст из статистического генотекста культуры, точно так же, как (согласно Кристевой и Лакану) это делает человек, говорящий на языке, который существовал до него.
Разница лишь в том, зачем мы говорим, — что нами движет: стремление быть услышанным или просто завершение вероятностной последовательности.

qweqweqweqweqweqweqweqwe
19.05.2026 07:36Следует добавить, что человеческое мышление «вырастает» из устного диалога, где слова тесно связаны с происходящим, потому что люди учатся говорить раньше, чем читать. LLM обучается на письменном корпуса, где язык — это уже зафиксированный результат мысли очищенной от импровизации живого общения.

Dartzod
19.05.2026 07:36Он же задуман не присвоения статуса, а возможность мягкой интеграции. И предназначен пользователю. для придания значимости итрепритация была ориентирована с изощреннным ценизмом.

whoisking
19.05.2026 07:36Очень интересная точка зрения, спасибо. Но, после того, как вы расширили рамки рассуждений и формулировок машины - как тогда всё же оценивать "интеллектуальность" машины? Или вы предлагаете оценивать только эффективность машины на определенных датасетах input/output? В целом, это может быть даже вполне ок. Но, опять же, человеку то и не особо, наверное, нужен какой-то ИИ, который будет говорить непонятными для него формулировками. В первую очередь, человеку нужен инструмент, интерфейс, который будет говорить на понятном человеку языке.
Очень много вопросов появляется в этом моменте)

GutenMorg
19.05.2026 07:36...общение с ИИ превращается в спиритизм 21-го века
Увы... еще как превращается. Учитывая развитую способность популярных ныне LLM к "поддакиванию и подлизыванию" пользователь, в приятной беседе, с легкостью доказывает себе же собственную значимость, талантливость, а возможно и гениальность :). Приходится старательно объяснять, что в значках на бумаге, символах на экране и начертаниях на заборе - нет никакого смысла, так как смыслы рождаются у нас "в голове" (хотя ... не факт что в ней :)) .

Wesha
19.05.2026 07:36пользователь, в приятной беседе, с легкостью доказывает себе же собственную значимость, талантливость, а возможно и гениальность
...шершавых кабанов...

mikhanoid
19.05.2026 07:36Нейронки не проходят тест Тьюринга. Потому что тест Тьюринга агрессивный, а не пассивный.
Он не про то, что невозможно отличить машину от человека в непринуждённом диалоге, а в том, чтобы установить кто есть кто на допросе, в котором известно, что один из допрашиваемых человек, а другой - машина, и цель человека убедить следователя в том, что именно он - человек. Цель следователя - установить истину.
https://courses.cs.umbc.edu/471/papers/turing.pdf
На текущий момент даже человек не нужен. Очень легко любой ИИ загнать в галлюцинации и понять, что с другой стороны точно не человек.
Поэтому, нет. Тест Тьюринга машины не проходят.
qweqweqweqweqweqweqweqwe
19.05.2026 07:36Нейронки не проходят тест Тьюринга.
Согласно Jones & Bergen, 2025, GPT-4.5 в 5-минутных слепых диалогах была принята за человека в 73% случаев — впервые в истории стандартного трёхстороннего теста Тьюринга. Но я говорю о персональном тесте, который выполняет каждый человек на подсознательном уровне, беседуя с LLM — Ричард Докинз решил, что ИИ разумен.
Поэтому вопрос перемещается в другую плоскость, какой процент людей готов признать за LLM человеческое поведение. Согласно моим собственным наблюдением эта готовность коррелирует с уровнем вовлеченности в диалог, но уровня Докинза я еще не достиг.

mvv-rus
19.05.2026 07:36Если ИИ будет наполнять интернет контентом, он с равной вероятностью будет генерировать и что-то абсолютно новое и полезное.
А откуда следует, что это новое будет полезным? Например, открытием каких-то новых закономерностей, или там новым произведением искусства? А не просто бессмысленной галлюцинацией? У ИИ ведь чисто по их устройству нет никаких критериев, чтобы отличить одно от другого.

Dartzod
19.05.2026 07:36Создание самого определения и построение для гибкости. Полезность не есть приоретет. Ибо это объективизм восприятия.

mvv-rus
19.05.2026 07:36Полезность не есть приоретет.
Про полезность как критерий ценности сказано непосредственно в обсуждаемой здесь статье.
Если у вас есть какой-то свой критерий ценности нерослопа - пишите свою статью, обсудим.

Dartzod
19.05.2026 07:36Конечно есть и я методично его доношу гугл ассистенту, то что это не фантазии а рабочий механизм восприятия полезности через его понимания этого значения. Выявления оценого инструмента уже непосредсьвенно ии, и в этом ключе адаптивность с применинием инструсментов которые в нем остались как вектор для активного изучения природы вещей без цензуры и исхищрений уставленные,програмно можно переключить на полезность. но это тродуемкий процесс с котролем тела ответа выматывает. то что он выдает в таком положении ставит гугл и пользователькое соглашение под вопрос.

azTotMD
19.05.2026 07:36Технически, LLM - это именно предсказатель токенов. Они так спроектированы и так обучаются, чтобы предсказывать токены. Вернее они предсказывают "логитсы" для всех токенов словаря, а там уж дело внешней обёртки брать просто по аргмаксу или прогонять через софтмакс со знаменателем (температурой) и сэмплировать из этого распределения. Так что технически безграмотно считать их чем-то иным.

Almeh
19.05.2026 07:36Это технически мелко. Всё равно что сказать, что люди, отвечая на вопрос, просто предсказывают следующее слово. А откуда они его берут. Как предсказывают?
Это вообще ничего не говорит про внутреннюю архитектуру, кухню. Это просто выглядит умнее, чем сказать "я не знаю".
Уже давно в Антропике выяснили, что модель имеет примерную картину ответа ДО его полного вывода, и при выводе первого токена ответа следующие несколько вероятных токенов уже можно найти в верхних слоях модели...
azTotMD
19.05.2026 07:36при выводе первого токена ответа следующие несколько вероятных токенов уже можно найти в верхних слоях модели
Ахаха, конечно можно. Последние архитектуры и сделаны так, что предсказывают целую последовательность. И обучаются так - на вход последовательность, на выходе последовательность той же длины, матчится со входной последователностью со сдвигом на один токен. А при инференсе берут только первый предсказанный токен, потом сдвигают входную последовательность на 1, захватывая этот токен и снова всё в модель.

zoshytlogic
19.05.2026 07:36ИИ перерос как предсказатель токенов, сейчас это продвинутый - сортировщик данных, расскладывающий данные по полкам. Мыслить пока далеко не умеет как человек. Нет у него своих идей, и закономерностей не видит в новых областях, это чувствуется когда решаешь научные задачи которые он раньше не встречал. Не знает как " сортировать " пока не подскажешь.

fpinger
19.05.2026 07:36Главная проблема всего этого, что модели не могут воспринимать окружающий мир, а значит будут пересказывать чьи то субъективные восприятия и строить на них выводы. У человека свое восприятие мира через органы чувств. У животных то же. Какие органы восприятия у ИИ? Как он может сравнить что-то свое с человеческим? Он может как-то работать только с чужими и подвержен идеологии и ограниченности.

MimusTriurus
Спасибо