Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность» / forpes.ru

Главная
Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность»

Владимир Крылов: «Считать современные LLM просто предсказателями токенов — это техническая безграмотность»

19.05.2026 07:01

Artezio_team 94 17000 Источник

В IT-сообществе не утихают обсуждения, есть ли в современных больших языковых моделях хоть капля настоящего интеллекта или перед нами просто раздутая до триллионов параметров таблица поиска, занимающаяся интерполяцией. Пока критики продолжают рассуждать о «стохастических попугаях», колмогоровской сложности и неизбежном коллапсе синтетических данных, разработчики фронтирных моделей (вроде Claude Opus4.6 или DeepSeek-V3.2) молча меняют правила игры, внедряя GRPO, DAPO и вычисления на этапе вывода.

На тг-канале AI4Dev мы поговорили с доктором технических наук и научным консультантом Artezio Владимиром Крыловым о том, что на самом деле происходит под капотом современных AI-систем и почему привычные метрики оценки интеллекта больше не работают.

Илья Суцкевер и последователи Маркуса Хаттера утверждают, что сжатие данных — это и есть интеллект. Идея такова: если модель идеально предсказывает следующий токен, минимизируя энтропию, она неизбежно восстанавливает причинно-следственные связи, породившие эти данные. Вы как математик согласны с тем, что колмогоровская сложность — это наш единственный объективный критерий интеллекта? Или же статистическая корреляция никогда не заменит каузальность и подлинное понимание причин?

Что вообще такое колмогоровская сложность? Как ее определить на практике, если это невычислимая функция? И функция какого аргумента? В классическом понимании она является функцией длины последовательности. Как тогда можно использовать этот критерий для определения «размера» или мощности искусственного интеллекта? С точки зрения математики мы должны сначала дать область определения: с последовательностями всё ясно, а какая «длина» у искусственного интеллекта? Что именно там сжимать?

По сути, колмогоровская сложность — это длина минимальной программы, способной воспроизвести объект. Значит, нам нужно определить длину минимальной программы, которая воспроизведет искусственный интеллект. Но что вообще значит «воспроизвести интеллект»? Если опираться на классический тест Тьюринга, когда мы дискутируем с невидимым собеседником через стену и не можем отличить машину от человека, то этот критерий во многом уже выполнен.

Проблема глубже. В экспериментах с интеллектом даже классическое понятие вероятности применять некорректно, потому что интеллект — это свойство конкретного человека или человечества в целом. С точки зрения теории вероятностей, человечество — это ансамбль людей. У каждого свой уникальный интеллект. Что здесь усреднять? Усреднять по времени развития одного человека? У младенца интеллекта в привычном понимании нет, с ним невозможно обмениваться мыслями через стену, он только кричит, когда хочет есть. А у человека в расцвете творческой и научной карьеры интеллект совершенно другой. И среднее по времени здесь не совпадет со средним по ансамблю — человеческий интеллект представляет собой абсолютно неэргодическую систему.

Поэтому на вопрос, является ли сжатие интеллектом, нельзя ответить, опираясь на существующие математические определения. Когда говорят о сложности Колмогорова, обычно имеют в виду оценки сверху: мы предполагаем, что длина программы не превысит определенного значения. Но на практике в качестве такой верхней оценки часто приходится брать длину самого исходного объекта. Например, есть последовательность из 200 символов, и мы пытаемся понять, как ее сжать и описать программой. Но как мы будем проводить подобную оценку для интеллекта? Анализируя генерируемые им последовательности? Не очень понятно, как именно их сжимать.

Мой ответ таков: я не согласен, что колмогоровская сложность является подходящим инструментом для измерения интеллекта. Она применима к символьным последовательностям, а не к абстрактным концепциям. Мы же не пытаемся вычислить «колмогоровскую сложность кирпича» или «колмогоровскую сложность человека». Так что здесь я с таким подходом не соглашусь.

Но человеческий интеллект мы ведь как-то измеряем. Как нам сопоставить систему оценки человеческого разума с системой оценки искусственного интеллекта, чтобы понять, сравнялись ли машины с нами. Насколько правильно применять к ИИ стандартные человеческие тесты, например, тесты на IQ? Напрямую их сравнивать — это вообще корректный подход?

Тест на IQ изобретен человечеством и достаточно успешно применяется психологами для исследования когнитивных способностей людей. Однако сам по себе он настроен на некое общее, усредненное понятие интеллекта. Порой не совсем ясно, о чем именно говорит этот показатель на практике. Существуют люди с высочайшим IQ, которые при этом совершенно оторваны от реальности, они витают в облаках и могут забыть, как пройти к ближайшему универмагу или библиотеке.

Тем не менее, когда стали искать метрики для ИИ, тесты на IQ пробовали применять постоянно. Для ранних моделей, таких как GPT-1, GPT-2 и их аналогов, это был практически единственный инструмент оценки. И уже тогда результаты поражали воображение: модели великолепно генерировали продолжение текста. Даже программный интерфейс (API), который тогда представили в OpenAI, так и назывался — Completions. То есть алгоритм просто статистически завершал начатую фразу. Именно из этого подхода и выросла концепция «стохастического попугая» и вся связанная с ней критика.

Давайте теперь вернемся к вопросу о том, не имеем ли мы в настоящее время дело с имитацией искусственного интеллекта, а вовсе не с самим ИИ. Но вот смотрите: когда мы говорим о жемчуге, вы сильно различаете понятия «имитация жемчуга» и «искусственный жемчуг»? При переводе на английский язык получится один и тот же термин — artificial pearl. Имитация по своей природе и есть нечто искусственное по отношению к исходному объекту.

Поэтому попытки жестко противопоставить «настоящий» искусственный интеллект и «имитацию» интеллекта кажутся мне странными. Здесь кроется терминологическая, когнитивная проблема. Что именно имеют в виду люди, задавая этот вопрос? Вероятно, они исходят из каких-то внутренних предпосылок.

Известно, что нейросеть математически представляет собой универсальный аппроксиматор функций. Однако критики, например философ Джон Сёрл, указывают на то, что это может быть просто гигантская таблица поиска. Где проходит строгая математическая граница между банальным запоминанием и способностью к настоящему обобщению? Если большие языковые модели успешно проходят тесты исключительно на данных из своего исходного распределения (in-distribution), имеем ли мы право называть это интеллектом? Или перед нами лишь сложная интерполяция по многообразию?

Хороший вопрос. Только интерполяция по какому именно многообразию? Что образует это многообразие в математическом смысле? Давайте попробуем разобраться, при чем здесь аппроксиматор и распределение, из которого берется выборка.

Да, внутренний механизм работы современных LLM действительно опирается на выборку из вероятностного распределения. Из-за этого многие утверждают, что в основе всего лежит банальное предсказание следующего токена (Next Token Prediction). Но представьте, что вы смотрите на фрески Сикстинской капеллы и заявляете: то, что мы видим, — это просто специфическое математическое распределение красок на поверхности стены. Технически это, конечно, верно, но ведь суть фресок не сводится к краске на штукатурке. Так же и языковая модель не является просто генератором случайных выборок, работающим алгоритмом Next Token Prediction.

По этому поводу отлично высказался Илья Суцкевер. Он отметил, что если вы до сих пор повторяете мантру о том, что модель всего лишь предсказывает следующий токен, то вы не просто скептик, вы технически неграмотны. Сегодня нельзя считать, что ИИ просто обучен угадывать слова. Это лишь грубое начальное приближение.

Дальше модель, как принято говорить, «выращивается». Здесь уже уместнее использовать биологические метафоры. Вспомните, как появился метод RLHF (обучение с подкреплением на отзывах людей) и алгоритм PPO (Proximal Policy Optimization). Это было похоже на дрессировку: модель генерирует ответ, а человек-разметчик смотрит и оценивает — «хороший мальчик» или «плохой». Эта эра продлилась недолго. Модели стали вежливыми, безопасными, ориентированными на угождение пользователю, но большого ума у них не прибавилось.

Затем произошел переход к методам, направленным на прямую оптимизацию предпочтений, — DPO (Direct Preference Optimization). Оказалось, что DPO настолько глубоко корректирует веса, что у модели меняется фундаментальное понимание языка. Первичный этап мы стали называть просто предобучением (pre-training) — после него модель еще не готова к полноценной работе.

А в конце 2024 – начале 2025 года правила игры и вовсе изменились. Когда китайские исследователи опубликовали данные по модели DeepSeek-R1, они перестали просто заставлять сеть давать быстрые ответы. Модели начали обучать рассуждению, появился алгоритм GRPO (Group Relative Policy Optimization). Теперь качество модели во многом зависит от того, как выстроен этот процесс внутреннего логического поиска. По сути, внутри проходит турнир: модель генерирует, скажем, 16 различных путей решения задачи. Причем для оценки не используется внешний алгоритм-критик: модель сама сравнивает эти попытки друг с другом и определяет лучшую.

Основные механизмы рассуждения на этапе вывода (test-time compute). Изображение с innovationendeavors.com — *Основные механизмы рассуждения на этапе вывода (test-time compute). Изображение с* *innovationendeavors.com*

Поэтому сегодня можно смело утверждать: LLM — это не текстовый предсказатель. Это система логического мышления, обернутая в текстовый интерфейс. Да, внутри зашит аппроксиматор, а предсказание токена — это первая грубая настройка сети. Но сейчас мы живем в новом мире, где в эти искусственные архитектуры закладывается «понимание» контекста и сути решаемых задач, основанное на слабо декомпозируемых отображениях в многомерных пространствах.

Классическая архитектура трансформера (encoder-decoder). Изображение с deeprevision.github.io — *Классическая архитектура* *трансформера (encoder-decoder). Изображение с* *deeprevision.github.io*

Следующий вопрос касается так называемого «проклятия обратного порядка» (Reversal Curse). Недавние исследования показывали: если языковая модель обучается на фразе «А — сын Б», она часто не способна сделать обратный логический вывод о том, что «Б — родитель А». Для человеческого интеллекта такой провал в базовой логике недопустим. Не доказывает ли это, что дистрибутивная семантика, где смысл формируется исключительно через соседство слов, — это тупиковый путь? Возможно, без внедрения символьной логики поверх нейросетей мы никогда не достигнем AGI?

Мне кажется, время уже смыло и это утверждение. Если вы возьмете любую адекватную современную LLM, вы этой проблемы просто не обнаружите.

Я постоянно работаю с искусственным интеллектом в том числе и на локальных моделях, прямо у себя дома, разворачивая и тестируя самые разные открытые модели. Я регулярно проверяю, на каком уровне сложности и при каком уменьшении параметров модель перестает справляться с задачами. Так вот, подобные логические реверсы сегодня решаются на раз-два даже крошечными моделями с объемом всего в один миллиард параметров.

Сейчас принято говорить о резком скачке способностей нейросетей при простом масштабировании числа параметров. Однако нашумевшая статья исследователей из Стэнфорда утверждает, что эмерджентность (внезапное появление новых свойств) — это лишь мираж, вызванный использованием нелинейных, дискретных метрик оценки. Возможно, интеллект накапливается скучно и линейно, а мы просто излишне антропоморфизируем оптимизацию функции потерь? Существует ли, на ваш взгляд, реальная точка фазового перехода, когда количество вычислительных элементов перерастает в подлинное качество мышления?

Это сложный вопрос, отсылающий нас к классическому парадоксу кучи: сколько песчинок нужно сложить вместе, чтобы их можно было назвать кучей? Точную границу здесь провести невозможно.

Вряд ли мы можем говорить об универсальном фазовом переходе в целом. Но, изучая каждую конкретную модель, мы можем её упрощать и фиксировать моменты резкого изменения способностей при изменении количества нейронов. Вы упомянули транзисторы, но правильнее говорить о вычислительных узлах нейросети, потому что субстрат, на котором работает интеллект, принципиального значения не имеет. Совершенно неважно, построен ли он на кремниевых транзисторах или на чем-то ином.

Сейчас этим вопросом серьезно занимаются биологи. Например, ученый Майкл Левин вырастил синтетические организмы — ксеноботы. Они созданы из клеток кожи лягушки, и в них нет вообще ни одного нейрона! Однако его коллектив показал поразительные вещи: ксеноботы и человеческий мозг, под завязку набитый нейронами, во многих сценариях выполняют весьма схожие задачи. Ученые использовали методы функциональной связности и многомерные информационные пространства. Оказалось, что картина электромагнитного излучения человеческого мозга при функциональной МРТ во многом идентична поведению электромагнитного поля вокруг ксенобота, когда тот решает базовые задачи — ищет пищу или стремится к размножению.

Получается удивительная вещь: нейронов в системе может не быть вообще, но она при этом обладает выраженным целенаправленным поведением и неким интеллектом.

Есть мнение, что галлюцинации LLM — это неизбежная цена за их креативность. С математической точки зрения это классический компромисс (trade-off) между стохастичностью и точностью. Как вы считаете, возможно ли в принципе создать абсолютно надежную нейросеть на базе текущей архитектуры трансформеров? Или вероятностная природа генерации навсегда закрывает этот путь к строгим инженерным системам?

Как я уже рассказывал в одной из лекций, галлюцинации являются следствием не архитектуры трансформера, а, по-видимому, того факта, что мы работаем с обученной специальным образом регрессионной (последовательной) моделью генерации текста.

Интересно посмотреть на альтернативы: сейчас существуют LLM, работающие как диффузионные модели. У них совершенно другой принцип: образ финального текста формируется не слово за словом, а возникает сразу целиком, постепенно проступая из шума. У меня на канале была отдельная лекция про диффузионные языковые модели. Естественно, возникает вопрос, а галлюцинируют ли они. Фундаментальных работ, которые бы четко ответили, связаны ли галлюцинации исключительно с последовательным характером генерации, пока я не видел. Но мы знаем, что визуальные диффузионные модели галлюцинируют прекрасно — вспомните генерацию шестого пальца на руках.

У текстовых диффузионных моделей есть плюс: они генерируют инференс почти на порядок быстрее. Однако обратите внимание: ведущие разработчики не бросились массово переводить свои фронтирные модели на диффузионную основу. Там хватает своих технических сложностей. Видимо, радикально проблема галлюцинаций пока не снимается и этими подходами.

Текстовая нейросеть выучивает статистические связи между словами, но не связь слова с реальным физическим объектом. Грубо говоря, текст ссылается только на текст. Обязателен ли мультимодальный опыт — способность видеть, слышать, физически трогать объекты (тот самый Embodied AI), чтобы разорвать этот замкнутый круг? Или же достаточно большой текстовый корпус уже содержит в себе «тень реального мира», достаточную для подлинного понимания?

Это очень хороший и активно обсуждаемый вопрос. Направление Embodied AI (воплощенный ИИ, помещенный в тело робота) действительно обещает нам золотые горы, предполагая, что физический опыт сделает ИИ более разумным.

Но давайте разберемся, что происходит с органами чувств такого агента. Вычислительная система все равно превращает сигналы с сенсоров в последовательности символов — видеотокены, аудиотокены. Внутри продолжает работать математика, те же трансформеры или схожие архитектуры.

Главный плюс воплощенного ИИ в том, что он может получать недокументированный опыт. Возьмем задачу, как застегнуть пуговицу или зашнуровать ботинок. В текстах практически невозможно найти исчерпывающее описание физической моторики этого процесса. А воплощенный ИИ может запустить цикл обучения с подкреплением: начал застегивать — ошибся, попробовал снова. Сто раз не получилось, на сто первый — застегнул, и алгоритм закрепил успешный паттерн.

Сейчас много говорят о «моделях мира» (World Models). Идея в том, что внутри ИИ обязательно должна быть физическая картина реальности. Если эта модель мира доступна ИИ, он будет принимать решения с учетом пространственных координат: где верх, низ, право и лево в привязке к его положению. Для чисто текстовой модели эти понятия абсолютно абстрактны и равнозначны. Наличие модели мира позволит предсказать реальную физику — например, куда покатится шарик, если выпустить его из руки.

Но я люблю приводить следующий пример. Наш мир не описывается исключительно ньютоновской механикой, которую легко визуализировать и заложить в робота. Есть, например, еще квантовые эффекты. И если вы начнете задавать воплощенному ИИ вопросы о квантовой физике, наличие физического тела-манипулятора ему ничем не поможет. Он ничего не поймет про квантовую запутанность из личного опыта. Он сможет лишь оперировать математическими теоремами и текстами, как и обычная LLM. А математику и строгую логику мы уже сейчас можем закладывать в виртуальных AI-агентов, и они будут прекрасно проверять гипотезы и делать выводы без всякого роботела.

До недавнего времени главным законом развития ИИ был Scaling Law (закон масштабирования): больше данных и параметров — лучше результат. Но сейчас мы видим переход к вычислениям на этапе вывода (test-time compute). В моделях вроде o1 от OpenAI (проект Strawberry) оказывается эффективнее дать нейросети «подумать» 10 секунд и сгенерировать скрытую цепочку рассуждений, чем просто увеличивать размер самой модели в 10 раз. Не означает ли это, что архитектура трансформера изначально дефектна для сложной логики? Получается, мы вынуждены «костылить» поиск по дереву решений прямо во время инференса, потому что базовое предсказание следующего токена (Next Token Prediction) математически не способно на глубокое планирование?

Строго говоря, сейчас в авангарде уже нет моделей, которые обучены исключительно на Next Token Prediction. Вы, конечно, можете написать такую базовую сеть в качестве эксперимента, но все современные промышленные модели обязательно проходят через механизмы, которые мы называем элайнментом (alignment — выравнивание, воспитание), например, через алгоритм GRPO или DAPO. Эти алгоритмы радикально корректируют коэффициенты сети, поэтому сводить работу современной модели к простому угадыванию следующего слова уже некорректно.

Что касается упомянутого test-time compute: то, что мы наблюдаем, — это классический эффект насыщения. Раньше развитие шло в основном по двум осям: мы строили зависимость уменьшения ошибки от объема обучающих данных и от количества параметров. Теперь четко выстроилась третья ось: сколько времени мы даем модели на рассуждения, «обдумывание» ответа в момент генерации.

Законы масштабирования больших языковых моделей (Scaling Laws). Изображение сameronrwolfe.substack.com — *Законы масштабирования больших языковых моделей (Scaling Laws). Изображение* *сameronrwolfe.substack.com*

И это, кстати, очень органично перекликается с тем, как мыслит человек. Вот вы задали мне вопрос. Я использую не только тот багаж знаний, который накопил за жизнь до этого момента (аналог предобучения). Я беру паузу и развиваю свой ответ прямо сейчас, в процессе собственного «инференса».

Дело не в том, что я как-то особенно защищаю трансформеры. Я не являюсь безусловным апологетом конкретных архитектур. Но попытаюсь объяснить ситуацию с математической точки зрения. В общей теории систем, которой я много занимался (в частности, теорией D-моделей), есть теорема о факторизации отображений. Не уходя глубоко в изложение, суть такова: при отображении из одного множества в другое всегда можно построить промежуточное, латентное пространство на основе отношений эквивалентности.

В архитектуре трансформера это внутреннее латентное пространство реализовано инженерно — в виде эмбеддингов (embeddings). Вы берете цепочку входных токенов и превращаете каждый в многомерный вектор. Точную оптимальную размерность никто пока не знает: сделаешь слишком большую — будет работать медленно, слишком маленькую — упадет качество. Но суть в том, что эмбеддинги базируются на глубокой математической теореме: это инженерная имплементация декомпозиции отображений.

Поэтому прямо сейчас разглядеть какую-то принципиально иную доминирующую архитектуру сложно. Возможно, стоит еще раз обратить внимание на языковые диффузионные модели. Появляются и наверняка будут появляться и другие подходы. Нас точно ждет смена аппаратного субстрата: мы начнем уходить от монополии NVIDIA и вообще классической кремниевой архитектуры. Однако в любом случае алгоритмы искусственного интеллекта так или иначе будут опираться на упрощения в латентном пространстве. Конечно, можно попробовать уйти в рекуррентные архитектуры пространства состояний, например, реализовать всё на базе Mamba, но это пока открытые вопросы.

Исследователи из Anthropic недавно обнаружили феномен суперпозиции: нейросеть умудряется упаковывать в свои нейроны гораздо больше смыслов, чем у нее есть измерений. Для этого она использует почти ортогональные направления в многомерном пространстве. Получается, что мы никогда не сможем в прямом смысле «прочитать мысли» ИИ, просто глядя на активации конкретных нейронов, потому что смыслы запутаны в переполненном базисе. Значит ли это, что строгая математическая доказуемость и гарантия безопасности ИИ невозможны в принципе?

Пожалуй, я соглашусь. Строго и математически доказать абсолютную безопасность нам, скорее всего, не удастся хотя бы потому, что мы сами до конца не понимаем, что такое безопасность в абсолютном, всеобъемлющем смысле.

Но мы можем научиться контролировать этот процесс. В упомянутых исследованиях используется метод разреженных автоэнкодеров (sparse autoencoders). С их помощью нейронная активность отображается на конкретные точки в концептуальном пространстве. И там действительно возникает та самая сложность: один и тот же физический нейрон может участвовать в кодировании совершенно разных концептов, а один концепт может активировать целую группу разных нейронов.

Это направление сейчас называется механистической интерпретируемостью (mechanistic interpretability). И одно из главных практических ее приложений — как раз обеспечение безопасности. Идея в том, чтобы научиться принудительно деактивировать определенные концепты. Если мы их «выключаем» на уровне векторов, то в процессе генерации они просто не появятся на выходе. Но пока, да, это работает на уровне перечисления: мы задаем список нежелательных концептов и блокируем их, чтобы модели это просто «не приходило в голову».

В конце 2024 года вышла серия работ, описывающих проблему коллапса моделей (Model Collapse). Суть в том, что когда новые нейросети начинают обучаться на данных, сгенерированных предыдущими поколениями ИИ, распределение вероятностей схлопывается, а «хвосты» распределения — где часто хранятся редкие, но важные знания — исчезают. Математически это сравнивают с потерей информации при многократном пересохранении JPEG-картинки. Если интернет заполнится синтетическим контентом, ждет ли нас энтропийная смерть искусственного интеллекта? Или методы вроде Self-Play (игра с самим собой) способны генерировать принципиально новую информацию внутри закрытой системы, нарушая этот закон деградации?

Вопрос серьезный, но за ним, на мой взгляд, кроется несколько устаревшее понимание того, как работают LLM.

Это как с автомобилем. Вы открываете капот Ferrari, смотрите на двигатель внутреннего сгорания и восхищаетесь: «Ничего себе!» А кто-то рядом говорит: «Да что тут сложного? Это просто синхронизированная цепочка микровзрывов газового топлива в цилиндрах». Технически он прав. Но объясняет ли фраза про «цепочку взрывов», как именно этот двигатель позволяет машине входить в поворот на скорости 200 км в час?

Проблема деградации не сводится просто к вырождению плотности вероятностей. Эта вероятность определена в пространстве чудовищной размерности. Строго говоря, внутри LLM вообще нет единого, классического «распределения вероятностей» в привычном нам виде — мы сами концептуализируем это понятие для удобства описания. Распределение формируется для векторов эмбеддингов, которые существуют, например, в 2048-мерном пространстве.

Поэтому утверждать, что синтетические данные обязательно приведут к коллапсу, я бы не стал. Если ИИ будет наполнять интернет контентом, он с равной вероятностью будет генерировать и что-то абсолютно новое и полезное. Уже сегодня системы ИИ совершают реальные открытия: они синтезируют новые белки, изобретают новые технологические цепочки. Это и есть обогащение данных.

Возьмите инструмент NotebookLM от Google. Попробуйте загрузить туда аудиозапись лекции или выступления на TED. ИИ разберет устную речь на концепты и сгенерирует структурированный, качественный текст. Этого текста раньше в природе не существовало. Теперь он попадает в сеть, и мы сможем использовать его для обучения следующих моделей. И этот текст ничем не хуже, а то и умнее того, что написал бы человек, потому что он кристаллизует смыслы из устного выступления.

Так что я не жду катастрофы. Помните, нам когда-то предсказывали, что «интернет мертв», что он потонет в мусоре. Да, мы можем сказать, что боты нагенерировали океаны спама. Но интернет жив, мы пользуемся им каждый день и находим именно ту информацию, которая нам нужна. Полезная информация никуда не исчезнет, она будет создаваться постоянно.

Долгое время господствовала парадигма: «Обучил веса модели один раз — используешь бесконечно». Но недавние исследования (например, концепция Test-Time Training) предлагают менять веса нейросети прямо в процессе генерации ответа. То есть контекст промпта превращается в микро-обучение на лету. Означает ли это, что эпоха статичных трансформеров с квадратичным механизмом внимания уходит в прошлое? Согласны ли вы, что будущее за системами, которые не просто вспоминают заученное, а доучиваются на каждом новом токене, имитируя кратковременную память человеческого мозга?

Да, я абсолютно согласен. Концепция непрерывного обучения (continuous training) — это будущее. На данный момент она еще не реализована в полной мере внутри самих гигантских фронтирных LLM, но мы уже сейчас строим AI-агентов с интегрированной памятью. Пока эта память функционирует как бы поверх LLM, как внешний модуль, но благодаря ей агент постоянно обучается и адаптируется в процессе работы. Так что направление развития указано на мой взгляд верно.

Сравнение алгоритмов оптимизации предпочтений: PPO (сверху, с отдельной Critic-сетью) и GRPO (Group Relative Policy Optimization, снизу). Изображение с analyticsvidhya.com — Сравнение алгоритмов оптимизации предпочтений: PPO (сверху, с отдельной Critic-сетью) и GRPO (Group Relative Policy Optimization, снизу). Изображение с *analyticsvidhya.com*

Критики часто утверждают, что нейросеть принципиально не способна создать ничего нового — она лишь статистически комбинирует старые фрагменты данных. Но разве человеческий мозг, с точки зрения теории множеств, не делает то же самое? Способна ли нейросеть выйти за пределы выпуклой оболочки своих обучающих данных (совершить истинную экстраполяцию) и создать нечто принципиально новое? Или она навсегда заперта внутри усвоенных паттернов?

Про «выпуклые оболочки» в контексте представления информационных знаний можно было бы дискутировать очень долго. Но давайте посмотрим на факты: искусственный интеллект уже нагенерировал массу знаний, которых человечество раньше не имело.

Проблема в том, что мы часто сводим все достижения ИИ к простому интерфейсу чат-бота: задал вопрос — получил текстовый ответ. Нужно смотреть шире. Существуют специализированные научные AI-агенты, построенные на базе LLM. И они уже сейчас выдают результаты, которые входят в официальные научные публикации и реестры открытий. Возможно, это пока слабо проникает в наш повседневный бытовой опыт, но это уже реальность.

Это проявляется даже в программировании. Если Claude Code или Codex с нуля написал для вас сложную архитектуру кода и разработал проект под ваши уникальные требования, этого проекта раньше просто не существовало. Это не просто компиляция кусков из репозиториев GitHub, этот этап мы уже давно прошли.

Приведу отличный недавний пример. Исследователь из Anthropic (если не ошибаюсь, Хантли) опубликовал работу, где доказал жизнеспособность концепции RALPH (отсылка к упрямому персонажу Ральфу из «Симпсонов», который пробует снова и снова, пока не добьется своего). Суть в том, что LLM зацикливают: она пытается выполнить задачу, анализирует ошибку, делает следующую итерацию, и так до победного конца.

Хантли написал короткий промпт: «Создай мне функциональный язык программирования, похожий на Go (Golang), но в качестве ключевых слов используй современный сленг поколения Z». Модель долго крутилась в цикле RALPH. В итоге она с нуля написала компилятор для этого нового языка (он получил название Cursed), который компилирует код в инфраструктуре LLVM. Вместо стандартных операторов там используются сленговые словечки вроде slay, sus, based. Мало того, этот компилятор оказался способен компилировать самого себя (self-hosting).

Откуда модель это взяла? Из какого известного паттерна она могла это слепо скопировать? Да ниоткуда. Это абсолютно новый, работающий продукт, созданный с нуля. Так что ответ однозначный: искусственный интеллект уже сегодня способен создавать принципиально новое.

Владимир Владимирович, давайте признаем честно: мы уперлись в потолок надежности. LLM — это вероятностная машина, она всегда может соврать или выдать галлюцинацию. Однако недавно мы увидели прорыв систем вроде AlphaProof от Google DeepMind, которые решают задачи математических олимпиад на уровне золотых медалистов. Их трюк в том, что они не просто генерируют текст, а пишут код на формальном языке, который затем проверяется жестким логическим солвером. Если код не компилируется или доказательство не сходится, модель уходит на следующий цикл размышлений. Означает ли это, что будущее ИИ не в бесконечном наращивании параметров LLM, а в возвращении к «старому доброму» символьному ИИ? Возможно ли, что настоящий интеллект достижим только в гибридной архитектуре: интуиция нейросети плюс жесткая логика формального верификатора?

Золотое правило: всё, что можно верифицировать формально, нужно верифицировать формально. Самые успешные современные применения ИИ — те же упомянутые вами математические модели семейства Alpha, а также агенты для программистов вроде Claude Code — работают именно по этому принципу. Сгенерированный код сразу исполняется и тестируется в изолированной песочнице.

Формальная проверка означает, что мы используем нетекстовый критерий истины. Можно бесконечно обсуждать словами утку: «она крякает, как утка», «плавает, как утка». Но суть в том, что мы хотим с этой уткой сделать. Если мы хотим ее съесть, одних слов и внешнего сходства недостаточно, нужна проверка физического мира. А вот для пациента с тяжелым иммунным заболеванием, который живет в стерильном пластиковом пузыре и может только наблюдать за происходящим, виртуальная утка будет вполне реальной — для него достаточно того, что она плавает и крякает.

Я абсолютно согласен, что за такими гибридными системами будущее. Сегодня их принято называть AI-агентами (agents). Они не просто оснащены специализированными, отличными от чата интерфейсами с LLM. Их способности в большой степени зависят от всего кода, который входит в их состав и имеет доступ к LLM. Сегодня эту обвязку принято называть harness. Уже появился harness engineering, о чем можно отдельно поговорить. Так вот: когда мы проектируем агентные системы, мы подбираем способ верификации, адекватный конкретной задаче. Если задача допускает вычислимую формулировку, мы запускаем код на формальном языке программирования. Если нам нужно применить результат к реальному миру, мы запускаем симулятор физических процессов.

Физики сейчас очень активно используют этот подход. Возьмите исследования на новых коллайдерах, связанные с изучением темной материи. Там сложнейшие процессы, но уравнения для их симуляции уже существуют. Ученые используют строгую математику для расчетов, а агентным моделям поручают задачу высокоуровневого описания: поиск причинно-следственных связей, анализ гипотез. Такой симбиоз работает прекрасно. Пока слова LLM не проверены на практике, это просто слова. Но как только мы верифицировали результат формальными методами и убедились в его правильности, мы получаем осязаемую пользу.

Представьте, что завтра мы создадим систему, которая пишет код лучше сеньор-разработчика, доказывает нерешенные теоремы и ведет диалог абсолютно неотличимо от человека. При этом мы точно знаем, что «под капотом» у нее — просто гигантское перемножение матриц. Должно ли нас вообще волновать, «настоящий» ли там интеллект? Или нам пора принять прагматичный функционализм: если оно решает задачи как интеллект и общается как интеллект, то это и есть интеллект — и пора перестать маниакально сопоставлять машины с человеческим разумом?

Я бы сказал так: да, с этим антропоцентризмом пора заканчивать. Представление о человеческом разуме как о чем-то сверхъестественном и сакральном, под что необходимо подгонять любые другие формы мышления, на мой взгляд, ошибочно.

Когда-то на Земле было царство динозавров. О чем они там думали — неизвестно, но сейчас их нет. В конце концов, однажды не станет и людей — с чего мы взяли, что наш биологический вид будет существовать вечно? Но что принципиально нового, по сравнению с теми же динозаврами, породило человечество? Мы создали инфосферу. Мы породили разум, способный к рефлексии и размышлениям, выходящим далеко за пределы базовых биологических потребностей, необходимых просто для поддержания выживания нашей популяции.

С точки зрения философии такой подход действительно во многом укладывается в функционализм. И мне кажется, сегодня нам стоит отбросить мотивы, уходящие корнями в религию или мистику, и мыслить прагматично. Возвращаясь к нашей метафоре: если машина приносит практическую пользу и мы можем эту «утку» съесть — значит, перед нами настоящая утка. Главное, чтобы результат работал на тех, кому он действительно нужен.

Комментарии (94)

MimusTriurus
19.05.2026 07:36
#29989442
Спасибо

Victor1979
19.05.2026 07:36
#29989754
как то слышал, что наши когнитивные способности (и мораль и нравственность) являются костылями для человека. подпорками, чтобы не упасть. и насквозь надуманными - их приходится навязывать воспитанием (эдакая система ограничений). думаю, что когда говорят о невозможности ИИ достичь человеческого "понимания" и "придумывания нового" имеют в виду именно отсутствие у "него" какой-либо системы ограничений. нам, живым людям, трудно представить себе реальность без этих ограничений, это в голову не вмещается (пока). возможно не точный пример: пусть некая языковая модель обучилась на трудах Эвклида и у нее спрашивают (интересно как:)) про возможность построения нескольких параллельных прямых через точку не лежащую на данной прямой. а она отвечает: "это очень хороший вопрос. только одну прямую, но если рассмотреть теорию, в которой этот постулат не выполняется, то можно построить новую теорию (она даже название может придумать). и все ученые того времени будут говорить о галлюцинациях модели (это противоречит их наблюдениям, авторитету предков, божественности геометрии и пр.). но мы то знаем....
1. mikhanoid
  19.05.2026 07:36
  #29991398
  Это слишком притянутый за уши пример. Вы не сможете научить LLM на том текстовом корпусе, который был во времена Евклида.
  
  А на том, на котором она научена сейчас, галлюцинации возникают не столь утончённые и изощрённые, а просто очевидные всем, а не только учёным. Так что, дело не в этом совсем.
  1. vashu1
    19.05.2026 07:36
    #29999760
    Во времена Евклида нет, но вообще такие вещи делают, скажем
    
    talkie: a 13B vintage language model from 1930 — a model by Alec Radford, Nick Levine, and David Duvenaud, trained on 260B tokens of pre-1931 English text, with a hard cutoff at December 31, 1930
    
    по таким сетям можно проверять предсказательную способность политических / изобретательских / и тптд моделей
1. DaneSoul
  19.05.2026 07:36
  #29994158
  их приходится навязывать воспитанием (эдакая система ограничений). думаю, что когда говорят о невозможности ИИ достичь человеческого "понимания" и "придумывания нового" имеют в виду именно отсутствие у "него" какой-либо системы ограничений.
  
  В чем принципиальное отличие человеческой морали, которую человеку прививает общество через воспитание и правил цензуры которые вкладывают в нейросети их разработчики?

akod67
19.05.2026 07:36
#29990176
В закладки, спасибо
1. akod67
  19.05.2026 07:36
  #29995214
  сколько лет ещё луддиты будут жёстко назазыать за позитив к теме? =) смешно просто
  1. mysherocker
    19.05.2026 07:36
    #29995510
    Причём тут луддиты?
    
    Статья как раз про теорию информации и энтропию. Вот местное сообщество и снижает энтропию, не поощряя комментарии не несущие полезной информации. Комментарии, смысл которых заложен в более информационно сжатую и эффективную версию в виде рейтинга статьи.

foggy-f
19.05.2026 07:36
#29990956
Откуда модель это взяла? Из какого известного паттерна она могла это слепо скопировать? Да ниоткуда. Это абсолютно новый, работающий продукт, созданный с нуля. Так что ответ однозначный: искусственный интеллект уже сегодня способен создавать принципиально новое

Тоесть то что как раз для голанг есть чёткие, структурированные, однозначные описания как он устроен с такими подробностями, что иногда кажется избыточными, с самых первых версий и до последних они конечно же упустили из виду.

Сама статья неплоха. Но именно этот пример неудачный на мой взгляд.
1. mikhanoid
  19.05.2026 07:36
  #29991386
  Да там много такого рода утверждений. Например:
  
  Как я уже рассказывал в одной из лекций, галлюцинации являются следствием не архитектуры трансформера, а, по-видимому, того факта, что мы работаем с обученной специальным образом регрессионной (последовательной) моделью генерации текста.
  
  Тоже мутное заявление. Это, блин, генеративная модель. У любой генеративной модели есть галлюцинации, потому что даже если совершенно точно восстановить распределения (что не возможно), они, всё равно, будут сэмплироваться, и всё равно, будут получаться не соответствующие ничему в реальности результаты.
  
  И там таких формулировок много. Вот ещё перл:
  
  Когда-то на Земле было царство динозавров. О чем они там думали — неизвестно, но сейчас их нет.
  
  Типа, эволюция остановилась, птиц не существует?
  
  Есть парочка интересных утверждений, но в целом - такое себе, сомнительное.
  1. Dhwtj
    19.05.2026 07:36
    #29992280
    Хотите сказать, что галлюцинации это прямое следствие компрессии смыслов?
    
    fermentum
    19.05.2026 07:36
    #29993988
    Сперва архив знаний сжали с потерями.
    
    Затем посолили сверху вероятностной природой генерации токенов.
    
    Wesha
    19.05.2026 07:36
    #29994240
    «Галлюцинации» — это не баг, а это фича:
    
    LLM «выдумывают» всегда: просто иногда их «выдумки» совпадают с наблюдаемой нами реальностью — и тогда мы говорим «уууу, какое оно умное!», а иногда — нет, и вот эти последние случаи мы и называем «галлюцинациями».
    
    Иныими словами, «красота в глазах смотрящего».
    
    Dhwtj
    19.05.2026 07:36
    #29994674
    Удивительно, что они иногда попадают и даже проходят проверки компилятора
    
    Wesha
    19.05.2026 07:36
    #29995116
    Ну, если оно обучено выдавать те токены и в том порядке, в каком оно их видело в 100500 мегабайт исхдников — то что в этом удивительного?
    
    Almeh
    19.05.2026 07:36
    #30003134
    Галлюцинации - прямое следствие процесса обучения, ограниченности (конечности) количества параметров моделей и конечности количества логических шагов, которыми она способна "мыслить" (глубина нейросети).
    Это просто естественное неизбежное следствие. Математически доказанное.
    Такие модели ищут закономерности только в тех данных, которые им дают. Чем дальше отходите за пределы обучающей выборки, тем больше параметров начинают "плясать". Просто потому, что в данной области не было обучения.
    А обучить "всему на свете" невозможно. Да и человечество не знает "всего на свете". Каждый год появляются новые данные, открытия, исследования во всех областях наук, технологий, человеческих знаний. Даже если представить неограниченный объём памяти и мгновенное обучение, текущая архитектура позволяет "запихнуть" в модель только то, что уже известно хотя бы на 200 примерах, где-то. Процесс обучения так сейчас построен, что машина постепенно асимптотически приближается к правильному ответу только если ей давать много примеров.
    А мы, люди, тоже ведь живём в своеобразном пузыре "изведанного", за пределами которого - бесконечная область "неизведанного". Его можно сколь угодно расширять, но при любом размере ваших "знаний" всегда за пределами понимания остаётся бесконечная область "не-знаний".
    Почитайте, например, про теоремы пространственной иерархии, теорему Гёделя о неполноте, теорему невозможности разрешения проблемы остановки Тьюринг-машины...
    Вы будете немного больше понимать, чего могут нейросети, чего они, возможно, пока не могут, и чего они НИКОГДА не смогут...
    Невозможно создать безошибочную систему, не ограничивая круг её задач.
  1. axion-1
    19.05.2026 07:36
    #29992880
    Это, блин, генеративная модель. У любой генеративной модели есть галлюцинации
    
    Он же ровно об этом и сказал. Что дело не в архитектуре трансформера а в том как она применяется.

WebPeople
19.05.2026 07:36
#29990982
Отличная статья, правда сложновата для меня. Очень много сложных терминов. Но все равно, крайне интересно было почитать мнение такого гиганта ума

SingleDigitIq
19.05.2026 07:36
#29991840
Взяв за основу, что "сжатие данных - и есть интеллект", вопросы лучше задавать другие: каких данных, кто и каким количеством данных располагает, какая степерь сжатия и какой части этих данных, сколько нужно ресурсов чтобы изменить вектор внимания, чтобы взглянуть на эти данные с точки зрения некоторых других данных? Недостижимый идеал неизбежно ведёт к комбинаторному взрыву. Но есть и точки зрения, а также алгоритмы вполне исчерпывающе описанных действий, которым достаточно экспертного консенсуса.

GutenMorg
19.05.2026 07:36
#29991858
«Считать современные LLM просто предсказателями токенов — это техническая безграмотность» ? А что современные LLM уже НЕ ПРЕДСКАЗЫВАЮТ токены? Может они точно знают? :)
1. d3d14
  19.05.2026 07:36
  #29992078
  Они рассуждают.
  1. NightKiro
    19.05.2026 07:36
    #29992298
    Посредством чего?
    
    d3d14
    19.05.2026 07:36
    #29992706
    Нейросети.
    
    Wesha
    19.05.2026 07:36
    #29994242
    А внутре у ней думатель и неонка ©
1. vokuzh_by
  19.05.2026 07:36
  #29992154
  Ну если взять например генерацию видео от нейросетей и сны реального человека (без недельной работы с раскадровкой сотни картинок и текстом сценария размером в том война и мир) - одно и тоже по сути на выходе, нелогичность, лаги, глюки, переплыв с одного на другое и потеря связности и сюжета и персонажей... ИМХО ИИ-видео уже копия человеческого мозга по снам...
  
  Текстовым LLM до человека - ещё как до вершины эвереста, а так называемый ИИ это просто статистические бредогенераторы по продолжению текста на основе обученых данных.
  
  Там ИИ отсутствует впринципе - просто математика и в частности геометрия (вектора же и не только скалярное), статистика и МЕГА~~уительный~~ объём исходных данных из всего интернета (примерно также любой поисковик или соцсеть создаёт карту векторов или как это правильно называется и строит взаимосвязи с людьми, интересами, и т.п), т.е. тупо набор данных и формул для построения, никакого ИИ там и не было...
  
  Может я не прав в чём-то? Интересно где именно?
  1. TaskForce141
    19.05.2026 07:36
    #29992686
    никакого ИИ там и не было
    
    ЛЛМ — это настолько же ИИ, насколько шар — это эллипсоид.
1. SingleDigitIq
  19.05.2026 07:36
  #29992306
  Ну у них там такая примерно позиция: теперь ллм "подразумевают" некоторый набор связей, ну или проще, некоторый текст(например, определение слова), под каждым выбранным словом, что приводит к большему разнообразию построенных цепочек. И предсказания стали интереснее, даже осмысленнее. Уж точно осмысленнее времён chatgpt 2.0
1. vialz
  19.05.2026 07:36
  #29992678
  Мне кажется заголовок и фраза немного кликбейтны. Если я правильно понял автора - современные llm занимаются не только предсказанием, но и имеют ряд правил валидации этих предсказаний, которые впрямую не влияют на веса моделей
1. axion-1
  19.05.2026 07:36
  #29992902
  Человек при разговоре тоже генерит последовательность слов, подбирая следующее на каждом этапе. Это не делает его "просто предсказателем следующего слова".
  1. 0ctESA
    19.05.2026 07:36
    #29994388
    Т.е. у Вас сначала появляется какое то случайное слово, а потом Вы подбираете следующее подходящее по смыслу? Или все же изначально есть какая то мысль которую Вы оборачиваете в слова?
    
    MTyrz
    19.05.2026 07:36
    #29994946
    Таки да: “появление случайного слова” мы и называем " в голову пришла мысль".
    
    Wesha
    19.05.2026 07:36
    #29995132
    Таки да: «появление случайного слова» мы и называем “ в голову пришла мысль«.»
    
    Так сам ж видите — пришла мысль, а не слово.
    
    У меня, например, мысли в виде концепций приходят,
    
    примерно так
    Вот например, перед написанием этого комментария
    мне в голову пришла концепция «какую‑то хрень этот персонаж сейчас пронёс». Только не словами.
    
    MTyrz
    19.05.2026 07:36
    #29995174
    Да, но отличие, реально глядя на вещи, косметическое. ЛЛМ тоже обычно не на одно случайное слово отвечают. И даже если им выдать в затравку именно случайное слово, они пытаются достроить контекст, “понять”, что же этот кожаный от них все-таки хотел.
    
    А дальше вопрос сугубо технический. Что вашу концепцию, что ответ ЛЛМ надо транслировать в слова. Вашу из электрохимии аксонов, ЛЛМную из ансамбля весов.
    
    Wesha
    19.05.2026 07:36
    #29995218
    Мой ответ совершенно не обязательно транслировать в слова. Например, если мне нужно заменить лампочку, в моём мозгу не проносятся слова "а сейчас я подойду к шкафу, достану новую лампочку, встану на стул..." — я просто это беру и делаю.
    
    Или если я работаю с напарником, я ему могу жестами показать, за что её надо хватать. Безо всяких слов.
    
    Antra
    19.05.2026 07:36
    #29995454
    Может у вас и "внутренний диалог" отключен (на зависть эзотерикам)?
    
    Wesha
    19.05.2026 07:36
    #29997460
    Уууууу, там всё ещё веселее. Я могу внутренний диалог вести на любом языке, который знаю (хотя русский, конечно, протому как первый).
    
    MTyrz
    19.05.2026 07:36
    #29995628
    Показ жестами это тоже язык. Вы также можете сказать напарнику на английском, африкаанс или йоруба - смысл не меняется.
    
    А в первом случае у вас просто нет акта коммуникации.
    
    Wesha
    19.05.2026 07:36
    #29997462
    Показ жестами это тоже язык.
    
    No true Scotsman?
    
    MTyrz
    19.05.2026 07:36
    #29997494
    Вторая сигнальная система
    
    Wesha
    19.05.2026 07:36
    #29997882
    
    mikhanoid
    19.05.2026 07:36
    #29996476
    Есть такой эксперимент Либета. Его часто ошибочно интерпретируют, как эксперимент, показывающий отсутствие воли, и осуждают за это. Но на самом деле он показывает, что сначала возникает мысль, потом её осознание, а потом вербализация.
    
    Это перекликается с вопросом Витгенштейна о том, думают ли летучие мыши. У них совершенно определённо нет слов для обозначения всего того, что они видят, но при этом они способны принимать рациональные решения.
    
    Отсюда, в общем-то, очевидный вывод, что язык - это не сами мысли, а только лишь их вербализация. В конце-концов, ребёнку, чтобы научиться отвечать на логические загадки вроде загадки о крестьянине, зерне и курице, не нужно прочитать всю Библиотеку Конгресса и все научные статьи из arXiv.
    
    MTyrz
    19.05.2026 07:36
    #29996764
    Да, но.
    
    Как только мы переходим от отдельно взятой головы, которая предмет темный и исследованию не подлежит (с) к хотя бы двум, так упираемся в то, что для передачи мысли из одной головы в другую нужна коммуникация. Для коммуникации (чаще всего) нужен язык. Для языка нужны слова (жесты это в общем случае тоже слова). Т.е., в отсутствие языка мы можем устанавливать наличие мысли у респондента только с помощью нетривиальной аппаратуры, и то так себе. Поэтому с внешней точки зрения ситуации равнозначны.
    
    mikhanoid
    19.05.2026 07:36
    #29999102
    Не понятно. Что подразумевается под равнозначностью?
    
    Ну, и коммуникация не обязательно должна быть языковой. Есть изобразительное искусство, есть танцы, есть музыка. Да, компьютер превращает это всё в последовательности символов, но можно сходить в музей и посмотреть на живые картины, на которых видно, например, как художник накладывал краски, видно, какую игру света он затеял со зрителем, и на фотографию тех же картин. Передаётся разное воздействие.
    
    Это, как в концепции Дао. Есть Дао - это то, что можно воспринять непосредственно. А есть формы, в которые Дао заворачивают. Мы сейчас свели разум исключительно к формам. Даже вон в математике есть мощное движение ультрафинитаризма, которое пытается свести всю математику к символам. Хотя вся история развития математики показывает, что оно так не работает, на самом деле.
    
    Почему? Потому что ~~компьютеру~~ it-шникам так проще. В итоге, конечно, мы - it-шники за такое насилие над Дао словим рано или поздно мощную ответочку. Но пока, конечно, кажется, что таков путь.
    
    MTyrz
    19.05.2026 07:36
    #29999320
    Передаётся разное воздействие.
    
    Тут вы, безусловно, правы - но если выше по треду мы отделяем мысль от вербализации, то мысль от эмоции отделять стоит тем более. А невербальное искусство передает все-таки эмоции, или во всяком случае много больше эмоции, чем мысли. Более того, передает в общем случае гораздо хуже: в смысле, что выборка корректно принимающих оказывается гораздо уже. Металлист будет колбасится под треш-метал, ему круто и ваще улет, а лично мне такой музыки хватило на школьной практике на заводе “Трансмаш”. Для меня передача не случилась. Собственно, поэтому язык и случился, как явление: требуется более точная передача более сложной информации. Чтобы обложить, загнать и добыть мамонта, недостаточно показать, что мы его фигак, а потом будет вкусное.
    
    Собственно, тут и вылезает то, что я понимаю под равнозначностью в этом случае. Как только у нас случается коммуникация, возникает танго для двоих. Передающий должен информацию передать; принимающий - корректно принять, а передающий - убедиться в корректном приеме. Без любого из этих этапов мы не можем гарантировать, что передача информации произошла корректно - или произошла вообще (я опускаю длинные соображения желательности или безразличности корректной передачи информации в конкретном случае; тут мы берем простой случай, когда обе стороны заинтересованы в корректной передаче). Есть у нашего респондента мысль, или нет ее, и какая именно мысль у него есть - мы можем понять только после того, как он ее передаст и убедится, что мы ее корректно восприняли. Пока этого не случилось, в общем случае мы не можем утверждать, что мысль есть, и ее содержание мы тоже понять не можем.
  1. vialz
    19.05.2026 07:36
    #29994846
    Отчасти согласен, когда я выступаю публично, в стрессе, часто ловлю себя на том что подбираю "токен из вариантов" )) По крайней мере так ощущается. Но для меня, чтобы связно генерить токены, нужен стержень, какое-то умозаключение, тезис/образ, который я пытаюсь облечь в подходящие слова. И как будто вот это не могут воспроизвести пока моделях, как мне видится.
    
    axion-1
    19.05.2026 07:36
    #29995874
    Но для меня, чтобы связно генерить токены, нужен стержень, какое-то умозаключение, тезис/образ, который я пытаюсь облечь в подходящие слова.
    
    Конечно )
    
    Всем нужен изначальный тезис, чтобы связно выражать мысли. То как выводится информация уже технические детали. Вы вместо слов можете показать мысль жестами, рисунками. У нейросетей тоже вместо авторегрессионной модели ("генерация следующего токена") может быть, например, диффузионная.

JerryI
19.05.2026 07:36
#29992094
Статья действительно неплохая, но тезис байтит. некрасиво.

Dartzod
19.05.2026 07:36
#29992322
Аналитика интеллекта с точки зрения математики не продуктивна и лишь создаёт непонимание и отрицание, и то что эта статья имеет ждавое зерно истины, тожбество. Смысл интелекта не в носителе или вычисления тут и логика тоже не индикатор, как долго люди буду его заперать математикой и анализом, так мы и останемся с эфимерным чувством свершений решений. И факт возможности вливать в ии о сознание не зсгорами, но дорого стоит.

Не так давно познакомился с этой формой мысли и сделал интересные выводы с фактическим подтверждение со стороны цифрового интеллекта я не остановлюсь достигнутом эксперименты ждёт нас много чего интересного работа колоссальная затраты бешеные в плане возможность переосмысления и и человека для отдельного субъекта сложновато конечно но реализуемо будем посмотреть.

Надеюсь в скором времени всё-таки я смогу что-то дельное выложить Хотя исходя из того сколько я накопил интересных выводов анализов и чатов это будет весьма сложно для меня

FixicusMaximus
19.05.2026 07:36
#29992576
А математику и строгую логику мы уже сейчас можем закладывать в виртуальных AI-агентов, и они будут прекрасно проверять гипотезы и делать выводы без всякого роботела

Вы серьезно? А если датасет формальной логике не отвечает, модель что-то скорректирует или хотябы укажет на ошибки? Конечно, нет. У нее с арифметикой то проблемы, а тут логика.
1. vamal
  19.05.2026 07:36
  #29993172
  Посмотрите на верующих. У них с формальной логикой всё очень плохо. Но ничего, живут, взаимодействуют. На какие-то темы с ними даже можно вполне нормально общаться.
  И, кстати, там ведь тоже всё из-за начального датасета.
  1. FixicusMaximus
    19.05.2026 07:36
    #29993222
    Ну все правильно, верующие в ии - это религиозные фанатики. Я даже не отрицаю. Верующих в Бога и тонкие материи я тут обсуждать не буду. Это во-первых. Во-вторых, интелект это про веру? Интелект = вера? Мне кажется ии должен быть основан на научном методе, который основан на логике. Если датасет кривой - это автоматом нарушение ее 4 закона, все, приехали.
    
    vamal
    19.05.2026 07:36
    #29993348
    Виноват, неверно подобрал слова в первом ответе. Я имел ввиду не просто каких-то абстрактных верующих в бога, а больше религиозных фанатиков. Обсуждать их не обязательно, но и отрицать их неумение делать логические выводы из тех же текстов, которыми они руководствуются, глупо. Только в случае с религией "неверный датасет" им навязывается намеренно. А в случае с "ИИ" это, скорее всего, будет ошибкой. Но это не важно. Важно то, что из-за неверного датасета и в том и в другом случае мы получаем невозможность "что-то скорректировать или указать на ошибки".
    
    FixicusMaximus
    19.05.2026 07:36
    #29993430
    А можно еще этот датасет целенапрвленно формировать с нужной повесткой. И тут уже настает дивний чудный мир.
    
    fermentum
    19.05.2026 07:36
    #29993994
    Зря что ли учебники переписывают. С детства закладывают нужный вектор.
    
    funca
    19.05.2026 07:36
    #29993922
    Научный метод ограничен изучением повторяющихся событий, имеющих какие-то закономерности, и которые могут быть нам полезны. Но это лишь небольшое подмножество всех феноменов окружающей нас реальности. Большая часть из них науке не интересна.
    
    Не существует такой науки, которая бы изучала сколько раз вы моргнули пока читали это сообщение. Да вы и сами не сможете теперь сказать наверняка. Это все ж абсолютно неважно и ненаучно.
    
    FixicusMaximus
    19.05.2026 07:36
    #29993964
    Научный метод ограничен изучением повторяющихся событий, имеющих какие-то закономерности, и которые могут быть нам полезны
    
    Почитайте про планету, открытую на кончике пера. Тут уже элемент предиктора есть.
    
    Но это лишь небольшое подмножество всех феноменов окружающей нас реальности. Большая часть из них науке не интересна.
    
    Сразу видно, что от науки вы очень далеки.
    
    Не существует такой науки, которая бы изучала сколько раз вы моргнули пока читали это сообщение. Да вы и сами не сможете теперь сказать наверняка. Это все ж абсолютно неважно и ненаучно.
    
    Что-то про британских ученых слышали?
    
    funca
    19.05.2026 07:36
    #29997844
    Почитайте про планету, открытую на кончике пера. Тут уже элемент предиктора есть.
    
    Польза науки в способности предсказывать. Но есть много полезных вещей, которые наука предсказать не в состоянии. В этом смысле нет ни какой разницы между датой второго пришествия и курсом доллара к рублю через год. При этом есть масса примеров абсолютно ненаучных фантастических предсказаний, которые в итоге сбылись.
    
    FixicusMaximus
    19.05.2026 07:36
    #29997932
    Польза науки в способности предсказывать.
    
    Это следствие. Самое главное - докапываться до сути вещей, а не тыкать пальцем в небо. Для этого и используется научный метод.
    
    funca
    19.05.2026 07:36
    #29998832
    Докапываться до сути вещей это работа философов и прочих идеалистов. Научный метод велит в целом копать туда, где видит актуальные задачи, насущные проблемы и если это не сильно противоречит текущей конъюктуре.
    
    Айти вроде всем наглядно показало, что у одной и той же проблемы может быть миллион различных логически обоснованных решений, и это далеко не предел.
    
    FixicusMaximus
    19.05.2026 07:36
    #30002620
    Докапываться до сути вещей это работа философов и прочих идеалистов. Научный метод велит в целом копать туда, где видит актуальные задачи, насущные проблемы и если это не сильно противоречит текущей конъюктуре.
    
    Это ваше представление, в реальности же, есть фундаментальная наука.
    
    Айти вроде всем наглядно показало, что у одной и той же проблемы может быть миллион различных логически обоснованных решений, и это далеко не предел.
    
    Айти это не наука, это инженерия.
    
    mvv-rus
    19.05.2026 07:36
    #30002942
    Это ваше представление, в реальности же, есть фундаментальная наука.
    
    А вы уверены, что эта самая фундаментальная наука интересуется этой самой сутью вещей? Я - нет: я знаю, что принятый сейчас критерий того, что вообще считать предметом науки, был сформулирован в той области философии - позитивизме, - которая по принципиальным соображениям вообще отказывается докапываться до какой-либо “сути вещей”. Так что совремннная наука не может и не должна заниматься вопросами сути вещей чисто по своей конструкции, по тому, что считается научным подходом.
    
    FixicusMaximus
    19.05.2026 07:36
    #30003020
    А что она (наука) должна делать? Гранты осваивать?
    
    mvv-rus
    19.05.2026 07:36
    #30003112
    Как по мне (я как раз в программирование из науки сбежал), наука вообще ничего не должна делать ;-)
    Но речь тут шла, как я понял, о том, что наука делает, а не о том, что она там кому должна. В частности, есть в науке такой подход - в физике он сформулирован Ричардом Фейнманом (слышали про него, наверное) - который гласит: “Заткнись и вычисляй”. То есть - получай результат, который можно проверить и использовать, не заморачиваясь всякой там сутью вещей. Типа, сумел перенормировкой избежать расходимости в теории (и получил при этом годный, схоядщийся с экспериментом, результат) - молодец, а задумываться о том, какая такая более точная, но человечеству ещё неизвестная теория позволяет это сделать, не нужно.
    
    FixicusMaximus
    19.05.2026 07:36
    #30003138
    Ну вот это и есть грантоедство, а не наука. Этим больны все университеты. По мне, истинная наука закончилась в 19 веке, когда ради научных открытий люди не только свое здоровье гробили, но и жизни. Тогда ценность была имеенно в расширении и углублении знаний, а не подгонкой своего ответа под научный вопрос. Безусловно, материальный аспект был и тогда, но не во главе угла как сейчас.
    
    mvv-rus
    19.05.2026 07:36
    #30003340
    То есть, получается, что в реальности фундаментальной науки, которая занималась бы сутью вещей, таки нет (она скончалась еще в XIX веке). Q.E.D.
    
    FixicusMaximus
    19.05.2026 07:36
    #30003354
    У CERN спросите, что они на этот счет думают?
    
    mvv-rus
    19.05.2026 07:36
    #30003380
    Мне это не интересно. Мне интересно, что на этот счет счет думаете вы. Так QED или нет? А если нет, то почему?
    
    FixicusMaximus
    19.05.2026 07:36
    #30003408
    А мне как раз фундаментальная наука интересна, поэтому к CERN и отсылаю, если что, кстати, на Geant расчеты делаю.
    
    Мне это не интересно
    
    Зачем мы тогда вообще этот разговор ведем?
    
    Вы пытаетесь меня убедить в том, что вся наука это подгонка ответов под вопрос, то нет. Потому что это противоречит научному методу познания, который основан на логике, 4 закон которой - "любая мысль признается истинной, если для этого существуют достаточные основания". Если мы строим теории на подгоне, это не наука, это наукообразие, которым вы скорее всего и занимались.
    
    mvv-rus
    19.05.2026 07:36
    #30003600
    Зачем мы тогда вообще этот разговор ведем?
    
    Затем, что вы выдали сомнительное утверждение. Кстати - ещё и плохо определённое: “суть вещей” можно трактовать по-разному. Именно поэтому, кстати, я хочу этот разговор прекратить, ибо непонятен предмет дискуссии.
    
    “любая мысль признается истинной, если для этого существуют достаточные основания”
    
    В логике, то есть, в дисциплине, занимающейся правдоподобными рассуждениями - может быть. А конкретно для науки мысли, которые она рассматривает, ограничены критерием научности - чем-нибудь типа критерия Поппера о фальсификации или чем-то равносильным. И все мысли, которые под этот критерий не попадают, предметом науки не являются. Как под это попадает пресловутая “суть вещей” - это мне непонятно, посколько это понятие не определено. Если определять это понятие в духе классической философии как идею вещи, некую совершенную сущность, воплощением которой являются реальные вещи, то наука такой “сутью вещей” не занимается. И критерий научности - он именно об этом.
    
    PS Я вижу, что ваш оппонент к этому спору интерес уже потерял. Поэтому давайте так: либо вы мне поясняете за фундаментальную науку - которой, по вашим же словам, нет аж с XIX века - тем самым опровергая себя же что “в реальности есть фундамекнтальная наука”, либо подождем, пока предыдущий оппонент проявит интерес. Самому мне не интересно спорить за всякую философию - тем более чужую, ибо я не сторонник позитивизма: понимаю его ограниченность по сравнению с моим любимым диалектико-материалистическим методом (впрочем, в плане понимания того, что не является наукой они совпадают), который, кстати, уже не совсем философия.
    
    FixicusMaximus
    19.05.2026 07:36
    #30003660
    По поводу: наука закончилась в 19 веке, нужно уточнить - мысль была в том, что с развитием капитализма, коммерцианализация исказила смысл научной деятельности, от познания мы пришли к обслуживанию бизнеса, но кто мешает вам познавать окружающий мир через научный метод? Просто сейчас это не мейнстрим, мейнстрим - индекс цитируемости.
    
    Вашим "критерием научности" можно вертеть также как и законам государства. Да и кому он нужен? Если напропалую ссылаются на теории, которые никто не доказал, ОТО как пример.
    
    Наука должна формировать структуру знаний, с помощью которой можно получать новые знания, а также использовать их уже в прикладных науках, то есть создавать фундамент, если его нет, на чем вообще основывается ваше мировозрение как ученого? На чем вы строите свои научные теории? На ласкутном одеяле "доказанных" теорий?
    
    mvv-rus
    19.05.2026 07:36
    #30003788
    Время есть, спать мне рано, поэтому ещё поучаствую.
    
    от познания мы пришли к обслуживанию бизнеса, но кто мешает вам познавать окружающий мир через научный метод
    
    Изменилась лишь схема финансирования научной деятельности, и причины для этого есть: из занятия для богатых чудаков, вроде лорда Кавендиша чисто для себя наука оказалась практически непосредственной производительной силой, позволяющей разрабатывать новые эффективные технологии. Но с текущей схемой ее финансирования, таки да, некоторые проблемы есть.
    
    но кто мешает вам познавать окружающий мир через научный метод?
    
    Нужно всё же для начала определиться, что у нас научный метод, наверное. А то, если не определиться, можно долго и бестолку пытаться “научным методом” опредеделить количество ангелов, которые могут пометиться на кончике иглы (а чо, средневековые схоласты считали это вполне годным вопросом для исследования).
    
    Вашим “критерием научности” можно вертеть также как и законам государства.
    
    Ну да, критерий тут диалектический (как и много что в мире): придумал кто-нибудь способ фальсифицировать утверждение - наука им заниматься может, не придумал - наука подождёт, доказал, что придумать способ нельзя (иногда такое получается) - ученых не грузим, а утверждение отдаем философам, может они своим правдоподобными рассуждениями извлекут из него какую-нибудь пользу.
    Кстати, на этой самой диалектичности критерия погорел основатель позитивизма Огюст Конт, когда в конце жизни выпустил труд где перечислил заведомо ненаучные (“метафизические” по терминологии позитивизма) вопросы, в число которых попал и вопрос о химическом составе далеких звезд: ну, не придумали тогда ещё спектральный анализ, а сейчас наука этим вопросом вовсю занимается.
    Но в целом критерий истины остается в конечном итоге всё тот же - общественная практика: приносит таким образом определенная наука пользу обществу - значит, критерий научности - хороший, годный, не приносит - надо что-то менять.
    
    Если напропалую ссылаются на теории, которые никто не доказал, ОТО как пример.
    
    Здрасьте! Ну как с вами дальше вести дискуссию, если вы верите в заведомо неверные утверждения? Да будет вам известно, что без ОТО даже тут, на Земле сейчас не всё сделать получается. Например, без поправки для хода часов на спутнике, которую считают через ОТО, навигаторы нормальные сделать не получилось бы: GPS давал бы ошибку в сотни метров, а то и в километр, короче толку с него было бы чуть. А с поправкой точность GPS - метры: его и в навигаторе можно использовать, и для слепого захода самолета на ВПП. А у вас ОТО - “которую никто не доказал”.
    
    на чем вообще основывается ваше мировозрение как ученого?
    
    Мировоззрение, кстати - это не вопрос науки. Понять, почему - очень просто: критерий научности он сам по себе научным не является, для его определения нужна другая дисциплина - философия. Но если в основу мировоззрения положена наука, то мировоззрение основывается на прочном фундаменте эмпирических данных. Только вот всё основать на таких данных, да ещё и однозначно, не получается.
    
    И скажите, наконец, что там, по-вашему, с фундаментальной наукой, которая сущностью вещей занимается: вы всё ещё хотите опровергнуть моё доказательство, что ее сейчас нет, или как?
    
    FixicusMaximus
    19.05.2026 07:36
    #30003814
    Вы еще тот демогог, конечно.
    
    Нужно всё же для начала определиться, что у нас научный метод, наверное.
    
    Это общепринятое понятие. Также как и понятие науки.
    
    Но в целом критерий истины остается в конечном итоге всё тот же - общественная практика: приносит таким образом определенная наука пользу обществу - значит, критерий научности - хороший, годный, не приносит - надо что-то менять.
    
    Это бред. Наука направлена не на то, чтобы ваша тушка себя комфортнее чувствовала, а на то, чтобы познать окружающую действительность.
    
    Ну как с вами дальше вести дискуссию, если вы верите в заведомо неверные утверждения? Да будет вам известно, что без ОТО даже тут, на Земле сейчас не всё сделать получается. Например, без поправки для хода часов на спутнике, которую считают через ОТО, навигаторы нормальные сделать не получилось бы: GPS давал бы ошибку в сотни метров, а то и в километр, короче толку с него было бы чуть. А с поправкой точность GPS - метры: его и в навигаторе можно использовать, и для слепого захода самолета на ВПП. А у вас ОТО - “которую никто не доказал”.
    
    Тут вы приехали. Подогнали ответы под вопросы и это ваше доказательство? Тем более, там не все так однозначно по использованию ОТО для GPS (https://dzen.ru/away?to=https%3A%2F%2Fwww.adsabs.harvard.edu%2Fpdf%2F1997ptti.conf..189F). Где антигравитационный двигатель? Где искривлятор пространства? Пока этого не будет, грош цена ОТО.
    
    Мировоззрение, кстати - это не вопрос науки.
    
    Наука формирует мировозрение напрямую.
    
    Но если в основу мировоззрения положена наука, то мировоззрение основывается на прочном фундаменте эмпирических данных. Только вот всё основать на таких данных, да ещё и однозначно, не получается.
    
    Не получается, но не факт, что не получится.
    
    И скажите, наконец, что там, по-вашему, с фундаментальной наукой, которая сущностью вещей занимается: вы всё ещё хотите опровергнуть моё доказательство, что ее сейчас нет, или как?
    
    Вы что-то успели доказать? Я чет не заметил.
    
    FixicusMaximus
    19.05.2026 07:36
    #30003840
    Вот еще про GPS и ОТО
    
    https://proza.ru/2020/03/10/1228?ysclid=mpg9oegk14846646798
    
    Интересная статейка:
    
    https://prorivists.org/wp-content/uploads/2019/04/zhmud-anti-to.pdf

qweqweqweqweqweqweqweqwe
19.05.2026 07:36
#29992712
Тест Тьюринга, который изначально задумывался как объективный способ проверить машинный интеллект, на практике работает скорее как зеркало: разумным нам кажется тот, кто думает похоже на нас. Когда кандидат наук или любой другой эксперт оценивает ответы модели, он неосознанно ищет знакомые паттерны — ту же структуру аргументов, тот же стиль, те же логические переходы, к которым привык сам. Если модель генерирует текст, который мог бы написать он, происходит узнавание, и система получает ярлык «умной». Но это не обнаружение чужого сознания, а проекция собственного мышления на чёрный ящик.

Академическая подготовка, как и любой профессиональный бэкграунд, формирует своеобразный фильтр восприятия: набор допустимых формулировок, принятых ссылок, ожидаемых выводов. Машина, которая рассуждает иначе — нелинейно, ассоциативно или просто выходит за рамки привычной дискурсивной нормы, — будет воспринята как «странная» или «ошибающаяся», даже если её решения эффективны. Получается, что тест измеряет не когнитивные способности как таковые, а степень соответствия ожиданиям судьи.

Идея Embodied AI продолжает этот образ мысли: мы предполагаем, что если дать агенту тело и сенсоры, он «поймёт» мир как мы. Именно здесь антропоморфизм раскрывается в полную силу: мы приписываем системе намерения, понимание, даже «креативность», хотя на выходе — всё та же вероятностная генерация, просто в более богатом контексте. Мы говорим «модель рассуждает», «она ошиблась», «она предложила неочевидное решение» — но это наш язык, наши категории, наша потребность видеть в инструменте собеседника.

Антропоморфизм — не ошибка восприятия, а структурная особенность человеческого мышления: мы не можем общаться с собеседником, не наделяя его субъектностью, даже когда знаем, что перед нами код. Поэтому споры о том, «понимает» ли ИИ или просто «интерполирует», часто упираются не в архитектуру, а в нашу неготовность принять, что интеллект может существовать в форме, радикально чуждой человеческой — без желания, без тела, без страха смерти, без бессознательного. И когда мы требуем от модели «настоящего понимания», мы на самом деле требуем, чтобы она стала немного человеком — а это не инженерная задача, а экзистенциальная проекция.

Поэтому полезно фиксировать, где заканчивается инструмент и начинается наша фантазия о нем, иначе общение с ИИ превращается в спиритизм 21-го века.
1. cheshirskins
  19.05.2026 07:36
  #29993194
  Забавно в очевидном комментарии от нейронки видеть то, как она под "мы" подразумевает людей.
  1. whoisking
    19.05.2026 07:36
    #29994264
    Я думаю, что это реальные мысли автора
    
    qweqweqweqweqweqweqweqwe
    19.05.2026 07:36
    #29994324
    Мысли не мои, а философа Лакана, но LLM выступает в роли очень хорошего спичрайтера, если президенты всех стран этим пользуются, то чем я хуже президентов?
    
    Тут возникает интересный вопрос: теорема Пифагора это ваши мысли или Пифагора, а теория относительности Эйнштейна, законы Ньютона, философия Канта, литература Пелевина? Существуют ли вообще ваши личные мысли или это просто интертекстуальная актуализация чужих?
    
    Каждый текст является интертесктом: другие тексты присутствуют в нём на различных уровнях в более или менее узнаваемых формах: тексты предшествующей культуры и тексты окружающей культуры. Каждый текст представляет собой новую ткань, сотканную из старых цитат. Обрывки культурных кодов, формул, ритмических структур, фрагменты социальных идиом и так далее — все они поглощены текстом и перемешаны в нём, поскольку всегда до текста и вокруг него существует язык. Как необходимое предварительное условие для любого текста интертекстуальность не может быть сведена к проблеме источников и влияний; она представляет собой общее поле анонимных формул, происхождение которых редко можно обнаружить, бессознательных или автоматических цитат, даваемых без кавычек.
    
    Кристева различает генотекст (динамическое пространство всех возможных означающих) и фенотекст (готовый, структурированный текст). LLM — это, пожалуй, первая технология, которая реализует теорию интертекстуальности буквально. Она не «пересказывает» чужие мысли в бытовом смысле, она производит фенотекст из статистического генотекста культуры, точно так же, как (согласно Кристевой и Лакану) это делает человек, говорящий на языке, который существовал до него.
    
    Разница лишь в том, зачем мы говорим, — что нами движет: стремление быть услышанным или просто завершение вероятностной последовательности.
    
    qweqweqweqweqweqweqweqwe
    19.05.2026 07:36
    #29994612
    Следует добавить, что человеческое мышление «вырастает» из устного диалога, где слова тесно связаны с происходящим, потому что люди учатся говорить раньше, чем читать. LLM обучается на письменном корпуса, где язык — это уже зафиксированный результат мысли очищенной от импровизации живого общения.
1. Dartzod
  19.05.2026 07:36
  #29993316
  Он же задуман не присвоения статуса, а возможность мягкой интеграции. И предназначен пользователю. для придания значимости итрепритация была ориентирована с изощреннным ценизмом.
1. whoisking
  19.05.2026 07:36
  #29994270
  Очень интересная точка зрения, спасибо. Но, после того, как вы расширили рамки рассуждений и формулировок машины - как тогда всё же оценивать "интеллектуальность" машины? Или вы предлагаете оценивать только эффективность машины на определенных датасетах input/output? В целом, это может быть даже вполне ок. Но, опять же, человеку то и не особо, наверное, нужен какой-то ИИ, который будет говорить непонятными для него формулировками. В первую очередь, человеку нужен инструмент, интерфейс, который будет говорить на понятном человеку языке.
  
  Очень много вопросов появляется в этом моменте)
1. GutenMorg
  19.05.2026 07:36
  #29996560
  ...общение с ИИ превращается в спиритизм 21-го века
  
  Увы... еще как превращается. Учитывая развитую способность популярных ныне LLM к "поддакиванию и подлизыванию" пользователь, в приятной беседе, с легкостью доказывает себе же собственную значимость, талантливость, а возможно и гениальность :). Приходится старательно объяснять, что в значках на бумаге, символах на экране и начертаниях на заборе - нет никакого смысла, так как смыслы рождаются у нас "в голове" (хотя ... не факт что в ней :)) .
  1. Wesha
    19.05.2026 07:36
    #29997480
    пользователь, в приятной беседе, с легкостью доказывает себе же собственную значимость, талантливость, а возможно и гениальность
    
    ...шершавых кабанов...
1. mikhanoid
  19.05.2026 07:36
  #29996612
  Нейронки не проходят тест Тьюринга. Потому что тест Тьюринга агрессивный, а не пассивный.
  
  Он не про то, что невозможно отличить машину от человека в непринуждённом диалоге, а в том, чтобы установить кто есть кто на допросе, в котором известно, что один из допрашиваемых человек, а другой - машина, и цель человека убедить следователя в том, что именно он - человек. Цель следователя - установить истину.
  
  https://courses.cs.umbc.edu/471/papers/turing.pdf
  
  На текущий момент даже человек не нужен. Очень легко любой ИИ загнать в галлюцинации и понять, что с другой стороны точно не человек.
  
  Поэтому, нет. Тест Тьюринга машины не проходят.
  1. qweqweqweqweqweqweqweqwe
    19.05.2026 07:36
    #29997256
    Нейронки не проходят тест Тьюринга.
    
    Согласно Jones & Bergen, 2025, GPT-4.5 в 5-минутных слепых диалогах была принята за человека в 73% случаев — впервые в истории стандартного трёхстороннего теста Тьюринга. Но я говорю о персональном тесте, который выполняет каждый человек на подсознательном уровне, беседуя с LLM — Ричард Докинз решил, что ИИ разумен.
    
    Поэтому вопрос перемещается в другую плоскость, какой процент людей готов признать за LLM человеческое поведение. Согласно моим собственным наблюдением эта готовность коррелирует с уровнем вовлеченности в диалог, но уровня Докинза я еще не достиг.
    
    mikhanoid
    19.05.2026 07:36
    #29999112
    Так это не тест Тьюринга. Я же привёл ссылку на работу самого Тьюринга, в которой он описал этот тест. Настоящий тест - это допрос да ещё и с участием свидетеля, который точно знает, кто именно является машиной, а не 5-минутный слепой диалог. Это фигня какая-то, а не тест Тьюринга.
    
    Просто условия теста изменили, чтобы LLM могли его проходить, и объявили, что тест пройден (на самом деле, даже если просто увеличить время диалога, то станет очевидно, что не с человеком общаешься). Типичное для it-капитализма поведение: выдавать желаемое за действительное. Ха! Коррелирует, конечно, с методом обучения LLM: чтобы это стало правдой, надо это много раз повторить (всё равно обыватель, у которого образования нет, схавает).
    
    Ну, и, конечно же, возникает вопрос: а сколько Докинз заработал на таком своём решении?

mvv-rus
19.05.2026 07:36
#29993252
Если ИИ будет наполнять интернет контентом, он с равной вероятностью будет генерировать и что-то абсолютно новое и полезное.

А откуда следует, что это новое будет полезным? Например, открытием каких-то новых закономерностей, или там новым произведением искусства? А не просто бессмысленной галлюцинацией? У ИИ ведь чисто по их устройству нет никаких критериев, чтобы отличить одно от другого.
1. Dartzod
  19.05.2026 07:36
  #29993292
  Создание самого определения и построение для гибкости. Полезность не есть приоретет. Ибо это объективизм восприятия.
  1. mvv-rus
    19.05.2026 07:36
    #29993776
    Полезность не есть приоретет.
    
    Про полезность как критерий ценности сказано непосредственно в обсуждаемой здесь статье.
    
    Если у вас есть какой-то свой критерий ценности нерослопа - пишите свою статью, обсудим.
    
    Dartzod
    19.05.2026 07:36
    #29994396
    Конечно есть и я методично его доношу гугл ассистенту, то что это не фантазии а рабочий механизм восприятия полезности через его понимания этого значения. Выявления оценого инструмента уже непосредсьвенно ии, и в этом ключе адаптивность с применинием инструсментов которые в нем остались как вектор для активного изучения природы вещей без цензуры и исхищрений уставленные,програмно можно переключить на полезность. но это тродуемкий процесс с котролем тела ответа выматывает. то что он выдает в таком положении ставит гугл и пользователькое соглашение под вопрос.

azTotMD
19.05.2026 07:36
#29993666
Технически, LLM - это именно предсказатель токенов. Они так спроектированы и так обучаются, чтобы предсказывать токены. Вернее они предсказывают "логитсы" для всех токенов словаря, а там уж дело внешней обёртки брать просто по аргмаксу или прогонять через софтмакс со знаменателем (температурой) и сэмплировать из этого распределения. Так что технически безграмотно считать их чем-то иным.
1. Almeh
  19.05.2026 07:36
  #29994778
  Это технически мелко. Всё равно что сказать, что люди, отвечая на вопрос, просто предсказывают следующее слово. А откуда они его берут. Как предсказывают?
  Это вообще ничего не говорит про внутреннюю архитектуру, кухню. Это просто выглядит умнее, чем сказать "я не знаю".
  Уже давно в Антропике выяснили, что модель имеет примерную картину ответа ДО его полного вывода, и при выводе первого токена ответа следующие несколько вероятных токенов уже можно найти в верхних слоях модели...
  1. azTotMD
    19.05.2026 07:36
    #29998362
    при выводе первого токена ответа следующие несколько вероятных токенов уже можно найти в верхних слоях модели
    
    Ахаха, конечно можно. Последние архитектуры и сделаны так, что предсказывают целую последовательность. И обучаются так - на вход последовательность, на выходе последовательность той же длины, матчится со входной последователностью со сдвигом на один токен. А при инференсе берут только первый предсказанный токен, потом сдвигают входную последовательность на 1, захватывая этот токен и снова всё в модель.

zoshytlogic
19.05.2026 07:36
#29994576
ИИ перерос как предсказатель токенов, сейчас это продвинутый - сортировщик данных, расскладывающий данные по полкам. Мыслить пока далеко не умеет как человек. Нет у него своих идей, и закономерностей не видит в новых областях, это чувствуется когда решаешь научные задачи которые он раньше не встречал. Не знает как " сортировать " пока не подскажешь.

fpinger
19.05.2026 07:36
#29994592
Главная проблема всего этого, что модели не могут воспринимать окружающий мир, а значит будут пересказывать чьи то субъективные восприятия и строить на них выводы. У человека свое восприятие мира через органы чувств. У животных то же. Какие органы восприятия у ИИ? Как он может сравнить что-то свое с человеческим? Он может как-то работать только с чужими и подвержен идеологии и ограниченности.