
Коллапс моделей
Проблема коллапса моделей, или model collapse, сегодня хорошо известна. Если следующую генеративную модель обучать на текстах, созданных предыдущей, распределение обучающих данных начинает сужаться от поколения к поколению. Сначала исчезают редкие случаи: необычные обороты, маловероятные сочетания, локальные знания, отклонения от нормы. Затем беднее становится и сама норма.
Каждая отдельная генерация при этом может выглядеть убедительно: грамматически правильной, логичной и узнаваемой. Ошибка проявляется не как сразу заметный бред, а как постепенное сокращение пространства возможного.
Это похоже на последовательность копий: первая почти неотличима, десятая всё ещё узнаваема, сотая сохраняет общий контур, но теряет детали, которые никто не считал важными, пока они не исчезли.
Здесь необходима оговорка. Коллапс моделей не считается неизбежным: эксперименты показывают, что сохранение исходного человеческого корпуса данных и контролируемое добавление синтетических данных могут стабилизировать обучение. Но пока это больше похоже на способ сдерживать деградацию, чем на окончательное решение. Система по-прежнему требует постоянного внешнего якоря, а редкие части распределения могут исчезать первыми.
Для AI-компаний это хотя бы инженерная задача: корпус можно очистить, пересобрать, заново взвесить и повторить обучение.
У людей такой возможности нет.
Племя Бикура
В романе Дэна Симмонса «Гиперион» существует племя Бикура — потомки колонистов, исчезнувших несколько столетий назад. Они носят на груди крестоформ: паразитический организм, способный после смерти восстановить своего носителя.
Крестоформ исполняет одно из древнейших человеческих обещаний. Он побеждает смерть.
Но восстанавливает человека не идеально. Каждое новое воскрешение оказывается реконструкцией предыдущей реконструкции. Через множество циклов Бикура сохраняют общую человеческую форму, но утрачивают значительную часть того, что делало их людьми.
Они становятся ниже, грубее, интеллектуально беднее и почти неразличимыми друг от друга. Исчезают не только личные особенности, но и сами половые признаки. Их тела постепенно сглаживаются, становясь бесполыми, почти кукольными. Вместе с различиями исчезает способность к размножению.
Они бессмертны, но стерильны.
Это важная деталь. Коллапс не просто портит копию. Он удаляет всё, что не требуется для сохранения минимально узнаваемой формы. Пол, индивидуальность, интеллект и репродуктивная способность оказываются избыточной сложностью.
Крестоформ не уничтожил племя. Он сохранил его. Бикура продолжают существовать, говорить, совершать ритуалы и поддерживать устойчивое сообщество. Они утратили не жизнь, а способность породить продолжение, отличающееся от бесконечного восстановления уже существующей формы.
Это почти идеальная метафора коллапса модели.
Но, возможно, не модели следует считать её главным объектом.
Человек внутри обучающего контура
Обычная схема коллапса выглядит просто:
человеческие данные обучают модель;
модель создаёт синтетические данные;
синтетические данные обучают следующую модель.
Опасность видят в последнем переходе. Модель начинает учиться на собственных отражениях и постепенно принимает реконструкцию мира за сам мир.
Но современный контур уже длиннее:
человеческая культура создаёт модель;
модель производит тексты, изображения и объяснения;
люди читают их, используют и присваивают;
модельные конструкции входят в человеческий язык и мышление;
люди производят новые тексты уже под их влиянием;
следующая модель обучается на этих текстах как на человеческих.
На этом этапе различие между человеческими и синтетическими данными перестаёт быть достаточным.
Текст может быть полностью набран человеком и при этом оставаться продуктом модельного контура. Автор мог получить от модели структуру аргумента, исходные категории, примеры, допустимые возражения и представление о том, как должен звучать убедительный текст. Затем он переписал всё своими словами. Ни детектор, ни водяной знак уже не покажут происхождения мысли.
Формально это человеческий текст.
Но независимым человеческим источником он уже не является.
Модели не просто добавляют синтетический материал в интернет. Они меняют самих производителей «настоящих» данных. Человек перестаёт быть независимым источником вне системы и становится промежуточным звеном обратной связи.
Именно здесь техническая проблема превращается в культурную.
Улучшение без разнообразия
У этого процесса нет причины выглядеть как деградация.
Наоборот, в каждом отдельном случае модель часто улучшает результат. Она исправляет язык, предлагает структуру, расширяет список аргументов, убирает повторы и помогает человеку выразить то, что он не сумел бы сформулировать самостоятельно. Слабый автор начинает писать лучше. Медленный — быстрее. Неуверенный получает гладкий и убедительный текст.
Это реальная польза, а не маркетинговая иллюзия.
Но индивидуальное улучшение не гарантирует улучшения среды.
Если тысячи людей получают помощь от одних и тех же моделей, обученных на сходных корпусах и оптимизированных под сходные представления о хорошем ответе, их тексты могут становиться лучше по отдельности и одновременно — похожими друг на друга.
Система поднимает среднее качество и сокращает разброс.
Для отдельного пользователя это выгодный обмен. Для культуры разброс может быть важнее среднего. Новые направления возникают не из аккуратного воспроизведения нормы, а из отклонений: странных формулировок, непопулярных вопросов, локальных традиций, ошибочных догадок и людей, которые ещё не научились правильно объяснять, что имеют в виду.
Большинство таких отклонений ни к чему не приводит. Они выглядят как шум. Но без этого шума культура способна только улучшать уже известное.
Коллапс модели тоже начинается с удаления шума.
Исчезновение источника
Проблема состоит не только в том, что интернет заполняется автоматически созданными страницами. Одновременно сокращается производство первичного человеческого материала.
Человек, который получил ответ от чат-бота, не задаёт вопрос на форуме. Он не описывает ход попыток, не спорит с другими участниками и не оставляет публичную запись своей ошибки. Студент, получивший готовую структуру, не сохраняет промежуточные версии рассуждения. Специалист, использующий автоматическое резюме, может не написать собственного разбора статьи.
Интернет при этом не становится пустым. Напротив, текста становится больше.
Но исчезает след, по которому можно было восстановить, как человек пришёл к результату. Культура состоит не только из правильных ответов. Она состоит из историй ошибок, несовершенных наблюдений, конфликтующих объяснений и множества несовместимых способов смотреть на один объект.
Модель легко создаёт итог. Гораздо труднее создать независимый источник опыта, которого раньше не существовало.
Если первичное человеческое производство сокращается, чистые данные не просто скрываются под синтетическим мусором. Они перестают возникать.
Архив интернета до появления генеративных моделей способен сохранить прошлое. Он не способен создать новое настоящее.
Человеческий корпус
Разработчики моделей уже начинают относиться к проверенным человеческим данным как к ограниченному ресурсу. Старые книги, научные публикации, архивы сайтов и лицензированные коллекции приобретают новую ценность. На фоне синтетического потока происхождение данных становится частью их качества.
Можно представить, что техническая проблема будет хотя бы временно решена. Компании создадут закрытые чистые корпуса, научатся фильтровать автоматические тексты и сохранят достаточно человеческого материала для обучения следующих поколений моделей.
Но модель можно обучить на романе, написанном в 1980 году, а человеческий опыт 2040 года из него извлечь нельзя. Старый корпус способен поддерживать языковое разнообразие модели, но не способен заменить людей, которые должны произвести новое знание, новую культуру и новые формы восприятия.
Чтобы такие данные появились, недостаточно сохранить старые книги. Необходимо сохранить людей, способных создавать то, чего ещё нет в книгах.
Это совсем другая задача.
Почему маркировка не спасает
Маркировка синтетического контента необходима, но отвечает только на вопрос, кто непосредственно создал файл. Она не показывает, кто сформировал автора.
Человек может получить от AI план статьи, переписать результат, добавить личный пример и опубликовать всё под собственным именем. Такой текст действительно написал человек. Но культурная петля уже замкнулась.
Знание о происхождении тоже не отменяет влияния. Мы можем понимать, что читаем машинный текст, и всё равно усваивать его словарь, структуру, набор нормальных аргументов и границы допустимого вопроса.
Загрязнение культуры не обязательно происходит через тайную подмену человека машиной. Оно может быть открытым, добровольным и полностью осознанным.
Бикура знали о крестоформе.
Они считали его спасением.
Катастрофа без события
У культурного коллапса модели, вероятно, не будет одного момента, когда всё сломается.
Поиск станет немного менее полезным. Статьи — немного более похожими. Академические тексты — более гладкими и менее содержательными. Реклама, инструкции, новости и комментарии будут выглядеть достаточно нормально. Люди продолжат работать, спорить и публиковаться.
Каждое изменение по отдельности окажется слишком малым, чтобы назвать его катастрофой.
Затем новое состояние станет стандартом. Дети будут учиться писать в среде, где большая часть доступной речи уже прошла через модели. Молодые специалисты будут осваивать профессии по материалам, созданным или переработанным AI. Авторы будут определять хороший стиль по текстам, оптимизированным системами, которые сами обучались на предыдущем представлении о хорошем стиле.
Через несколько циклов сравнивать станет не с чем.
Мы заметим не начало процесса, а момент, когда он уже изменил инструменты наблюдения. Оценивать состояние культуры будут люди, сформированные этой культурой. Измерять сокращение разнообразия будут категории, уже возникшие внутри сокращённого пространства.
Культурная деградация способна изменить само представление о том, что считать потерей.
Проблема без решения
У этой статьи нет списка мер.
Можно маркировать синтетические тексты, сохранять архивы, ограничивать автоматическую генерацию в образовании и поддерживать авторов, которые работают с первичным опытом. Всё это, вероятно, имеет смысл. Но ни одна из этих мер не решает проблему, если сама проблема поставлена верно.
Мы пока не знаем даже, что именно следует измерять.
Словарное однообразие? Сокращение разнообразия аргументов? Исчезновение редких культурных форм? Зависимость людей от готовых структур? Снижение способности начать рассуждение без машинной подсказки? Всё это может быть отдельными симптомами. Но из них ещё не сложилась теория процесса.
У коллапса модели есть математическое описание и хотя бы приблизительно определённый объект: распределение обучающих данных. У человеческого аналога нет ни согласованного названия, ни единицы измерения, ни контрольной группы. Мы разворачиваем эксперимент над всей информационной средой одновременно, не сохраняя мира, с которым затем можно будет сравнить результат, и делаем это без какого-либо бэкапа.
Возможно, никакого человеческого коллапса не произойдёт. Люди могут адаптироваться к новому инструменту, как адаптировались к письму, печати, фотографии и интернету. Модели могут расширить пространство культуры, снизив цену выражения и дав голос тем, кто раньше не мог им воспользоваться.
Но эта оптимистическая версия тоже остаётся предположением.
Этого недостаточно, чтобы объявить катастрофу. Но достаточно, чтобы признать проблему и не относиться к ней как к обычному недостатку технологии, который исправят следующей версией.
Заметный ущерб здесь по определению будет поздним. Если исчезнут некоторые способы думать, некому будет составить их полный список. Если культура утратит способность производить радикально новое, она продолжит производить убедительные объяснения того, почему ничего важного не потеряно.
Модель можно переобучить на сохранённом корпусе. Людей нельзя вернуть к предыдущей версии.
В «Гиперионе» крестоформ не убивает своих носителей. Он продолжает исправно воскрешать их, раз за разом сохраняя минимально необходимую человеческую форму. Всё лишнее постепенно исчезает: сложность тела, различия между людьми, интеллект, пол.
Бикура понимают, что с ними случилось, последними.
Возможно, у нас пока нет решения.
Но это плохая причина не замечать проблему, конечная стадия которой буквально выглядит как общество без половых признаков.
Комментарии (19)

eugenk
27.06.2026 14:31А давайте исключим из предлагаемого сценария AI. Люди пишут тексты. Затем тексты попадают в общее культурное поле. Их воспринимают другие люди. Которые в свою очередь пишут новые тексты, уже под их влиянием. И т.д. Культура сама себя усредняет. И более того, АКТИВНО БОРЕТСЯ с разбросом. Например на плоскоземельщиков или эфирщиков смотрят мягко говоря как на чудаков. Не говоря уже про насильников и убийц, которые тоже экстремальные формы разброса. Не понимаю, что радикально изменится, если добавить сюда AI. Да, явление(усреднение культурного поля) существует. Но оно существовало задолго до AI, возможно вообще до появления членораздельной речи. И будет существовать, пока существует культура и человечество.
Как бы то ни было, спасибо за публикацию. Тема очень интересная.

sslock Автор
27.06.2026 14:31AI опасен не как цензор, а как предварительный нормализатор.
Я с базовой частью согласен: культура действительно всегда была контуром обратной связи и всегда в той или иной степени усредняла сама себя. Но тезис не в том, что AI впервые создаёт культурное усреднение, а в том, что меняется его режим.
Обычная культура чаще фильтрует уже появившиеся высказывания: через редакторов, споры, репутацию и т.п. AI входит раньше — прямо в момент производства текста, когда мысль ещё только ищет форму. Он предлагает структуру, категории, аргументы - представление о том, как должен звучать “хороший” ответ.
И это фильтр необычного типа. Он не обязательно отличает истинное от ложного или ценное от мусорного. Он тянет текст к связному, гладкому, узнаваемо нормальному. Для отдельного автора это часто полезно. Но на уровне среды такой фильтр может сглаживать различия ещё до того, как они успели стать видимыми.
Поэтому да, усреднение существовало всегда. Вопрос не в самом факте влияния, а в масштабе, скорости, невидимости и точке входа — до публикации, внутри самого процесса мышления и письма.

inkelyad
27.06.2026 14:31Он предлагает структуру, категории, аргументы - представление о том, как должен звучать “хороший” ответ.
Так культурные нормы, который инсталлируют нам в головы в процессе обучения - то же про это представление.
Он тянет текст к связному, гладкому, узнаваемо нормальному.
Смотри требования к сочинениям и прочему редактированию. Точно так же неведомое количество текстов так и не стали видимыми, потому что автор не смог достаточно гладко изложить и выкинул их в мусорную корзину или вообще не были написаны на бумаге.
Проблема в ИИ в том, что их пока слишком мало. Гораздо меньше, чем культур.
Вообще, идеально бы иметь у каждого личный (да еще не один), который постоянно дообучается вместе с владельцем. Но вычислительные мощности человечества такого не позволяют.

sslock Автор
27.06.2026 14:31Нормы и требования в процессе обучения — тоже схема не без греха, согласен. Но она, во-первых, долго эволюционировала вместе с нами в сложном мире; во-вторых, применяется разными живыми людьми с кучей ошибок и “мутаций”; в-третьих, всё же не настолько глобальна по охвату и скорости влияния.
У ИИ другая механика: один и тот же тип нормализации может одновременно оказаться встроен в миллионы актов письма и мышления. Причём до того, как мысль попала в культурный отбор.
Проблема не в самом наличии нормы. Проблема в том, что сейчас появляется очень удобный, массовый и относительно единообразный предварительный фильтр, который может срезать значимую часть вариативности ещё на входе.

inkelyad
27.06.2026 14:31Так и я про то же - проблема именно в единообразии.
Сильных, независимо обученных моделей просто мало. Это и нужно исправлять и почти наверняка понемногу исправится. Хотя это приведет то ли к другому риску то ли положительному результату - модели начнут друг с другом бороться на 'инстинктивном' уровне.

eugenk
27.06.2026 14:31AI входит раньше — прямо в момент производства текста, когда мысль ещё только ищет форму.
То же самое делает к примеру теория относительности. Любая высказываемая мысль должна быть с ней совместима. Да, это полезно, ибо отсеивает явный мусор. Но это и сужает поле поиска. Я не вижу что тут появление AI меняет КАЧЕСТВЕННО. Количественно - да, согласен, эффект усреднения наверняка значительно возрастает. Но ускорялось культурное усреднение по-моему вообще всегда, сколько существовала культура. Читайте например Тура Хеердала, об островах Океании. Он описывает одного старика, который в молодости ел людей и это считалось нормой. Ко времени когда там был Хеердал, это стало уже неприемлемым. А времени прошло всего-то менее одной человеческой жизни. Теперь усредняться начнёт ещё быстрее. Тут другое интересно. Ставит ли этот эффект предел развитию человечества ??? Возможно это и есть тот самый Великий Фильтр.

sslock Автор
27.06.2026 14:31То же самое делает к примеру теория относительности. Любая высказываемая мысль должна быть с ней совместима.
Не любая мысль, только в физике и связанных областях. Теоретически посты бьюти-блогеров тоже не должны противоречить ТО, но я не уверен, что там проверяют.
Сам пример хороший: фильтр ТО действительно может действовать на ранней стадии формулирования мысли. Но это фильтр в очень узкой, пусть и важной области. В других областях работают другие фильтры - со своей историей и своими глюками.
А на другом конце у нас условный миллиард пользователей ChatGPT, или вообще 146% всей популяции, если добавить юзеров Гугла. И вот здесь физик и бьюти-блогер действительно близки как никогда. Возможно, в таком масштабе количество уже начинает переходить в качество.

AlekseyPraskovin
27.06.2026 14:31представление о том, как должен выглядеть хороший ответ
Вы сейчас все систему образования, начиная с начальной школы и до докторской диссертации

vanxant
27.06.2026 14:31Ну если не брать Гитлера, наркобарыг и педофилов, то морально-приемлемые отклонения это тоже важная часть культуры.
Негативное отношение к эфирщикам досталось нам как эхо научных споров столетней давности, в которой победившая сторона повела себя, мягко скажем, некорректно, и заклевала, заклеймила и отменила множество достойных учёных, не успевших вовремя колебнуться вслед за линией партии. Пришедшая на смену эфиру квантовая теория поля с её кишащим виртуальными частицами вакуумом, конечно, намного более продвинута с точки зрения математики, но, по своей сути предлагает тот же эфир непонятной природы, только под брендом "физический вакуум". Будь интерферометр Майкельсона и Морли чуть поточнее (порядков на двадцать), они вполне могли бы уловить сигналы слияния чёрных дыр, хотя и не смогли бы понять, что именно они видят.
Понятно, что эфир сегодня является больше исторической концепцией, и всерьёз применять её на практике ну... очень странно. Но эта теория вполне может работать "устаревшей, но зато простой и понятной гипотезой" в качестве оппонента новым моделям. Точно так же, как ОТО не отменило закон гравитации Ньютона.
А вот модели Бикура быстро, за несколько итераций, отменят эфир совсем.

Hemml
27.06.2026 14:31Отличная статья, сформулировано то, что я сам пытался для себя сформулировать. Тут есть еще один аспект -- ИИ является слепком не самого нашего общества, а слепком интернета, в основном, плюс еще некоторого количества книг, то есть материального воплощения культуры. То есть уже является слепком слепка. И проблема возникла еще до появления LLM. Вы знаете, что далеко не все цвета, которые может различать глаз, раскладываются в RGB? Есть целая палитра, в основном, голубые и пурпурные цвета, которые никакой монитор не может отобразить. Дети, познающие мир через компьютер, никогда их не видели и даже не подозревают о существовании таких цветов. Точно так же есть целый пласт культуры, передающейся лично, не фиксируемой в книгах и не попадающей в интернет. Как раз всё то, что относится к методам и подходам, личному примеру, навыкам. В интернет попадает выжимка, результаты, а не то, как к ним приходишь, все неудачные попытки отбрасываются и не записываются. И результаты уже давно видны, молодежь не понимает, как браться за задачи, кроме типовых.
Мне кажется, спасти ситуацию могут "новые амиши" -- сообщество тех, кто принципиально не пользуется LLM, интернет используют как справочник, много общаются между собой напрямую и обсуждают решение своих задач и проблем.

alliumnsk
27.06.2026 14:31Если нейросеть будет работать с цветом, не приведенным для вывода на мониторе, а в исходном пространстве камеры, она эти цвета "увидит". Можно RGB отсчёты делать отрицательными. А часто ли встречаются эти годы цвета? Думаю, что потому мониторы и применяются с тремя детьми цветами, что нечасто.

sslock Автор
27.06.2026 14:31Да, согласен: фильтр на фильтр накручен. Везде и по нескольку раз. Пока вроде работает, но вопрос как раз в том, где предел устойчивости такой системы для сохранения разнообразия. В случае обычного коллапса модели всё происходит быстро и наглядно. А как это будет у людей, и будет ли вообще, — о том и статья.
«Новые амиши» — скорее да, но не как полноценное решение, а как способ немного разбавлять систему свежей кровью. Полная изоляция, боюсь, быстро приведёт к другой проблеме: они не сохранят культуру, а просто станут отдельной локальной веткой. Чтобы оставаться живым источником, всё равно придётся взаимодействовать с основной популяцией: учиться, читать, спорить.

Hemml
27.06.2026 14:31они не сохранят культуру, а просто станут отдельной локальной веткой. Чтобы оставаться живым источником, всё равно придётся взаимодействовать с основной популяцией: учиться, читать, спорить.
Так и остальная группа тоже не сохранит. Культура вообще передается только при живом общении. Как говорил один мой коллега: "Яблоки рождаются от яблони, а физики от физиков", это о важности научных школ. Но то же и всех остальных школ касается. И вот мы уже видим, как сначала учителя заменил гугл, а теперь уже LLM заменяет и сам гугл. Культура уже теряется.

sslock Автор
27.06.2026 14:31"Яблоки рождаются от яблони, а физики от физиков"
А от осинки не родятся апельсинки. Культура теряется, согласен. Можем себе позволить, может, даже и очень долго. А можем неудачно растерять критическую массу, которую никто не знает, — и здравствуй, светлое будущее: в эволюции есть только пока не проигравшие.
Mike_666
Проблема преувеличена.
Да феномен model collapse имеет место быть, но люди продолжают взаимодействовать с реальным миром.
В этот же самый мир все больше получают доступ и существующие системы 'ИИ' в виде потоков данных от приборов, камер, а где-то и влияя на него имея физическое воплощение от дрона до человекоподобного робота.
Коллапс мог бы нам грозить будь мы ограничены исходным корпусом и его производными, но это очевидно не так, хотя разработчикам моделей конечно придется разбираться с множеством входных и выходных модальностей, но кажется эта проблема решаемая.
janvarev
Главное, чтобы человеческое общество не начало изгонять/изолировать всех, кто не считает трактовку ИИ реального мира, единственно правильной.
Проблема не в данных; проблема в наличии желания их интерпретировать человеческим образом, генеря гипотезы и спотыкаясь на ошибках.
sslock Автор
Я не спорю с тем, что физический мир остаётся внешним источником данных. Это как раз причина, почему грубый технический model collapse, вероятно, можно сдерживать: датчики, роботы, эксперименты, код, симуляции и реальные действия дают внешний якорь.
Но статья не о полной изоляции моделей от реальности. Она о другом: человеческий культурный слой сам начинает проходить через модели. Человек получает от AI не только формулировку, но и структуру аргумента, набор примеров, стиль, критерий «хорошего ответа». Потом он пишет уже сам — и этот текст снова считается человеческим.
Камера может проверить, есть ли на фото собака. Она не проверит, сохранилась ли в культуре редкая мысль, локальная форма, странный аргумент или самостоятельный способ видеть мир. Поэтому мультимодальность помогает против технического коллапса, но не снимает вопрос о человеческом.
Mike_666
Человеческому культурному слою люди всю известную историю пытаются друг другу model collapse устроить, в разных масштабах и с разной успешности.