Самая мощная публично доступная модель оказалась дороже и медленнее. Разбираю релиз и рассуждаю, почему удешевление и ускорение, возможно, важнее роста потолка

9 июня Anthropic выпустила Claude Fable 5 — первую публично доступную модель класса Mythos. Той самой Mythos, которую в апреле компания сочла настолько мощной (и потенциально опасной в части кибербезопасности), что не стала открывать публике, а раздала ограниченному кругу организаций в рамках программы Project Glasswing. Спустя меньше трёх месяцев Anthropic решила, что готова дать публике модель того же класса — с оговорками.

Релиз я разобрал по первоисточникам (CNBC, TechCrunch, Axios, Fortune, Inc.), и он действительно впечатляет по цифрам. Но чем дольше я его читал, тем сильнее у меня крепло одно ощущение, которым и хочу поделиться. Оно не про то, что Fable 5 плохая. Оно про то, что вектор всей этой гонки, возможно, смещён не туда, куда стоило бы.

Сначала факты, потом мысль.


Что реально выпустили

Fable 5 — это публично доступная версия модели класса Mythos. Под капотом, по словам Anthropic, у Fable 5 и Mythos одна и та же базовая модель. Разница в защитах.

Ключевые факты из официальных источников:

  • Заявленные способности. Anthropic называет Fable 5 «state-of-the-art практически на всех протестированных бенчмарках» — софтверная инженерия, knowledge work, vision, научные исследования. По заявлению компании, обходит конкурентов от OpenAI и Google DeepMind на всех бенчмарках.

  • Цена. Вдвое дороже моделей Opus. Это самый дорогой релиз Anthropic. Через API — порядка 10/50 долларов за миллион токенов (input/output).

  • Защиты. Главная фишка релиза. В высокорисковых областях — кибербезопасность, биология, химия, дистилляция — модель блокирует ответ и откатывается на Claude Opus 4.8. То есть на чувствительных запросах вы получаете ответ от менее мощной модели, а не от Fable.

  • Доступ по подписке — временный. До 22 июня Fable 5 включена в планы Pro, Max, Team и seat-based Enterprise без доплаты. С 23 июня её убирают из подписок, дальше — только через usage-кредиты или API, с обещанием вернуть в подписку «так быстро, как сможем».

  • Расход лимитов. В период бесплатного доступа Fable 5 тратит лимиты по удвоенной ставке относительно Opus. Параллельно Anthropic выкатила Mythos 5 — апгрейд для тех, у кого уже был доступ к Mythos Preview (партнёры Project Glasswing, около 150+ организаций в 15 странах). Для Mythos 5 часть защит снимается, и его разворачивают в том числе в сотрудничестве с правительством США для киберзащитников и операторов критической инфраструктуры.


Механика защит — это технически любопытно

Прежде чем переходить к рассуждению, отдам должное инженерному решению защит. Оно нетривиальное.

Обычно safety в LLM реализуется как отказ — модель распознаёт опасный запрос и говорит «не могу помочь». Здесь подход другой: роутинг с понижением. Fable 5 не отказывает — она определяет, что запрос попадает в высокорисковую зону, и молча перенаправляет его на Opus 4.8, менее мощную модель. Пользователь получает ответ, просто не от топовой модели.

Логика понятна: если самая опасная способность Fable — это поиск и эксплуатация уязвимостей и помощь в биологии на уровне «суперчеловека», то для этих конкретных областей достаточно ответа модели послабее, у которой таких способностей нет. А во всём остальном — пожалуйста, полная мощь.

Anthropic заявляет, что red team прогнала больше 1000 часов тестирования, пытаясь обойти эти защиты, и не нашла ни одного рабочего джейлбрейка. Глава продукта Dianne Penn сказала Axios, что компания «намеренно консервативна» на старте — то есть часть легитимных научных и security-запросов тоже будет улетать на Opus, и со временем эти ложные срабатывания планируют сокращать.

Это, кстати, прямо отражено в телеграм-пересказах: «на некоторые запросы скатывается к Opus, какие именно — модель решает сама». Формулировка корявая, но суть верная. И да, на практике это может мешать тем, кто делает легальную security-работу — будет периодически получать ответ от модели послабее без явного объяснения.

Сам факт, что роутинг решает модель, а не человек, и что граница «высокорисковости» непрозрачна — это отдельная тема для дискуссии о том, кто и как проводит эту черту.


А теперь то, что меня смущает

Здесь я перехожу от фактов к мнению, и оно дискуссионное — буду рад возражениям в комментариях.

Читая релиз, я ловлю себя на одной и той же мысли. Каждый новый фронтир-релиз — это «мы круче всех на всех бенчмарках, это поражает, и это так опасно, что нужны особые защиты». Fable 5 не исключение: state-of-the-art, обходит всех, настолько мощная, что родительскую Mythos сначала вообще побоялись выпускать.

Но если отвлечься от риторики и посмотреть на то, что пользователь реально получает:

  • Модель дороже — вдвое от Opus, самый дорогой релиз компании.

  • Модель тратит лимиты быстрее — двойная ставка даже в щедрый период.

  • Доступ временный — три недели бесплатно, потом за деньги, и неизвестно когда вернут.

  • На части запросов она сама себя понижает до предыдущей модели. И всё это ради прироста на бенчмарках, который впечатляет на графике, но не ощущается как переход в новое качество. Это не AGI-момент, после которого работа меняется радикально. Это «ещё немного лучше, но дольше и дороже».

Мой тезис: движение в сторону ускорения и удешевления как минимум так же важно, как рост потолка способностей. А может, и важнее.


Почему удешевление важнее, чем кажется

Это не просто брюзжание про цены. За этим стоит содержательный аргумент про то, что вообще можно построить.

Исторически в вычислениях главные сдвиги давал не рост абсолютной мощности, а падение стоимости единицы. Мейнфреймы были мощными, но мир изменили дешёвые персоналки. Дорогая модель, доступная немногим под особые задачи, полезна узкому кругу. Дешёвая и быстрая модель меняет то, какие продукты вообще возможны.

Применительно к LLM это особенно остро из-за агентных сценариев. Агент, который крутится в цикле — читает, думает, вызывает инструменты, проверяет себя — делает не один вызов модели, а десятки и сотни. На таких паттернах цена и латентность каждого вызова умножаются. Модель, которая «на 5% умнее, но вдвое дороже и медленнее», в агентном цикле проигрывает более дешёвой и быстрой почти всегда. Потому что вместо одного запроса к гению ты делаешь сто запросов, и сто раз платишь надбавку за гениальность, которая на большинстве шагов не нужна.

То же с кодингом, ради которого многие из нас и держат подписку. В реальной работе важнее быстрый отклик и приемлемая цена на тысячах итераций, чем последние проценты на бенчмарке, которые проявляются на редких сложных задачах. «Дольше думает, но чуть лучше» — для интерактивного кодинга часто хуже, чем «быстро и нормально».

Поэтому когда я вижу, что самый громкий релиз года — это «мощнее, но дороже и медленнее, и доступ ограничен», у меня возникает вопрос: а мы точно оптимизируем то, что нужно большинству пользователей? Или мы оптимизируем то, что красиво смотрится на слайде с бенчмарками и важно для узкого сегмента (киберзащита, биология, фронтир-ресёрч), у которого есть бюджет на максимум?


Контраргумент, который честно надо привести

Чтобы не быть односторонним — есть и сильный контртезис, и я его понимаю.

Удешевление обычно идёт следом за ростом потолка. Сначала появляется дорогая мощная модель, потом её дистиллируют, оптимизируют, делают дешёвую версию с почти теми же способностями. Нельзя удешевить то, чего ещё нет. С этой точки зрения дорогой фронтир — это R&D-инвестиция, которая через год превратится в дешёвый Sonnet/Haiku-аналог, доступный всем.

И структура самих линеек это подтверждает: есть быстрые дешёвые модели для масштаба и дорогие топовые для задач, где не жалко заплатить за максимум. То есть индустрия не игнорирует удешевление — она движется по обоим векторам, просто фронтир-релизы громче звучат.

Плюс есть задачи, где потолок реально решает: поиск уязвимостей в критической инфраструктуре, drug design, научный ресёрч. Там «на 5% лучше» может означать найденную уязвимость или ненайденную, и цена вопроса несопоставима со стоимостью токенов. Для этих задач Fable/Mythos оправданы любой ценой.

Так что честный вывод не «фронтир не нужен», а «фронтир и удешевление — разные продукты для разных задач, и не стоит мерить один линейкой другого».


Что до временного доступа

Отдельно про «три недели бесплатно, потом лимиты улетят в секунду». Это нормальная экономика запуска дорогой модели, и относиться к ней стоит трезво.

Промо-период нужен Anthropic, чтобы собрать нагрузку, фидбек и данные о реальном использовании, субсидируя дорогой инференс из своего кармана. Потом ставится реальная цена. Это не «невиданная щедрость», которая станет новой нормой — это demo. Строить рабочие процессы в расчёте на бесплатный Fable 5 после 22 июня не стоит. Стоит воспринять эти три недели именно как возможность пощупать и понять, нужна ли вам эта модель за деньги под ваши конкретные задачи, или Opus/Sonnet закрывают их с запасом по цене.

Особенно с учётом двойного расхода лимитов: в щедрый период вы реально протестируете немного, прежде чем упрётесь.

И ещё момент про контекст релиза, который стоит держать в голове: Anthropic, по сообщениям, готовится к IPO. Громкий релиз самой мощной модели прямо перед выходом на биржу — это в том числе про инвестиционный momentum, а не только про пользу пользователю. Это не делает модель хуже, но объясняет, почему риторика «капец как это поражает и опасно» накручена.


Резюме

Fable 5 — реальный и сильный релиз: первая публичная модель класса Mythos, с нетривиальным инженерным решением защит через роутинг на Opus в высокорисковых зонах. Если вам нужен абсолютный максимум способностей и вы готовы платить вдвое от Opus — это лучшее, что сейчас доступно публично.

Но мне кажется важным проговорить мысль, которая за хайпом теряется: рост потолка способностей — не единственная ось прогресса, и, возможно, не самая важная для большинства. Для агентных систем, для повседневного кодинга, для массовых продуктов удешевление и ускорение дают больше совокупной пользы, чем очередные проценты на бенчмарке. Дешёвый и быстрый инференс меняет, что вообще можно построить. Дорогой топ полезен немногим задачам, где не жалко заплатить.

Прогресс не остановить, и фронтир нужен — хотя бы как R&D, который потом дистиллируется в доступное. Но когда самый громкий релиз года звучит как «мощнее, но дороже, медленнее и временно» — это хороший повод спросить себя, ту ли ось мы привыкли считать главной.

А что думаете вы — что для вашей работы важнее: потолок способностей или цена и скорость? Интересно, совпадёт ли ощущение.


Источники: официальный анонс Anthropic, репортажи CNBC, TechCrunch, Axios, Fortune, Inc., NBC News от 9 июня 2026. Цифры по ценам и датам доступа приведены на момент релиза и могут измениться — проверяйте актуальное на сайте Anthropic.

Комментарии (30)


  1. Brazil
    09.06.2026 23:08

    Сегодя весь день работал с Opus 4.8
    Истратил больше 100$.
    Искал ошибку в драйвере WiFi, возникшую утром. Не поднималась точка доступа в дивайсе.
    Opus 4.8 ошибку не нашел, предлагал отключить то одно, то другое. Напичкал весь драйвер логами так, что даже стало страдать быстродействие.
    А сейчас включил Fable 5 и он мигом (ну может за 10 мин реальных) без логов, однозначно указал проблему в путанице номеров интерфейсов после какого-то комита (напутал сам Opus 4.8, делая очередную фичу). Истратил где-то 8 $
    Вывод: мощные модели - экономят.


    1. bambazamba
      09.06.2026 23:08

      Fable 5 is also more token-efficient than past Claude models: on Cognition’s FrontierCode evaluation, which tests whether models can pass difficult coding tasks while meeting the standards of high-quality production codebases, Fable 5 scores highest among frontier models, even at medium effort.


    1. sami777
      09.06.2026 23:08

      мой вывод: попробуй не более двух-трех раз и если не получается, то уже и не получится.


    1. netricks
      09.06.2026 23:08

      Вы знаете, это не показатель. Ситуации, когда один агент не может разобраться с багом, а второй быстро всё находит - бывают и при переходе от сильных моделей к более слабым. Вот если бы, неудачу потерпели opus, gpt, deepseek, а fable бы быстро нашёл, это бы был более верный эксперимент


    1. weerf
      09.06.2026 23:08

      Поздравляю с умением доводить задачу до результата.


    1. Katasonov
      09.06.2026 23:08

      Или Вывод: повезло.


    1. LuciusWill
      09.06.2026 23:08

      Про это автор и говорил. Мощные модели нужны для сложных задач. Но нет особого смысла решать дорогой моделью все 100% задач. Условно, 80% времени используем Sonnet, а в 20% Opus или Fable.

      Правда, в тексте автор всё-таки не указал что мощные модели могут ещё и сэкономить деньги, на сложных задачах. Там скорее речь шла, что мол за критических задачах надо больше ума, и тут бо́льшие траты имеют смысл.


  1. Dreams_and_magic
    09.06.2026 23:08

    Сочетание "дёшево и мощно" - это про китайские модели, и, как ни странно, про Гугл :) В результате ценовых войн на сверхконкурентом рынке получаем приличное качество по ненапряжным ценам в API доступе.
    Но у "фронтира" есть подписка... :)


  1. SensDj
    09.06.2026 23:08

    а зачем вы убрали из вступительного абзаца фразу "Одно замечание: тон статьи — умеренно критический к индустрии в целом, не к Anthropic конкретно. Если хочешь сместить акцент (сделать жёстче или, наоборот, нейтральнее) — скажу как поправить. И поскольку это мнение под твоим именем, финальное слово за тобой — перечитай, согласен ли ты с формулировками, прежде чем публиковать." ?
    Я успел скопировать :)


    1. sergeytolkachyov
      09.06.2026 23:08

      И скриншот есть )


      1. Arhammon
        09.06.2026 23:08

        Интересно не ужели так сложно сделать вывод комментариев модели ну там ярко красным или ядовито-зеленым, ну чтоб не пропускали? Впрочем если не смотреть и CtrlA-CtrlC-CtrlV, то это не поможет)


        1. supermuxa
          09.06.2026 23:08

          Так там поди через какого-нить агента. "Посмотри что нового про ИИ, напиши и запости на хабр"


      1. Areso
        09.06.2026 23:08

        @Exosphere , @Boomburum , а представители администрации не хотят ли заблокировать автора к черту?


    1. GritsanY
      09.06.2026 23:08

      RSS все помнит


      1. FreakII
        09.06.2026 23:08

        Да


    1. sgnppv
      09.06.2026 23:08

      Огромная простыня нейрослопа - надо же, мне не показалось.


    1. AKimovd
      09.06.2026 23:08

      Пора уже на хабре блокировать нейрослоп. Всегда раньше сюда приходил за личным мнением, а теперь как будто уже не хочется читать.

      Спросить у нейронки я и сам могу.


    1. LuciusWill
      09.06.2026 23:08

      У меня тоже было какое-то смутное ощущение. Вроде бы, написано как не литературный, естественный монолог. Но местами проскакивают едва выделяющиеся странности.

      А вот такое вообще свойственно нейронкам "Отдельно про «три недели бесплатно, потом лимиты улетят в секунду»."

      В целом, я не против помощи нейронок в текстах. Главное - тоже подумать и проконтролировать текст. А не отдавать всю работу на плечи нейронки. Но замечать это всё-таки забавно.


  1. kholomyanskiy
    09.06.2026 23:08

    Сейчас антропики и прочие палят инвесторские бабки. Они имеют свойство заканчиваться. либо будут выпускать урезанные модели либо давать доступ к нормальным по дорогому апи имхо


    1. terraincognita07
      09.06.2026 23:08

      Согласен, всё будет только дорожать.


  1. GrixaYrev
    09.06.2026 23:08

    Почему совсем не учитывается военное применение? Там цена играет ещё меньшую роль. В целом странное использование местоимения "мы". Цель у них – деньги зарабатывать, а наше удобство – тут уж как повезет.


    1. LuciusWill
      09.06.2026 23:08

      Часто вижу этот аргумент. Странное у вас мышление. Как будто бы вы рынок в глаза никогда не видели. Антропики могли бы плевать на пользователей, если бы они были монополистами. А конкуренты дышат им в спину. Так что, чтобы зарабатывать те самые деньги и не разориться, им приходится думать и об удобстве пользователей.

      Чем больше компания плюёт на пользователей, тем активнее они уходят к конкурентам.


  1. simplymad
    09.06.2026 23:08

    Уже все это выглядит для многих как наркотик/курение. Без подключения к задачам любимой модели уже и не строится решение. Братья Либерманы в интервью рассуждали, что мы идем по пути где 2 варианта: 1) все доступно всем, 2) все в руках корпораций. Вот тут явно мы движемся к 2.


    1. LuciusWill
      09.06.2026 23:08

      Ну, как показывает история, опасность корпораций несколько преувеличена. Государства и политики куда опаснее.


    1. fray2000
      09.06.2026 23:08

      Вот в этом и главная ошибка автора, он предполагает, что все это в конечном счёте создаётся для большинства. Это в корне противоречит здравому смыслу. Зачем дворнику условно давать возможность выполнять задачи профессора? Кто тогда будет двор мести? Роботы? А дворник тогда что будет делать? Дальнейшая цепочка думаю очевидна


      1. simplymad
        09.06.2026 23:08

        Хорошая гипотеза. И сейчас все больше подтверждений: крутые стартапы где вкачано млрд. долларов нанимают phD для обучения моделей. Явно же чтобы в конечном счете эти phD пошли подметать улицы или психологами для богачей, кому повезло (только они смогут позволить реальных людей).


  1. fermentum
    09.06.2026 23:08

    А можно промпт статьи огласить? Мне для друга.


  1. alphyE
    09.06.2026 23:08

    качество работы на порядок выше чем у gpt 5.5 и opus 4.8, модель ошибается в разы меньше


  1. anewmur
    09.06.2026 23:08

    Писать такой длинный текст ради одной тревиальной мысли - не уважать читателя. Хотя бы развернуть стоило, минусы, плюсы. Но вдвойне смешнее находить llm штампы в тексте посвященном обсуждению llm


  1. DoctorKrolic
    09.06.2026 23:08

    Интересно, а когда она сама даунгрейдиться, то цену всё равно по максимуму платишь? Если да, то нормальный они такой подход пропихивают: "Мы будем подсовывать вам модель потупее когда захотим, вам об этом напрямую никак не расскажем, но при этом будем драть полную стоимость".