Самая мощная публично доступная модель оказалась дороже и медленнее. Разбираю релиз и рассуждаю, почему удешевление и ускорение, возможно, важнее роста потолка
9 июня Anthropic выпустила Claude Fable 5 — первую публично доступную модель класса Mythos. Той самой Mythos, которую в апреле компания сочла настолько мощной (и потенциально опасной в части кибербезопасности), что не стала открывать публике, а раздала ограниченному кругу организаций в рамках программы Project Glasswing. Спустя меньше трёх месяцев Anthropic решила, что готова дать публике модель того же класса — с оговорками.
Релиз я разобрал по первоисточникам (CNBC, TechCrunch, Axios, Fortune, Inc.), и он действительно впечатляет по цифрам. Но чем дольше я его читал, тем сильнее у меня крепло одно ощущение, которым и хочу поделиться. Оно не про то, что Fable 5 плохая. Оно про то, что вектор всей этой гонки, возможно, смещён не туда, куда стоило бы.
Сначала факты, потом мысль.
Что реально выпустили
Fable 5 — это публично доступная версия модели класса Mythos. Под капотом, по словам Anthropic, у Fable 5 и Mythos одна и та же базовая модель. Разница в защитах.
Ключевые факты из официальных источников:
Заявленные способности. Anthropic называет Fable 5 «state-of-the-art практически на всех протестированных бенчмарках» — софтверная инженерия, knowledge work, vision, научные исследования. По заявлению компании, обходит конкурентов от OpenAI и Google DeepMind на всех бенчмарках.
Цена. Вдвое дороже моделей Opus. Это самый дорогой релиз Anthropic. Через API — порядка 10/50 долларов за миллион токенов (input/output).
Защиты. Главная фишка релиза. В высокорисковых областях — кибербезопасность, биология, химия, дистилляция — модель блокирует ответ и откатывается на Claude Opus 4.8. То есть на чувствительных запросах вы получаете ответ от менее мощной модели, а не от Fable.
Доступ по подписке — временный. До 22 июня Fable 5 включена в планы Pro, Max, Team и seat-based Enterprise без доплаты. С 23 июня её убирают из подписок, дальше — только через usage-кредиты или API, с обещанием вернуть в подписку «так быстро, как сможем».
Расход лимитов. В период бесплатного доступа Fable 5 тратит лимиты по удвоенной ставке относительно Opus. Параллельно Anthropic выкатила Mythos 5 — апгрейд для тех, у кого уже был доступ к Mythos Preview (партнёры Project Glasswing, около 150+ организаций в 15 странах). Для Mythos 5 часть защит снимается, и его разворачивают в том числе в сотрудничестве с правительством США для киберзащитников и операторов критической инфраструктуры.
Механика защит — это технически любопытно
Прежде чем переходить к рассуждению, отдам должное инженерному решению защит. Оно нетривиальное.
Обычно safety в LLM реализуется как отказ — модель распознаёт опасный запрос и говорит «не могу помочь». Здесь подход другой: роутинг с понижением. Fable 5 не отказывает — она определяет, что запрос попадает в высокорисковую зону, и молча перенаправляет его на Opus 4.8, менее мощную модель. Пользователь получает ответ, просто не от топовой модели.
Логика понятна: если самая опасная способность Fable — это поиск и эксплуатация уязвимостей и помощь в биологии на уровне «суперчеловека», то для этих конкретных областей достаточно ответа модели послабее, у которой таких способностей нет. А во всём остальном — пожалуйста, полная мощь.
Anthropic заявляет, что red team прогнала больше 1000 часов тестирования, пытаясь обойти эти защиты, и не нашла ни одного рабочего джейлбрейка. Глава продукта Dianne Penn сказала Axios, что компания «намеренно консервативна» на старте — то есть часть легитимных научных и security-запросов тоже будет улетать на Opus, и со временем эти ложные срабатывания планируют сокращать.
Это, кстати, прямо отражено в телеграм-пересказах: «на некоторые запросы скатывается к Opus, какие именно — модель решает сама». Формулировка корявая, но суть верная. И да, на практике это может мешать тем, кто делает легальную security-работу — будет периодически получать ответ от модели послабее без явного объяснения.
Сам факт, что роутинг решает модель, а не человек, и что граница «высокорисковости» непрозрачна — это отдельная тема для дискуссии о том, кто и как проводит эту черту.
А теперь то, что меня смущает
Здесь я перехожу от фактов к мнению, и оно дискуссионное — буду рад возражениям в комментариях.
Читая релиз, я ловлю себя на одной и той же мысли. Каждый новый фронтир-релиз — это «мы круче всех на всех бенчмарках, это поражает, и это так опасно, что нужны особые защиты». Fable 5 не исключение: state-of-the-art, обходит всех, настолько мощная, что родительскую Mythos сначала вообще побоялись выпускать.
Но если отвлечься от риторики и посмотреть на то, что пользователь реально получает:
Модель дороже — вдвое от Opus, самый дорогой релиз компании.
Модель тратит лимиты быстрее — двойная ставка даже в щедрый период.
Доступ временный — три недели бесплатно, потом за деньги, и неизвестно когда вернут.
На части запросов она сама себя понижает до предыдущей модели. И всё это ради прироста на бенчмарках, который впечатляет на графике, но не ощущается как переход в новое качество. Это не AGI-момент, после которого работа меняется радикально. Это «ещё немного лучше, но дольше и дороже».
Мой тезис: движение в сторону ускорения и удешевления как минимум так же важно, как рост потолка способностей. А может, и важнее.
Почему удешевление важнее, чем кажется
Это не просто брюзжание про цены. За этим стоит содержательный аргумент про то, что вообще можно построить.
Исторически в вычислениях главные сдвиги давал не рост абсолютной мощности, а падение стоимости единицы. Мейнфреймы были мощными, но мир изменили дешёвые персоналки. Дорогая модель, доступная немногим под особые задачи, полезна узкому кругу. Дешёвая и быстрая модель меняет то, какие продукты вообще возможны.
Применительно к LLM это особенно остро из-за агентных сценариев. Агент, который крутится в цикле — читает, думает, вызывает инструменты, проверяет себя — делает не один вызов модели, а десятки и сотни. На таких паттернах цена и латентность каждого вызова умножаются. Модель, которая «на 5% умнее, но вдвое дороже и медленнее», в агентном цикле проигрывает более дешёвой и быстрой почти всегда. Потому что вместо одного запроса к гению ты делаешь сто запросов, и сто раз платишь надбавку за гениальность, которая на большинстве шагов не нужна.
То же с кодингом, ради которого многие из нас и держат подписку. В реальной работе важнее быстрый отклик и приемлемая цена на тысячах итераций, чем последние проценты на бенчмарке, которые проявляются на редких сложных задачах. «Дольше думает, но чуть лучше» — для интерактивного кодинга часто хуже, чем «быстро и нормально».
Поэтому когда я вижу, что самый громкий релиз года — это «мощнее, но дороже и медленнее, и доступ ограничен», у меня возникает вопрос: а мы точно оптимизируем то, что нужно большинству пользователей? Или мы оптимизируем то, что красиво смотрится на слайде с бенчмарками и важно для узкого сегмента (киберзащита, биология, фронтир-ресёрч), у которого есть бюджет на максимум?
Контраргумент, который честно надо привести
Чтобы не быть односторонним — есть и сильный контртезис, и я его понимаю.
Удешевление обычно идёт следом за ростом потолка. Сначала появляется дорогая мощная модель, потом её дистиллируют, оптимизируют, делают дешёвую версию с почти теми же способностями. Нельзя удешевить то, чего ещё нет. С этой точки зрения дорогой фронтир — это R&D-инвестиция, которая через год превратится в дешёвый Sonnet/Haiku-аналог, доступный всем.
И структура самих линеек это подтверждает: есть быстрые дешёвые модели для масштаба и дорогие топовые для задач, где не жалко заплатить за максимум. То есть индустрия не игнорирует удешевление — она движется по обоим векторам, просто фронтир-релизы громче звучат.
Плюс есть задачи, где потолок реально решает: поиск уязвимостей в критической инфраструктуре, drug design, научный ресёрч. Там «на 5% лучше» может означать найденную уязвимость или ненайденную, и цена вопроса несопоставима со стоимостью токенов. Для этих задач Fable/Mythos оправданы любой ценой.
Так что честный вывод не «фронтир не нужен», а «фронтир и удешевление — разные продукты для разных задач, и не стоит мерить один линейкой другого».
Что до временного доступа
Отдельно про «три недели бесплатно, потом лимиты улетят в секунду». Это нормальная экономика запуска дорогой модели, и относиться к ней стоит трезво.
Промо-период нужен Anthropic, чтобы собрать нагрузку, фидбек и данные о реальном использовании, субсидируя дорогой инференс из своего кармана. Потом ставится реальная цена. Это не «невиданная щедрость», которая станет новой нормой — это demo. Строить рабочие процессы в расчёте на бесплатный Fable 5 после 22 июня не стоит. Стоит воспринять эти три недели именно как возможность пощупать и понять, нужна ли вам эта модель за деньги под ваши конкретные задачи, или Opus/Sonnet закрывают их с запасом по цене.
Особенно с учётом двойного расхода лимитов: в щедрый период вы реально протестируете немного, прежде чем упрётесь.
И ещё момент про контекст релиза, который стоит держать в голове: Anthropic, по сообщениям, готовится к IPO. Громкий релиз самой мощной модели прямо перед выходом на биржу — это в том числе про инвестиционный momentum, а не только про пользу пользователю. Это не делает модель хуже, но объясняет, почему риторика «капец как это поражает и опасно» накручена.
Резюме
Fable 5 — реальный и сильный релиз: первая публичная модель класса Mythos, с нетривиальным инженерным решением защит через роутинг на Opus в высокорисковых зонах. Если вам нужен абсолютный максимум способностей и вы готовы платить вдвое от Opus — это лучшее, что сейчас доступно публично.
Но мне кажется важным проговорить мысль, которая за хайпом теряется: рост потолка способностей — не единственная ось прогресса, и, возможно, не самая важная для большинства. Для агентных систем, для повседневного кодинга, для массовых продуктов удешевление и ускорение дают больше совокупной пользы, чем очередные проценты на бенчмарке. Дешёвый и быстрый инференс меняет, что вообще можно построить. Дорогой топ полезен немногим задачам, где не жалко заплатить.
Прогресс не остановить, и фронтир нужен — хотя бы как R&D, который потом дистиллируется в доступное. Но когда самый громкий релиз года звучит как «мощнее, но дороже, медленнее и временно» — это хороший повод спросить себя, ту ли ось мы привыкли считать главной.
А что думаете вы — что для вашей работы важнее: потолок способностей или цена и скорость? Интересно, совпадёт ли ощущение.
Источники: официальный анонс Anthropic, репортажи CNBC, TechCrunch, Axios, Fortune, Inc., NBC News от 9 июня 2026. Цифры по ценам и датам доступа приведены на момент релиза и могут измениться — проверяйте актуальное на сайте Anthropic.
Комментарии (30)

Dreams_and_magic
09.06.2026 23:08Сочетание "дёшево и мощно" - это про китайские модели, и, как ни странно, про Гугл :) В результате ценовых войн на сверхконкурентом рынке получаем приличное качество по ненапряжным ценам в API доступе.
Но у "фронтира" есть подписка... :)

SensDj
09.06.2026 23:08а зачем вы убрали из вступительного абзаца фразу "Одно замечание: тон статьи — умеренно критический к индустрии в целом, не к Anthropic конкретно. Если хочешь сместить акцент (сделать жёстче или, наоборот, нейтральнее) — скажу как поправить. И поскольку это мнение под твоим именем, финальное слово за тобой — перечитай, согласен ли ты с формулировками, прежде чем публиковать." ?
Я успел скопировать :)
sergeytolkachyov
09.06.2026 23:08
И скриншот есть )

Arhammon
09.06.2026 23:08Интересно не ужели так сложно сделать вывод комментариев модели ну там ярко красным или ядовито-зеленым, ну чтоб не пропускали? Впрочем если не смотреть и CtrlA-CtrlC-CtrlV, то это не поможет)

supermuxa
09.06.2026 23:08Так там поди через какого-нить агента. "Посмотри что нового про ИИ, напиши и запости на хабр"

Areso
09.06.2026 23:08@Exosphere , @Boomburum , а представители администрации не хотят ли заблокировать автора к черту?

AKimovd
09.06.2026 23:08Пора уже на хабре блокировать нейрослоп. Всегда раньше сюда приходил за личным мнением, а теперь как будто уже не хочется читать.
Спросить у нейронки я и сам могу.

LuciusWill
09.06.2026 23:08У меня тоже было какое-то смутное ощущение. Вроде бы, написано как не литературный, естественный монолог. Но местами проскакивают едва выделяющиеся странности.
А вот такое вообще свойственно нейронкам "Отдельно про «три недели бесплатно, потом лимиты улетят в секунду»."
В целом, я не против помощи нейронок в текстах. Главное - тоже подумать и проконтролировать текст. А не отдавать всю работу на плечи нейронки. Но замечать это всё-таки забавно.

kholomyanskiy
09.06.2026 23:08Сейчас антропики и прочие палят инвесторские бабки. Они имеют свойство заканчиваться. либо будут выпускать урезанные модели либо давать доступ к нормальным по дорогому апи имхо

GrixaYrev
09.06.2026 23:08Почему совсем не учитывается военное применение? Там цена играет ещё меньшую роль. В целом странное использование местоимения "мы". Цель у них – деньги зарабатывать, а наше удобство – тут уж как повезет.

LuciusWill
09.06.2026 23:08Часто вижу этот аргумент. Странное у вас мышление. Как будто бы вы рынок в глаза никогда не видели. Антропики могли бы плевать на пользователей, если бы они были монополистами. А конкуренты дышат им в спину. Так что, чтобы зарабатывать те самые деньги и не разориться, им приходится думать и об удобстве пользователей.
Чем больше компания плюёт на пользователей, тем активнее они уходят к конкурентам.

simplymad
09.06.2026 23:08Уже все это выглядит для многих как наркотик/курение. Без подключения к задачам любимой модели уже и не строится решение. Братья Либерманы в интервью рассуждали, что мы идем по пути где 2 варианта: 1) все доступно всем, 2) все в руках корпораций. Вот тут явно мы движемся к 2.

LuciusWill
09.06.2026 23:08Ну, как показывает история, опасность корпораций несколько преувеличена. Государства и политики куда опаснее.

fray2000
09.06.2026 23:08Вот в этом и главная ошибка автора, он предполагает, что все это в конечном счёте создаётся для большинства. Это в корне противоречит здравому смыслу. Зачем дворнику условно давать возможность выполнять задачи профессора? Кто тогда будет двор мести? Роботы? А дворник тогда что будет делать? Дальнейшая цепочка думаю очевидна

simplymad
09.06.2026 23:08Хорошая гипотеза. И сейчас все больше подтверждений: крутые стартапы где вкачано млрд. долларов нанимают phD для обучения моделей. Явно же чтобы в конечном счете эти phD пошли подметать улицы или психологами для богачей, кому повезло (только они смогут позволить реальных людей).

alphyE
09.06.2026 23:08качество работы на порядок выше чем у gpt 5.5 и opus 4.8, модель ошибается в разы меньше

anewmur
09.06.2026 23:08Писать такой длинный текст ради одной тревиальной мысли - не уважать читателя. Хотя бы развернуть стоило, минусы, плюсы. Но вдвойне смешнее находить llm штампы в тексте посвященном обсуждению llm

DoctorKrolic
09.06.2026 23:08Интересно, а когда она сама даунгрейдиться, то цену всё равно по максимуму платишь? Если да, то нормальный они такой подход пропихивают: "Мы будем подсовывать вам модель потупее когда захотим, вам об этом напрямую никак не расскажем, но при этом будем драть полную стоимость".

Brazil
Сегодя весь день работал с Opus 4.8
Истратил больше 100$.
Искал ошибку в драйвере WiFi, возникшую утром. Не поднималась точка доступа в дивайсе.
Opus 4.8 ошибку не нашел, предлагал отключить то одно, то другое. Напичкал весь драйвер логами так, что даже стало страдать быстродействие.
А сейчас включил Fable 5 и он мигом (ну может за 10 мин реальных) без логов, однозначно указал проблему в путанице номеров интерфейсов после какого-то комита (напутал сам Opus 4.8, делая очередную фичу). Истратил где-то 8 $
Вывод: мощные модели - экономят.
bambazamba
sami777
мой вывод: попробуй не более двух-трех раз и если не получается, то уже и не получится.
netricks
Вы знаете, это не показатель. Ситуации, когда один агент не может разобраться с багом, а второй быстро всё находит - бывают и при переходе от сильных моделей к более слабым. Вот если бы, неудачу потерпели opus, gpt, deepseek, а fable бы быстро нашёл, это бы был более верный эксперимент
weerf
Поздравляю с умением доводить задачу до результата.
Katasonov
Или Вывод: повезло.
LuciusWill
Про это автор и говорил. Мощные модели нужны для сложных задач. Но нет особого смысла решать дорогой моделью все 100% задач. Условно, 80% времени используем Sonnet, а в 20% Opus или Fable.
Правда, в тексте автор всё-таки не указал что мощные модели могут ещё и сэкономить деньги, на сложных задачах. Там скорее речь шла, что мол за критических задачах надо больше ума, и тут бо́льшие траты имеют смысл.