Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98% и впервые становится доступной всем пользователям без ограничений.
Мы рады представить Grok 4 Fast — шаг вперёд в создании моделей для экономичного рассуждения. Построенная на опыте xAI с Grok 4, Grok 4 Fast обеспечивает производительность уровня передовых решений как для бизнеса, так и для конечных пользователей — при выдающейся эффективности по числу токенов. Эта модель раздвигает границы для компактных и быстрых ИИ, делая качественные рассуждения доступными большему числу пользователей и разработчиков. Grok 4 Fast предлагает передовую экономичность (SOTA), современные возможности поиска в интернете и X, контекстное окно на 2 миллиона токенов и единую архитектуру, объединяющую режимы рассуждений и прямого ответа в одной модели.
Новый уровень доступного интеллекта
Grok 4 Fast открывает новую страницу в создании доступных по стоимости систем искусственного интеллекта, опережая Grok 3 Mini на тестах на рассуждение и значительно снижая затраты на токены.
Benchmark pass@1 |
Grok 4 Fast |
Grok 4 |
Grok 3 Mini (High) |
GPT-5 (High) |
GPT-5 Mini (High) |
---|---|---|---|---|---|
GPQA Diamond |
85.7% |
87.5% |
79.0% |
85.7% |
82.3% |
AIME 2025 (без инструментов) |
92.0% |
91.7% |
83.0% |
94.6% |
91.1% |
HMMT 2025 (без инструментов) |
93.3% |
90.0% |
74.0% |
93.3% |
87.8% |
HLE (без инструментов) |
20.0% |
25.4% |
11.0% |
24.8% |
16.7% |
LiveCodeBench (янв-май) |
80.0% |
79.0% |
70.0% |
86.8% |
77.4% |
Мы использовали масштабное обучение с подкреплением (reinforcement learning), чтобы максимально повысить «плотность интеллекта» Grok 4 Fast. В наших тестах модель показала результаты, сопоставимые с Grok 4, при этом в среднем используя на 40% меньше thinking-токенов.

Эта 40%-ная прибавка к эффективности по токенам в сочетании с заметно более низкой ценой за токен позволяет сократить стоимость достижения того же уровня на передовых бенчмарках на 98% по сравнению с Grok 4. Независимый обзор от Artificial Analysis подтвердил, что Grok 4 Fast демонстрирует лучший в своём классе показатель соотношения «цена-интеллект» среди всех публично доступных моделей на Artificial Analysis Intelligence Index.

Нативная работа с инструментами и передовой поиск
Grok 4 Fast обучался по схеме end-to-end с использованием обучения с подкреплением (RL), специально ориентированного на работу с инструментами. Он отлично справляется с задачей выбора момента, когда нужно вызвать инструмент — например, выполнить код или открыть браузер.
Grok 4 Fast демонстрирует передовые агентные возможности поиска: он легко серфит веб и X, дополняя запросы актуальными данными в реальном времени. Модель умеет переходить по ссылкам, обрабатывать медиа (включая изображения и видео на X) и синтезировать результаты с молниеносной скоростью.
Benchmark pass@1 |
Grok 4 Fast |
Grok 4 |
Grok 3 (без рассуждений) |
---|---|---|---|
BrowseComp |
44.9% |
43.0% |
— |
SimpleQA |
95.0% |
94.0% |
82.0% |
Reka Research Eval |
66.0% |
58.0% |
37.0% |
BrowseComp (zh) |
51.2% |
45.0% |
10.8% |
X Bench Deepsearch (zh) |
74.0% |
66.0% |
27.0% |
X Browse* |
58.0% |
53.2% |
20.8% |
*X Browse — внутренний бенчмарк, оценивающий многошаговый поиск и возможности навигации агента в X.
Передовой уровень общего пост-тренинга
Grok 4 Fast также задаёт новую планку эффективности в решении задач общего назначения. Мы рады поделиться результатами модели на LMArena, где она проходила закрытое тестирование в Search и Text Arena.
В Search Arena LMArena модель grok-4-fast-search (кодовое имя: menlo) заняла первое место с результатом 1163 Elo, опередив ближайшего конкурента o3-search на 17 пунктов. Высокая эффективность рассуждений и «плотность интеллекта» позволяют Grok 4 Fast обгонять гораздо более крупные модели в реальных задачах, связанных с поиском.
Единая модель: рассуждения и быстрые ответы
Раньше для режима рассуждений и для быстрых ответов использовались разные модели. Grok 4 Fast представляет единую архитектуру, в которой рассуждения (длинные цепочки мыслей) и короткие ответы обрабатываются одними и теми же весами модели, а поведение настраивается с помощью системных промтов. Такой подход снижает полную задержку ответа и уменьшает количество токенов, делая Grok 4 Fast отличным решением для задач, требующих реакции в реальном времени.
На grok.com это выражается в плавных переходах: для простых запросов модель отвечает мгновенно, а для сложных включает расширенный режим рассуждений. В API xAI разработчики могут гибко настраивать это поведение, выбирая баланс между скоростью и глубиной.
Grok 4 Fast уже доступен всем пользователям. В режимах Fast и Auto вы заметите значительное ускорение поиска и получения информации. Кроме того, для сложных запросов в Auto-режиме будет использоваться именно Grok 4 Fast, что обеспечит гораздо более быструю работу без потери качества. Впервые все пользователи, включая бесплатных, получили доступ к нашей последней модели без ограничений — важный шаг к демократизации продвинутого ИИ.
Grok 4 Fast на OpenRouter, Vercel AI Gateway и в xAI API
Ограниченное время Grok 4 Fast будет доступен бесплатно на OpenRouter и Vercel AI Gateway.
Мы также выпускаем Grok 4 Fast в виде двух моделей:
grok-4-fast-reasoning
grok-4-fast-non-reasoning
Каждая из них поддерживает контекстное окно в 2 млн токенов. Это позволяет разработчикам тонко настраивать вычислительные ресурсы под конкретные сценарии.
Цены на использование grok-4-fast-reasoning и grok-4-fast-non-reasoning в xAI API:
Тип токена |
<128k токенов |
≥128k токенов |
---|---|---|
Входные токены |
$0.20 / 1M |
$0.40 / 1M |
Выходные токены |
$0.50 / 1M |
$1.00 / 1M |
Кэшированные входные токены |
$0.05 / 1M |
— |
Русскоязычное сообщество про AI в разработке

Друзья! Эту статью перевела команда ТГК «AI for Devs» — канала, где мы рассказываем про AI-ассистентов, плагины для IDE, делимся практическими кейсами и свежими новостями из мира ИИ. Подписывайтесь, чтобы быть в курсе и ничего не упустить!