
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.
Неделя выдалась насыщенной: куча релизов от Alibaba в LLM и генеративке, Suno обновили модель до версии 5, а в Photoshop появились Flux Kontext и Nano Banana. Ну и вишенка на торте — кто-то встроил ChatGPT прямо в Minecraft.
Всё самое важное — в одном месте. Поехали!
? В этом выпуске:
? Модели и LLM
Qwen3-Max — уровень GPT-5 от китайцев
Qwen3-Omni — мультимодальная модель
Новая DeepSeek V3.1 Terminus
ChatGPT Pulse — проактивный рисёрч
Обновление моделей Gemini
? Генеративные нейросети
Обновление модели Qwen-Image-Edit-2509
Wan 2.5 — 1080p видео с озвучкой
HunyanImage-3.0 — открытая модель от Tencent
Обновление Suno V5 и AI DAW Suno Studio
Qwen3-TTS —модель для синтеза речи
? AI-инструменты и платформы
Бесплатный ИИ-агент от Kimi
Flux Kontext и Nano Banana теперь в Photoshop
? AI в обществе и исследованиях
Женщина выиграла $150 000 благодаря GPT
Мороженое Magnum будут производить по рецептам ИИ
ChatGPT прямо в майнкрафте: LLM на редстоуне
?Модели и LLM
❯ Qwen3-Max — уровень GPT-5 от китайцев

Alibaba представили Qwen3-Max — флагманскую модель, которая по тестам в LMArena догоняет GPT-5 и на русском языке показывает даже более высокие результаты.
У модели есть несколько версий: базовая, Instruct и Thinking.
Qwen3-Max-Base обучена на 36 трлн токенов, использует архитектуру MoE и поддерживает контекст до 1 млн токенов.
Qwen3-Max-Instruct заняла 3-е место в мировом рейтинге LMArena Text, обогнав GPT-5-Chat и Claude Opus 4.
Qwen3-Max-Thinking демонстрирует 100% на олимпиадных задачах AIME и HMMT, работает с интерпретатором кода и параллельными вычислениями.
Протестировать Qwen3-Max уже можно в Qwen Chat, а через Alibaba Cloud доступен API, полностью совместимый с OpenAI.
? Qwen Chat ? API на Alibaba Cloud ? Блог Qwen ? Hugging Face
❯ Qwen3-Omni — мультимодальная модель

Alibaba на этой неделе ультанули и представили Qwen3-Omni — первую омнимодальную модель, которая понимает и обрабатывает текст, изображения, аудио и видео напрямую, без промежуточных конвертаций.
В трёх исполнениях:
Instruct — понимает все форматы и отвечает текстом или голосом.
Thinking — текстовая версия, сильнее в рассуждениях.
Captioner — фокусируется на генерации описаний.
Особенности: поддержка 119 языков, включая русский, стриминг текста и речи с задержкой всего 211 мс, работа с аудио длиной до 30 минут и встроенный tool calling. Модель требует от 80 до 160 ГБ видеопамяти, но попробовать её можно бесплатно в Qwen Chat или через демо на Hugging Face.
? Qwen Chat ? Hugging Face ? Презентация
❯ DeepSeek V3.1 Terminus

Команда DeepSeek обновила модель V3.1 и выпустила версию Terminus. Разработчики заявляют, что теперь модель реже срывается на китайский язык и перестала вставлять случайные символы в ответы. Улучшилась работа в агентных сценариях и на специализированных бенчмарках, хотя глобальных изменений по сравнению с базовой V3.1 нет.
Название Terminus намекает, что это финальный релиз линейки V3 — впереди ожидается четвёртая версия, и многие предполагают, что её могут анонсировать к 1 октября, дню образования КНР.
Потестить обновлённую модель можно прямо сейчас в DeepSeek Chat, а веса выложены на Hugging Face.
? DeepSeek Chat ? Hugging Face
❯ ChatGPT Pulse — проактивный ресёрч
OpenAI запустили новую функцию ChatGPT Pulse. Теперь ИИ не ждёт запросов, а сам анализирует недавние чаты, подключённые сервисы и интересы пользователя, чтобы каждое утро выдавать подборку из 5–10 актуальных карточек.
Pulse может предложить план поездки, если в календаре намечен отпуск, напомнить о матчах любимой команды или подобрать свежие исследования по ЗОЖ, если вы интересовались спортом. Система учится на ваших лайках и дизлайках, а также позволяет вручную задавать темы — например, еженедельный план или напоминания о визитах к врачу.
Пока функция доступна только подписчикам Pro ($200/мес) в мобильном приложении ChatGPT, но позже обещают раскатать и на тариф Plus.
❯ Обновление моделей Gemini

Google обновил линейку Gemini 2.5 Flash и Flash-Lite. Модели стали работать примерно в 1,5 раза быстрее, расходуют на 24–50% меньше токенов на ответ и заметно лучше понимают инструкции. Также улучшена работа с аудио и видео — меньше лишних фраз и ошибок в распознавании.
Основной упор сделан на эффективность: модели стали «умнее» и при этом требуют меньше ресурсов, что важно для разработчиков и интеграторов.
Попробовать обновлённые Gemini можно бесплатно в Google AI Studio.
? Google AI Studio ? Блог Google Developers
? Генеративные нейросети
❯ Обновление модели Qwen-Image-Edit-2509
Alibaba обновили модель Qwen-Image-Edit. Теперь она умеет объединять до трёх изображений в одно и лучше справляется с деталями.
Что улучшили:
встроили ControlNet для работы с картами глубины и поз,
повысили точность лиц и сохранение идентичности при смене позы или стиля,
модель корректно редактирует текст, материалы и шрифты.
Попробовать новую версию можно бесплатно в Qwen Chat и на Hugging Face.
❯ Wan 2.5 и обновлённый Wan 2.2 — видео с озвучкой и киношной эстетикой
Свежая Wan 2.5 умеет создавать ролики до 10 секунд в 1080p с озвучкой.
Качество заметно улучшилось по сравнению с предыдущей версией, хотя до уровня Google Veo 3 и Kling 2.5 пока не дотягивает. Цензуры у модели почти нет, а веса закрыты, потестить пока можно только в веб-интерфейсе.
А вот открытую Wan 2.2 параллельно обновили:
Mixture-of-Experts архитектура — больше мощности без увеличения затрат
Обучена на датасете с метками освещения, композиции и цвета, что даёт «киношную» эстетику и настраиваемый стиль
+65% изображений и +83% видео в датасете — лучше понимает сложные движения и динамику
версия TI2Vid (5B параметров) выдаёт 720p/24fps и запускается даже на RTX 4090
семейство txt2vid, img2vid, speech2vid и animate (14B параметров) уже завезли в ComfyUI.
? Wan 2.5 Demo ? GitHub Wan 2.2 ? Hugging Face Wan 2.2
❯ HunyanImage-3.0 — открытая модель от Tencent

Tencent выпустили HunyanImage-3.0 — самую крупную txt2img MoE-модель на сегодня. У неё 80B параметров и 13B активных, поэтому для развёртывания понадобится около 170 ГБ памяти.
Модель доступна в открытом доступе и уже выложена на GitHub и Hugging Face. Можно попробовать онлайн-демо на официальном сайте Tencent.
? Демо ? GitHub ? Hugging Face
❯ Suno V5 и AI DAW Suno Studio
Вышла пятая версия Suno — одной из самых популярных нейросетей для генерации музыки. Качество звучания стало выше, вокал чище, а теперь можно генерировать треки даже из собственного вокала, фрагментов видео или фото.
Добавили редактирование нот, инструментов и вокала. Простые жанры вроде попа и техно звучат достойно, а вот сложная электроника пока отстаёт — синты и басы всё ещё «пластиковые».
Вместе с моделью запустили Suno Studio — полноценную браузерную DAW.
В ней можно:
экспортировать треки в DAW и конвертировать их в MIDI,
генерировать дорожки по отдельности — вокал, ударные, синты,
регулировать темп, громкость и питч.
Для продюсеров это мощный инструмент: можно напеть мелодию и превратить её в полноценный трек или использовать Suno Studio как генератор стемов.
? Suno V5 ? Suno Studio
❯ Qwen3-TTS — новая модель для синтеза речи

Alibaba представили Qwen3-TTS — модель, которая уже обходит ElevenLabs и GPT-4o-Audio-Preview по качеству синтеза.
Она поддерживает семнадцать голосов, и каждый из них умеет говорить на десяти языках, включая русский. Задержка генерации минимальна — около 0,1 секунды, а даже под высокой нагрузкой модель работает вдвое быстрее предыдущей версии.
Qwen3-TTS автоматически подстраивает интонацию под стиль текста и делает речь более естественной, чем большинство конкурентов. Это делает её удобной не только для озвучки, но и для интерактивных приложений, где важна быстрая реакция и разнообразие голосов.
? AI-инструменты и платформы
❯ Бесплатный ИИ-агент от Kimi
Сервис Kimi запустил нового агента в режиме OK Computer, и он доступен бесплатно.
Агент подключается к удалённому компьютеру и умеет работать с браузером, терминалом и файлами. Можно поручить ему создание сайтов и презентаций, анализ до миллиона строк данных с последующей визуализацией в графиках и дашбордах или даже проведение исследований с оформлением отчётов.
По сути, это инструмент для автономной работы над крупными проектами, который снимает с пользователя рутинные задачи. Попробовать агента можно прямо сейчас на официальном сайте Kimi.
? Kimi
❯ Flux Kontext и Nano Banana теперь в Photoshop

С 25 сентября пользователи Photoshop beta получили доступ к моделям FLUX.1 Kontext Pro и Nano Banana прямо в функции Generative Fill.
Теперь можно выбирать альтернативные ИИ для генерации и доработки изображений.
Модели работают быстрее, а выбор генератора под конкретные задачи позволяет точнее контролировать результат.
Интересно, как это скажется на будущем Firefly.
? AI в обществе и исследованиях
❯ Женщина выиграла $150 000 благодаря GPT

В США женщина сорвала куш в онлайн-лотерее, использовав комбинацию чисел, которую подсказал ей ChatGPT. Нейросеть угадала 4 из 5 выпавших номеров, и выигрыш составил $150 000.
Необычная история быстро разлетелась по медиа: сама победительница пообещала отдать весь приз на благотворительность, а многие назвали успех «божественным вмешательством».
Хотя вероятность угадывания всё равно оставалась минимальной, кейс показал, что люди готовы доверять ИИ даже в таких сферах.
❯ Magnum будут производить мороженое по рецептам ИИ

Производитель мороженого Magnum разрабатывает новые продукты с помощью ИИ. Компания сотрудничает с чилийским стартапом NotCo, который создаёт системы для анализа рецептуры и подбора ингредиентов.
Нейросети будут использоваться для изменения состава классического мороженого, создания растительных альтернатив и оптимизации производства в условиях роста цен на сырьё.
По словам представителей Magnum, современный потребитель хочет сочетать удовольствие и осознанность — небольшие порции, экологичность и новые вкусы.
Компания NotCo уже помогала Kraft Heinz разрабатывать растительные аналоги майонеза и сыра. Теперь тот же подход используют для мороженого — от снижения сахара и замены красителей до поиска уникальных вкусов, вроде дубайского шоколада.
? Reuters
❯ ChatGPT прямо в Minecraft: LLM на редстоуне
Разработчик под ником sammyuri собрал рабочую копию ChatGPT внутри Minecraft. Проект под названием CraftGPT содержит около 5 млн параметров и полностью функционирует прямо в игре — модель предсказывает следующее слово и поддерживает короткие диалоги.
Правда, контекстное окно всего 64 токена, так что беседа получается короткой.
Но сам факт запуска LLM на редстоуне и командных блоках выглядит как техническое чудо и показывает, насколько гибкой может быть игра как платформа.
? GitHub
Аудиоверсия дайджеста
❯ Заключение ?
На этой неделе китайцы снова в топе: Qwen3-Max подтянулась к GPT-5, а Qwen3-Omni показала настоящий мультимодальный подход. DeepSeek Terminus завершил линейку V3, Google ускорил Gemini, OpenAI добавили ChatGPT Pulse.
В генеративке — апгрейд Wan 2.2 и запуск Wan 2.5 с озвучкой, открытая HunyanImage-3.0 от Tencent и релиз Suno V5 вместе с DAW Suno Studio. Даже Photoshop теперь с альтернативными моделями Flux и Nano Banana.
ИИ всё глубже уходит в реальность: выигрыш в лотерею, новые рецепты Magnum и рабочая LLM прямо в Minecraft напоминают, что у технологий нет границ.
До встречи в следующем выпуске!
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩
Vitrion
Так-то за первую неделю октября ещё вышла Sora2 и DeepSeek-3.2Exp