Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Меня зовут Вандер, и каждую неделю я обозреваю новости о нейросетях и ИИ.

Неделя выдалась насыщенной: куча релизов от Alibaba в LLM и генеративке, Suno обновили модель до версии 5, а в Photoshop появились Flux Kontext и Nano Banana. Ну и вишенка на торте — кто-то встроил ChatGPT прямо в Minecraft.

Всё самое важное — в одном месте. Поехали!

Предыдущий выпуск

? В этом выпуске:

? Модели и LLM

  • Qwen3-Max — уровень GPT-5 от китайцев

  • Qwen3-Omni — мультимодальная модель

  • Новая DeepSeek V3.1 Terminus

  • ChatGPT Pulse — проактивный рисёрч

  • Обновление моделей Gemini

? Генеративные нейросети

  • Обновление модели Qwen-Image-Edit-2509

  • Wan 2.5 — 1080p видео с озвучкой

  • HunyanImage-3.0 — открытая модель от Tencent

  • Обновление Suno V5 и AI DAW Suno Studio

  • Qwen3-TTS —модель для синтеза речи

? AI-инструменты и платформы

  • Бесплатный ИИ-агент от Kimi

  • Flux Kontext и Nano Banana теперь в Photoshop

? AI в обществе и исследованиях

  • Женщина выиграла $150 000 благодаря GPT

  • Мороженое Magnum будут производить по рецептам ИИ

  • ChatGPT прямо в майнкрафте: LLM на редстоуне

?Модели и LLM

❯ Qwen3-Max — уровень GPT-5 от китайцев

Alibaba представили Qwen3-Max — флагманскую модель, которая по тестам в LMArena догоняет GPT-5 и на русском языке показывает даже более высокие результаты.

У модели есть несколько версий: базовая, Instruct и Thinking.

  • Qwen3-Max-Base обучена на 36 трлн токенов, использует архитектуру MoE и поддерживает контекст до 1 млн токенов.

  • Qwen3-Max-Instruct заняла 3-е место в мировом рейтинге LMArena Text, обогнав GPT-5-Chat и Claude Opus 4.

  • Qwen3-Max-Thinking демонстрирует 100% на олимпиадных задачах AIME и HMMT, работает с интерпретатором кода и параллельными вычислениями.

Протестировать Qwen3-Max уже можно в Qwen Chat, а через Alibaba Cloud доступен API, полностью совместимый с OpenAI.

? Qwen Chat ? API на Alibaba Cloud ? Блог Qwen ? Hugging Face

❯ Qwen3-Omni — мультимодальная модель

Alibaba на этой неделе ультанули и представили Qwen3-Omni — первую омнимодальную модель, которая понимает и обрабатывает текст, изображения, аудио и видео напрямую, без промежуточных конвертаций.

В трёх исполнениях:

  • Instruct — понимает все форматы и отвечает текстом или голосом.

  • Thinking — текстовая версия, сильнее в рассуждениях.

  • Captioner — фокусируется на генерации описаний.

Особенности: поддержка 119 языков, включая русский, стриминг текста и речи с задержкой всего 211 мс, работа с аудио длиной до 30 минут и встроенный tool calling. Модель требует от 80 до 160 ГБ видеопамяти, но попробовать её можно бесплатно в Qwen Chat или через демо на Hugging Face.

? Qwen Chat ? Hugging Face ? Презентация

❯ DeepSeek V3.1 Terminus

Команда DeepSeek обновила модель V3.1 и выпустила версию Terminus. Разработчики заявляют, что теперь модель реже срывается на китайский язык и перестала вставлять случайные символы в ответы. Улучшилась работа в агентных сценариях и на специализированных бенчмарках, хотя глобальных изменений по сравнению с базовой V3.1 нет.

Название Terminus намекает, что это финальный релиз линейки V3 — впереди ожидается четвёртая версия, и многие предполагают, что её могут анонсировать к 1 октября, дню образования КНР.

Потестить обновлённую модель можно прямо сейчас в DeepSeek Chat, а веса выложены на Hugging Face.

? DeepSeek Chat ? Hugging Face 

❯ ChatGPT Pulse — проактивный ресёрч

OpenAI запустили новую функцию ChatGPT Pulse. Теперь ИИ не ждёт запросов, а сам анализирует недавние чаты, подключённые сервисы и интересы пользователя, чтобы каждое утро выдавать подборку из 5–10 актуальных карточек.

Pulse может предложить план поездки, если в календаре намечен отпуск, напомнить о матчах любимой команды или подобрать свежие исследования по ЗОЖ, если вы интересовались спортом. Система учится на ваших лайках и дизлайках, а также позволяет вручную задавать темы — например, еженедельный план или напоминания о визитах к врачу.

Пока функция доступна только подписчикам Pro ($200/мес) в мобильном приложении ChatGPT, но позже обещают раскатать и на тариф Plus.

? Анонс OpenAI

❯ Обновление моделей Gemini

Google обновил линейку Gemini 2.5 Flash и Flash-Lite. Модели стали работать примерно в 1,5 раза быстрее, расходуют на 24–50% меньше токенов на ответ и заметно лучше понимают инструкции. Также улучшена работа с аудио и видео — меньше лишних фраз и ошибок в распознавании.

Основной упор сделан на эффективность: модели стали «умнее» и при этом требуют меньше ресурсов, что важно для разработчиков и интеграторов.

Попробовать обновлённые Gemini можно бесплатно в Google AI Studio.

? Google AI Studio ? Блог Google Developers

? Генеративные нейросети

❯ Обновление модели Qwen-Image-Edit-2509

Alibaba обновили модель Qwen-Image-Edit. Теперь она умеет объединять до трёх изображений в одно и лучше справляется с деталями.

Что улучшили:

  • встроили ControlNet для работы с картами глубины и поз,

  • повысили точность лиц и сохранение идентичности при смене позы или стиля,

  • модель корректно редактирует текст, материалы и шрифты.

Попробовать новую версию можно бесплатно в Qwen Chat и на Hugging Face.

? Qwen Chat ? Hugging Face

❯ Wan 2.5 и обновлённый Wan 2.2 — видео с озвучкой и киношной эстетикой

Свежая Wan 2.5 умеет создавать ролики до 10 секунд в 1080p с озвучкой

Качество заметно улучшилось по сравнению с предыдущей версией, хотя до уровня Google Veo 3 и Kling 2.5 пока не дотягивает. Цензуры у модели почти нет, а веса закрыты, потестить пока можно только в веб-интерфейсе.

А вот открытую Wan 2.2 параллельно обновили:

  • Mixture-of-Experts архитектура — больше мощности без увеличения затрат

  • Обучена на датасете с метками освещения, композиции и цвета, что даёт «киношную» эстетику и настраиваемый стиль

  • +65% изображений и +83% видео в датасете — лучше понимает сложные движения и динамику

  • версия TI2Vid (5B параметров) выдаёт 720p/24fps и запускается даже на RTX 4090

  • семейство txt2vid, img2vid, speech2vid и animate (14B параметров) уже завезли в ComfyUI.

? Wan 2.5 Demo ? GitHub Wan 2.2 ? Hugging Face Wan 2.2

❯ HunyanImage-3.0 — открытая модель от Tencent

Tencent выпустили HunyanImage-3.0 — самую крупную txt2img MoE-модель на сегодня. У неё 80B параметров и 13B активных, поэтому для развёртывания понадобится около 170 ГБ памяти.

Модель доступна в открытом доступе и уже выложена на GitHub и Hugging Face. Можно попробовать онлайн-демо на официальном сайте Tencent.

? Демо ? GitHub ? Hugging Face

❯ Suno V5 и AI DAW Suno Studio

Вышла пятая версия Suno — одной из самых популярных нейросетей для генерации музыки. Качество звучания стало выше, вокал чище, а теперь можно генерировать треки даже из собственного вокала, фрагментов видео или фото.

Добавили редактирование нот, инструментов и вокала. Простые жанры вроде попа и техно звучат достойно, а вот сложная электроника пока отстаёт — синты и басы всё ещё «пластиковые».

Вместе с моделью запустили Suno Studio — полноценную браузерную DAW.

В ней можно:

  • экспортировать треки в DAW и конвертировать их в MIDI,

  • генерировать дорожки по отдельности — вокал, ударные, синты,

  • регулировать темп, громкость и питч.

Для продюсеров это мощный инструмент: можно напеть мелодию и превратить её в полноценный трек или использовать Suno Studio как генератор стемов.

? Suno V5 ? Suno Studio

❯ Qwen3-TTS — новая модель для синтеза речи

Alibaba представили Qwen3-TTS — модель, которая уже обходит ElevenLabs и GPT-4o-Audio-Preview по качеству синтеза. 

Она поддерживает семнадцать голосов, и каждый из них умеет говорить на десяти языках, включая русский. Задержка генерации минимальна — около 0,1 секунды, а даже под высокой нагрузкой модель работает вдвое быстрее предыдущей версии.

Qwen3-TTS автоматически подстраивает интонацию под стиль текста и делает речь более естественной, чем большинство конкурентов. Это делает её удобной не только для озвучки, но и для интерактивных приложений, где важна быстрая реакция и разнообразие голосов.

? Блог Qwen ? Hugging Face

? AI-инструменты и платформы

❯ Бесплатный ИИ-агент от Kimi

Сервис Kimi запустил нового агента в режиме OK Computer, и он доступен бесплатно. 

Агент подключается к удалённому компьютеру и умеет работать с браузером, терминалом и файлами. Можно поручить ему создание сайтов и презентаций, анализ до миллиона строк данных с последующей визуализацией в графиках и дашбордах или даже проведение исследований с оформлением отчётов.

По сути, это инструмент для автономной работы над крупными проектами, который снимает с пользователя рутинные задачи. Попробовать агента можно прямо сейчас на официальном сайте Kimi.

? Kimi

❯ Flux Kontext и Nano Banana теперь в Photoshop

С 25 сентября пользователи Photoshop beta получили доступ к моделям FLUX.1 Kontext Pro и Nano Banana прямо в функции Generative Fill. 

Теперь можно выбирать альтернативные ИИ для генерации и доработки изображений.

Модели работают быстрее, а выбор генератора под конкретные задачи позволяет точнее контролировать результат. 

Интересно, как это скажется на будущем Firefly.

? Adobe Guide ? BFL AI Blog

? AI в обществе и исследованиях

❯ Женщина выиграла $150 000 благодаря GPT

В США женщина сорвала куш в онлайн-лотерее, использовав комбинацию чисел, которую подсказал ей ChatGPT. Нейросеть угадала 4 из 5 выпавших номеров, и выигрыш составил $150 000.

Необычная история быстро разлетелась по медиа: сама победительница пообещала отдать весь приз на благотворительность, а многие назвали успех «божественным вмешательством». 

Хотя вероятность угадывания всё равно оставалась минимальной, кейс показал, что люди готовы доверять ИИ даже в таких сферах.

? New York Post

❯ Magnum будут производить мороженое по рецептам ИИ

Производитель мороженого Magnum разрабатывает новые продукты с помощью ИИ. Компания сотрудничает с чилийским стартапом NotCo, который создаёт системы для анализа рецептуры и подбора ингредиентов.

Нейросети будут использоваться для изменения состава классического мороженого, создания растительных альтернатив и оптимизации производства в условиях роста цен на сырьё. 

По словам представителей Magnum, современный потребитель хочет сочетать удовольствие и осознанность — небольшие порции, экологичность и новые вкусы.

Компания NotCo уже помогала Kraft Heinz разрабатывать растительные аналоги майонеза и сыра. Теперь тот же подход используют для мороженого — от снижения сахара и замены красителей до поиска уникальных вкусов, вроде дубайского шоколада.

? Reuters

❯ ChatGPT прямо в Minecraft: LLM на редстоуне

Разработчик под ником sammyuri собрал рабочую копию ChatGPT внутри Minecraft. Проект под названием CraftGPT содержит около 5 млн параметров и полностью функционирует прямо в игре — модель предсказывает следующее слово и поддерживает короткие диалоги.

Правда, контекстное окно всего 64 токена, так что беседа получается короткой. 

Но сам факт запуска LLM на редстоуне и командных блоках выглядит как техническое чудо и показывает, насколько гибкой может быть игра как платформа.

? GitHub

Аудиоверсия дайджеста

❯ Заключение ?

На этой неделе китайцы снова в топе: Qwen3-Max подтянулась к GPT-5, а Qwen3-Omni показала настоящий мультимодальный подход. DeepSeek Terminus завершил линейку V3, Google ускорил Gemini, OpenAI добавили ChatGPT Pulse.

В генеративке — апгрейд Wan 2.2 и запуск Wan 2.5 с озвучкой, открытая HunyanImage-3.0 от Tencent и релиз Suno V5 вместе с DAW Suno Studio. Даже Photoshop теперь с альтернативными моделями Flux и Nano Banana.

ИИ всё глубже уходит в реальность: выигрыш в лотерею, новые рецепты Magnum и рабочая LLM прямо в Minecraft напоминают, что у технологий нет границ.

До встречи в следующем выпуске!


Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале 

Комментарии (1)


  1. Vitrion
    02.10.2025 19:15

    Так-то за первую неделю октября ещё вышла Sora2 и DeepSeek-3.2Exp