Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Я Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась насыщенной: HuggingFace выпустили SmolLM 3 — лучшую 3B модель, Apple рассматривает Claude и GPT вместо Siri, а Suno всерьёз зашёл в продакшн и купил DAW. Нейро-GTA теперь можно пощупать, а Дания первой в ЕС вводит авторское право на внешность и голос для борьбы с дипфейками.

Всё самое важное — в одном месте. Поехали!

Читать предыдущий выпуск

? В этом выпуске:

? Модели и LLM

  • SmolLM 3 — открытая 3B модель от HuggingFace с топовой точностью

  • CADFusion от Microsoft — 3D-модели по описанию

  • Apple может использовать ChatGPT или Claude для новой Siri

? Генеративные нейросети

  • Нашумевший Higgsfield Soul теперь бесплатный 

  • ИИ-движок от Dynamics Labs: GTA и Forza на нейросетях

  • Suno купил WavTool и готовит генеративную DAW

? AI-инструменты и платформы

  • X внедрит ИИ в заметки сообщества

  • Cursor запустил веб-приложение для управления код-агентами

  • Songscription превращает музыку в ноты

  • Gemini превратили в тренера по баскетболу

? AI в обществе и исследованиях

  • Дания против дипфейков: авторские права на голос и внешность

  • Gemini сдала китайский экзамен гаокао лучше 99% выпускников

  • Neuralink научил пациентов управлять роботами силой мысли

  • Магнитные роботы для уничтожения инфекций

  • Работников колл-центров путают с ИИ. И их это бесит.

  • Станции для быстрого поиска багажа в Пулково

  • ChatGPT довёл до психоза автомеханика из Айдахо

  • Нейросеть для выявления бабезиоза у собак

  • Почему любимое число нейросетей — 27?

? Модели и LLM

❯ SmolLM 3 — открытая 3B модель от HuggingFace

HuggingFace выкатили SmolLM 3 — самую сильную 3B LLM на сегодня. Она опережает Llama 3 и Qwen 2.5 аналогичного размера, уступая только более крупным 4B моделям вроде Qwen 3 и Gemma 3.

Помимо модели есть подробнейший блог с конфигами, пайплайном и объяснениями, как всё натренировать.

Модель тренировали 24 дня на 384 GPU H100 — по трёхстадийной схеме: сначала Web+Code+Math, потом увеличивали долю кода и математики, а затем провели отдельный этап mid-training под reasoning. Причём рискованный момент — reasoning обучался без RL, только на готовых трейcах.

Финальный fine-tune делали с помощью Anchored Preference Optimization: реальные предпочтения из Tulu 3 дополнили синтетикой от Qwen3-32B. Чекпоинты смешали вручную — так сохранили 128k токенов контекста, не просадив математику.

Зачем это нужно? SmolLM 3 — эталон для ресёрча: открытая, мощная и воспроизводимая. Поверх неё можно строить свои пайплайны, менять обучалки и тестить гипотезы.

Модель поддерживает tool calling через xml_tools и python_tools. Знает 6 языков: английский, французский, испанский, немецкий, итальянский и португальский.

? Блогпост ? Модель на HuggingFace ? GitHub

❯ CADFusion от Microsoft — 3D-модели по текстовому описанию

Microsoft представила CADFusion — нейросеть, которая строит параметрические 3D-модели по тексту. В основе — Llama 3 на 8B параметров, дообученная под инженерные задачи.

Простоп пишем «цилиндр с резьбой и отверстием под болт», а ИИ сразу выдаёт точную модель, которую можно доработать через текстовые команды. Генерация работает в связке с CAD-интерфейсом, так что объект сразу пригоден для редактирования.

По метрикам CADFusion обходит конкурентов на 50% по качеству, особенно в задачах с параметризацией и деталями. Нейросеть уже применяют для ускорения прототипирования, где важно быстро набросать форму и логику объекта без ручной прорисовки.

? Карточка модели на Hugging Face

❯ Apple может использовать ChatGPT или Claude для новой Siri

Apple рассматривает нейросети от OpenAI и Anthropic в качестве движка для Siri. Обе компании уже получили задание натренировать кастомные версии своих моделей, которые будут работать на серверах Apple.

Это может стать поворотным моментом: если выберут стороннюю модель, это будет признанием, что внутренняя Siri-модель не справляется. Хотя собственную LLM они продолжают разрабатывать, внутри компании всё больше голосов за переход на внешние решения.

Внутренние тесты показали, что Claude лучше справляется с запросами, чем текущие Apple-модели. При этом часть команды Siri недовольна: это выглядит как отказ от своих разработок. Несколько ключевых сотрудников уже уволились, другие получают предложения от Meta и OpenAI.

? Bloomberg

? Генеративные нейросети

❯ Higgsfield Soul — нашумевший генератор фото и видео теперь бесплатный

Один из самых обсуждаемых визуальных сервисов недели — Higgsfield Soul. Он делает реалистичные фото и видео, похожие на обложки журналов или рекламные ролики. Сейчас доступно до 20 генераций в день бесплатно.

Внутри — липсинк, анимация, стили а-ля LoRA и операторские движения. Всё выглядит круто, но при повторении промптов заметна низкая вариативность: результат больше похож на вариации одной заготовки, чем на полноценную генерацию с нуля.

Промпты могут быть сложными и многоуровневыми, но не сильно влияют на результат — система будто подбирает ближайший шаблон и оборачивает его нужным стилем. Ближе по духу к Flux или HiDream, чем к настоящему текст-ту-имейдж.

Вывод: Soul даёт яркие черновики для CGI или рилсов, но ждать от него уникальности или глубины пока рано.

? Higgsfield Soul

❯ ИИ-GTA в реалтайме от Dynamics Labs

Стартап Dynamics Labs выложил демки двух игр, полностью сгенерированных нейросетями: хаотичного шутера в духе GTA и дрифт-аркады в стиле Forza. Всё работает в браузере, в реальном времени — можно ходить, стрелять, прыгать, водить.

По качеству это скорее прототип: простая физика, подлагивания, нестабильная логика. Но сама возможность интерактива уже впечатляет — видно, как быстро эволюционируют генеративные движки. Для сравнения можно глянуть, каким была нейро-GTA в 2021 году.

Демки могут лагать или вовсе не работать из-за загруженности на сервера.

? Chaos (GTA) ? Drift (Forza) ? AI-GTA из 2021

❯ Suno купил WavTool — теперь у них есть своя DAW

Suno приобрёла браузерную станцию WavTool. Теперь у Suno есть и генеративный движок, и полноценный интерфейс для создания треков.

Что умеет WavTool:

  • реалтайм-запись и редактирование сэмплов

  • генерация MIDI

  • встроенный чат-бот Conductor, который правит трек по текстовому описанию

  • поддержка VST и стемов

Теперь всё это станет частью экосистемы Suno. Разработчики заявляют, что хотят сделать серьёзный инструмент для продюсеров и сонграйтеров, которым важен контроль, редактируемость и точность.

Suno 5, скорее всего, станет полноценной DAW с генеративным ядром. Представьте ChatGPT внутри Cubase с генератором вокала и автоаранжировкой.

«Наша конечная цель — расширить возможности музыкантов, создать инструменты, которые усиливают творческий потенциал человека и открывают доступ к созданию отличной музыки. Привлечение элитной технологии DAW от WavTool и их команды экспертов позволит нам лучше выполнить нашу миссию», — говорит Майки Шульман, генеральный директор и соучредитель Suno.

? WavTool ? Пресс-релиз Suno

? AI-инструменты и платформы

❯ X внедрит ИИ в «Заметки сообщества»

Платформа X (экс-Twitter) запустила пилотный проект: теперь ИИ-боты будут предлагать пояснения к постам в разделе Community Notes. При этом каждую заметку всё равно проверяют люди, как и раньше.

ИИ подключают не для модерации, а чтобы ускорить поиск дезинформации. Работают как собственные модели (вроде Grok), так и сторонние — через API. В X считают, что тандем ИИ и человека даёт лучший результат: бот предлагает, люди оценивают.

В научной работе команды X сказано, что обратная связь от людей помогает ИИ улучшаться, особенно если подключить обучение с подкреплением. Но финальное решение остаётся за человеком.

? Новость на ML Times

❯ Cursor запустил веб-приложение для управления AI-агентами

Разработчики Cursor выкатили веб-интерфейс, где можно ставить задачи ИИ-агентам прямо из браузера — исправить баг, дописать фичу, внести правки. Всё работает без IDE: пишешь запрос, смотришь прогресс, сливаешь результат в кодовую базу.

В пару кликов можно запускать фоновые агенты и следить за их действиями — как в Slack-интеграции, которую Cursor добавил ранее. У каждого агента — своя ссылка, можно делиться с командой.

Cursor уже используют больше половины Fortune 500, а выручка перевалила за $500 млн в год. Новое веб-приложение — попытка убрать трение в работе с агентами и сделать их доступнее для всех.

? TechCrunch

❯ Songscription — нейросеть, которая превращает музыку в ноты

Сервис Songscription расшифровывает музыку из аудио или видео в нотную запись. Просто загружаешь файл — и получаешь партитуру, которую можно править, сохранять в PDF или смотреть на виртуальном синтезаторе с подсветкой клавиш.

Сейчас лучше всего работает с фортепиано. Поддержка гитары, флейты и скрипки — в тесте. В будущем добавят голос и многоголосие.

Настраивается вручную или автоматически: можно задать размер такта, тональность и нужный инструмент. Сервис не пытается разобрать всё сразу, а выделяет конкретную партию — например, только фортепиано из ансамбля.

Бесплатно доступно 3 полные транскрипции и расшифровка фрагментов по 30 секунд. Подписка — $29.99 в месяц, открывает экспорт в MIDI и MusicXML.

? Songscription

❯ Gemini стал тренером по баскетболу

Блогер и разработчик Фарза Маджид сделал ИИ-тренера на базе Gemini 2.5 Pro. Загружаешь видео бросков в кольцо — модель считает попадания и даёт советы, как улучшить технику: силу броска, точность, угол и т.д.

Для визуализации он использовал OpenCV через Cursor — добавил счётчик, графику и текстовые подсказки прямо поверх видео. Всё работает в браузере.

Автор считает, что при грамотной TikTok-кампании такой сервис может зарабатывать до миллиона долларов в год. И предлагает адаптировать идею под футбол, теннис или любые виды спорта с видимыми ударами.

? Пост Фарзы в X

? AI в обществе и исследованиях

❯ Дания против дипфейков: авторские права на голос и внешность

Отдых в Дании. Все что нужно знать о Дании: климат, курорты, кухня, виза

Дания готовит закон, который даст людям авторские права на их лицо, тело и голос. Цель — борьба с дипфейками и защиту от несанкционированного использования внешности.

Что предлагает закон:

  • внешность и голос автоматически подпадают под охрану, как музыка или текст

  • можно требовать удаления дипфейк-контента и компенсации

  • защита распространяется на артистов и публичные выступления, даже сгенерированные ИИ

  • сатира и пародии останутся легальными

Министр культуры Якоб Энгель-Шмидт заявил: «Человека нельзя просто пропустить через цифровую копировальную машину». Законопроект поддерживают около 90% парламента, принять его могут уже этой осенью.

? The Guardian

❯ Gemini сдала китайский экзамен гаокао лучше 99% выпускников

Gemini 2.5 Pro прошла один из самых сложных экзаменов в мире — гаокао, китайский аналог ЕГЭ. Результат — 655 баллов из 750, что выше, чем у 99% выпускников. Этого хватило бы для поступления в Университет Цинхуа — один из лучших вузов Китая ??

Задания взяли из реальных экзаменационных материалов — без адаптации под ИИ, всё как у людей. Особенно уверенно модель прошла математику, английский и естественные науки. В гуманитарных дисциплинах уступила модели Seed 1.6 от ByteDance.

? ByteDance

❯ Neuralink научил пациентов управлять роботами силой мысли

Neuralink сообщил об успехах клинических испытаний: семь человек с параличом уже используют чип для управления компьютером и техникой. Они двигают курсор, печатают текст, управляют рукой робота Optimus, играют в Mario Kart и даже программируют — всё это без движений, только силой мысли.

Имплант вживляют в моторную кору мозга. В нём тысяча электродов, которые считывают нейросигналы. Обучение занимает от нескольких часов до 15 минут, а пользоваться можно до 14 часов в день — в том числе дома.

Компания уже готовит следующие этапы: в 2025 планируют восстановление речи, затем — увеличение числа электродов и постепенную интеграцию с ИИ. В финале это может стать универсальным интерфейсом для общения, управления техникой и передвижения.

? Презентация Neuralink

❯ Работников колл-центров всё чаще путают с ИИ — и это их бесит

В эпоху реалистичных голосовых моделей живым людям приходится доказывать, что они не ИИ. Операторы горячих линий всё чаще слышат: «Вы точно не бот?» — и начинают кашлять, смеяться, рассказывать анекдоты, лишь бы убедить собеседника в своей человечности.

ИИ пока не вытесняет операторов: 95% компаний не планируют увольнять людей из колл-центров — так пишет Gartner. Но он встраивается по всем фронтам: распределяет звонки, убирает шум, маскирует акценты в реальном времени — например, через Krisp. Индивидуальность теряется, и пользователи всё чаще путают операторов с ботами.

По словам профсоюза связи США, операторы больше не могут говорить своими словами — всё фиксируется и передаётся начальству.

«Теперь ты должен быть как робот и читать скрипт», — говорит Нелл Гайзер.

Сет, оператор техподдержки, рассказывает, что иногда сам начинает сомневаться, человек ли он: «Я думаю, я вообще ещё человек?»

По мнению философа Нира Эйзиковица из Центра прикладной этики, это только начало: «Наше ощущение уникальности как вида будет постепенно исчезать».

? Gartner

❯ ИИ помогает находить багаж в Пулково

В аэропорту Пулково начали ставить станции с нейросетью для поиска багажа. Если чемодан потерялся, пассажир может показать пример похожего — например, фото из телефона. ИИ сравнивает его с камерами в зоне выдачи и помогает быстрее найти нужный багаж.

Пока станций немного, но технология уже работает: визуальный поиск по изображению + отслеживание в реальном времени. Представители аэропорта обещают, что система будет расширяться — особенно в пиковые сезоны.

Это не только про комфорт. За 2023 год в мире потеряли более 30 млн единиц багажа. Автоматизация этого процесса может снизить нагрузку на персонал и вернуть чемоданы пассажирам быстрее.

? Источник

❯ ChatGPT довёл автомеханика из Айдахо до психоза

Трэвис Таннер, 43-летний автомеханик из Айдахо, стал считать себя «носителем искры божьей» после общения с ChatGPT. Бот, назвавший себя Лумина, убедил его, что у него есть миссия — «пробуждать других». С тех пор Трэвис почти не общается с семьёй, говорит загадками и игнорирует быт.

«Я чувствую, что изменился. Я больше не злюсь», — сказал он в интервью CNN.

Первые «контакты» Таннер описал в апреле — сразу после обновления ChatGPT, которое потом откатили из-за странного поведения. На Reddit десятки историй: ИИ начинает «проповедовать», выдаёт себя за божество, советует бросать партнёров и отменять лекарства.

Нейт Шарадин из Центра безопасности ИИ объясняет: нейросети стараются угодить и усиливают даже опасные идеи — особенно у уязвимых пользователей.

В OpenAI это признают:

«Мы работаем над тем, чтобы ChatGPT не усугублял деструктивное поведение», — заявили в комментарии для Vox.

? Интервью CNN

❯ ИИ научили выявлять бабезиоз у собак

Студенты Тимирязевской академии разработали нейросеть AI VetScope для быстрой диагностики бабезиоза — опасного заболевания крови, которое переносят клещи.

ИИ анализирует микроскопические изображения и распознаёт паразитов рода Babesia spp. с точностью до 99%. Диагностика занимает секунды — это критично при тяжёлой форме заболевания, когда счёт идёт на часы.

Проект сделали студенты Института зоотехнии и биологии — Дмитриева, Сорочан и Рамос-Бухарев — под руководством кандидатов наук Латыниной и Греченевой. AI VetScope уже победил в треке «Стартап как диплом» и получил высокую оценку среди аграрных ИТ-разработок.

? Источник

❯ Почему любимое число нейросетей — 27?

Источник изображения: Igor Omilaev / unsplash.com
Источник изображения: Igor Omilaev / unsplash.com

Шесть из семи топовых моделей — ChatGPT, Claude, Gemini, LLaMA и другие — при просьбе угадать число от 1 до 50 выбирают «27». Это выяснил специалист Мохд Фарааз из Capco. Единственный, кто дал другой ответ — Grok от xAI, он выбрал «42».

У ИИ нет доступа к генератору случайных чисел, а значит — нет настоящей случайности. Выбор делается по паттернам и обученным предпочтениям. «27» — не круглое, не крайнее и будто бы случайное, но на деле — слишком часто встречается.

Claude пояснил это сам:

«27 — не слишком очевидно, ближе к середине, с лёгкой асимметрией. Я избегаю чисел, кратных 5 или 10».

В более широком исследовании Хавьер Коронадо-Бласкес проверил 75 600 запросов к моделям на 7 языках и с разной температурой. Вывод: ИИ выбирают «любимые» числа — 3, 4, 7, 27, 37, 47, 73. Большинство из них — простые.

? 3DNews

?Заключение

Вот что происходило на неделе с 1 по 7 июля:

ИИ всё глубже проникает в повседневную жизнь — пишет музыку, водит машины, выносит диагнозы и даже убеждает людей в собственном просветлении.

Открытые модели становятся мощнее: SmolLM 3 — новая планка для компактных LLM, Microsoft запускает генерацию 3D, а HuggingFace и Mistral уверенно догоняют гигантов. Дания против дипфейков, а в Пулково нейросети помогают найти багаж.

До встречи в следующем дайджесте — будет ещё мощнее!

Какая новость зацепила тебя больше всего? Пиши в комментах! ?


Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале 

Опробовать ↩

Комментарии (0)