
Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.
Я Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.
Неделя выдалась насыщенной: HuggingFace выпустили SmolLM 3 — лучшую 3B модель, Apple рассматривает Claude и GPT вместо Siri, а Suno всерьёз зашёл в продакшн и купил DAW. Нейро-GTA теперь можно пощупать, а Дания первой в ЕС вводит авторское право на внешность и голос для борьбы с дипфейками.
Всё самое важное — в одном месте. Поехали!
? В этом выпуске:
? Модели и LLM
SmolLM 3 — открытая 3B модель от HuggingFace с топовой точностью
CADFusion от Microsoft — 3D-модели по описанию
Apple может использовать ChatGPT или Claude для новой Siri
? Генеративные нейросети
Нашумевший Higgsfield Soul теперь бесплатный
ИИ-движок от Dynamics Labs: GTA и Forza на нейросетях
Suno купил WavTool и готовит генеративную DAW
? AI-инструменты и платформы
X внедрит ИИ в заметки сообщества
Cursor запустил веб-приложение для управления код-агентами
Songscription превращает музыку в ноты
Gemini превратили в тренера по баскетболу
? AI в обществе и исследованиях
Дания против дипфейков: авторские права на голос и внешность
Gemini сдала китайский экзамен гаокао лучше 99% выпускников
Neuralink научил пациентов управлять роботами силой мысли
Магнитные роботы для уничтожения инфекций
Работников колл-центров путают с ИИ. И их это бесит.
Станции для быстрого поиска багажа в Пулково
ChatGPT довёл до психоза автомеханика из Айдахо
Нейросеть для выявления бабезиоза у собак
Почему любимое число нейросетей — 27?
? Модели и LLM
❯ SmolLM 3 — открытая 3B модель от HuggingFace

HuggingFace выкатили SmolLM 3 — самую сильную 3B LLM на сегодня. Она опережает Llama 3 и Qwen 2.5 аналогичного размера, уступая только более крупным 4B моделям вроде Qwen 3 и Gemma 3.
Помимо модели есть подробнейший блог с конфигами, пайплайном и объяснениями, как всё натренировать.
Модель тренировали 24 дня на 384 GPU H100 — по трёхстадийной схеме: сначала Web+Code+Math, потом увеличивали долю кода и математики, а затем провели отдельный этап mid-training под reasoning. Причём рискованный момент — reasoning обучался без RL, только на готовых трейcах.
Финальный fine-tune делали с помощью Anchored Preference Optimization: реальные предпочтения из Tulu 3 дополнили синтетикой от Qwen3-32B. Чекпоинты смешали вручную — так сохранили 128k токенов контекста, не просадив математику.
Зачем это нужно? SmolLM 3 — эталон для ресёрча: открытая, мощная и воспроизводимая. Поверх неё можно строить свои пайплайны, менять обучалки и тестить гипотезы.
Модель поддерживает tool calling через xml_tools и python_tools. Знает 6 языков: английский, французский, испанский, немецкий, итальянский и португальский.
? Блогпост ? Модель на HuggingFace ? GitHub
❯ CADFusion от Microsoft — 3D-модели по текстовому описанию
Microsoft представила CADFusion — нейросеть, которая строит параметрические 3D-модели по тексту. В основе — Llama 3 на 8B параметров, дообученная под инженерные задачи.
Простоп пишем «цилиндр с резьбой и отверстием под болт», а ИИ сразу выдаёт точную модель, которую можно доработать через текстовые команды. Генерация работает в связке с CAD-интерфейсом, так что объект сразу пригоден для редактирования.
По метрикам CADFusion обходит конкурентов на 50% по качеству, особенно в задачах с параметризацией и деталями. Нейросеть уже применяют для ускорения прототипирования, где важно быстро набросать форму и логику объекта без ручной прорисовки.
? Карточка модели на Hugging Face
❯ Apple может использовать ChatGPT или Claude для новой Siri

Apple рассматривает нейросети от OpenAI и Anthropic в качестве движка для Siri. Обе компании уже получили задание натренировать кастомные версии своих моделей, которые будут работать на серверах Apple.
Это может стать поворотным моментом: если выберут стороннюю модель, это будет признанием, что внутренняя Siri-модель не справляется. Хотя собственную LLM они продолжают разрабатывать, внутри компании всё больше голосов за переход на внешние решения.
Внутренние тесты показали, что Claude лучше справляется с запросами, чем текущие Apple-модели. При этом часть команды Siri недовольна: это выглядит как отказ от своих разработок. Несколько ключевых сотрудников уже уволились, другие получают предложения от Meta и OpenAI.
? Генеративные нейросети
❯ Higgsfield Soul — нашумевший генератор фото и видео теперь бесплатный
Один из самых обсуждаемых визуальных сервисов недели — Higgsfield Soul. Он делает реалистичные фото и видео, похожие на обложки журналов или рекламные ролики. Сейчас доступно до 20 генераций в день бесплатно.
Внутри — липсинк, анимация, стили а-ля LoRA и операторские движения. Всё выглядит круто, но при повторении промптов заметна низкая вариативность: результат больше похож на вариации одной заготовки, чем на полноценную генерацию с нуля.
Промпты могут быть сложными и многоуровневыми, но не сильно влияют на результат — система будто подбирает ближайший шаблон и оборачивает его нужным стилем. Ближе по духу к Flux или HiDream, чем к настоящему текст-ту-имейдж.
Вывод: Soul даёт яркие черновики для CGI или рилсов, но ждать от него уникальности или глубины пока рано.
❯ ИИ-GTA в реалтайме от Dynamics Labs
Стартап Dynamics Labs выложил демки двух игр, полностью сгенерированных нейросетями: хаотичного шутера в духе GTA и дрифт-аркады в стиле Forza. Всё работает в браузере, в реальном времени — можно ходить, стрелять, прыгать, водить.
По качеству это скорее прототип: простая физика, подлагивания, нестабильная логика. Но сама возможность интерактива уже впечатляет — видно, как быстро эволюционируют генеративные движки. Для сравнения можно глянуть, каким была нейро-GTA в 2021 году.
Демки могут лагать или вовсе не работать из-за загруженности на сервера.
? Chaos (GTA) ? Drift (Forza) ? AI-GTA из 2021
❯ Suno купил WavTool — теперь у них есть своя DAW

Suno приобрёла браузерную станцию WavTool. Теперь у Suno есть и генеративный движок, и полноценный интерфейс для создания треков.
Что умеет WavTool:
реалтайм-запись и редактирование сэмплов
генерация MIDI
встроенный чат-бот Conductor, который правит трек по текстовому описанию
поддержка VST и стемов
Теперь всё это станет частью экосистемы Suno. Разработчики заявляют, что хотят сделать серьёзный инструмент для продюсеров и сонграйтеров, которым важен контроль, редактируемость и точность.
Suno 5, скорее всего, станет полноценной DAW с генеративным ядром. Представьте ChatGPT внутри Cubase с генератором вокала и автоаранжировкой.
«Наша конечная цель — расширить возможности музыкантов, создать инструменты, которые усиливают творческий потенциал человека и открывают доступ к созданию отличной музыки. Привлечение элитной технологии DAW от WavTool и их команды экспертов позволит нам лучше выполнить нашу миссию», — говорит Майки Шульман, генеральный директор и соучредитель Suno.
? AI-инструменты и платформы
❯ X внедрит ИИ в «Заметки сообщества»

Платформа X (экс-Twitter) запустила пилотный проект: теперь ИИ-боты будут предлагать пояснения к постам в разделе Community Notes. При этом каждую заметку всё равно проверяют люди, как и раньше.
ИИ подключают не для модерации, а чтобы ускорить поиск дезинформации. Работают как собственные модели (вроде Grok), так и сторонние — через API. В X считают, что тандем ИИ и человека даёт лучший результат: бот предлагает, люди оценивают.
В научной работе команды X сказано, что обратная связь от людей помогает ИИ улучшаться, особенно если подключить обучение с подкреплением. Но финальное решение остаётся за человеком.
❯ Cursor запустил веб-приложение для управления AI-агентами

Разработчики Cursor выкатили веб-интерфейс, где можно ставить задачи ИИ-агентам прямо из браузера — исправить баг, дописать фичу, внести правки. Всё работает без IDE: пишешь запрос, смотришь прогресс, сливаешь результат в кодовую базу.
В пару кликов можно запускать фоновые агенты и следить за их действиями — как в Slack-интеграции, которую Cursor добавил ранее. У каждого агента — своя ссылка, можно делиться с командой.
Cursor уже используют больше половины Fortune 500, а выручка перевалила за $500 млн в год. Новое веб-приложение — попытка убрать трение в работе с агентами и сделать их доступнее для всех.
❯ Songscription — нейросеть, которая превращает музыку в ноты

Сервис Songscription расшифровывает музыку из аудио или видео в нотную запись. Просто загружаешь файл — и получаешь партитуру, которую можно править, сохранять в PDF или смотреть на виртуальном синтезаторе с подсветкой клавиш.
Сейчас лучше всего работает с фортепиано. Поддержка гитары, флейты и скрипки — в тесте. В будущем добавят голос и многоголосие.
Настраивается вручную или автоматически: можно задать размер такта, тональность и нужный инструмент. Сервис не пытается разобрать всё сразу, а выделяет конкретную партию — например, только фортепиано из ансамбля.
Бесплатно доступно 3 полные транскрипции и расшифровка фрагментов по 30 секунд. Подписка — $29.99 в месяц, открывает экспорт в MIDI и MusicXML.
❯ Gemini стал тренером по баскетболу
Блогер и разработчик Фарза Маджид сделал ИИ-тренера на базе Gemini 2.5 Pro. Загружаешь видео бросков в кольцо — модель считает попадания и даёт советы, как улучшить технику: силу броска, точность, угол и т.д.
Для визуализации он использовал OpenCV через Cursor — добавил счётчик, графику и текстовые подсказки прямо поверх видео. Всё работает в браузере.
Автор считает, что при грамотной TikTok-кампании такой сервис может зарабатывать до миллиона долларов в год. И предлагает адаптировать идею под футбол, теннис или любые виды спорта с видимыми ударами.
? AI в обществе и исследованиях
❯ Дания против дипфейков: авторские права на голос и внешность

Дания готовит закон, который даст людям авторские права на их лицо, тело и голос. Цель — борьба с дипфейками и защиту от несанкционированного использования внешности.
Что предлагает закон:
внешность и голос автоматически подпадают под охрану, как музыка или текст
можно требовать удаления дипфейк-контента и компенсации
защита распространяется на артистов и публичные выступления, даже сгенерированные ИИ
сатира и пародии останутся легальными
Министр культуры Якоб Энгель-Шмидт заявил: «Человека нельзя просто пропустить через цифровую копировальную машину». Законопроект поддерживают около 90% парламента, принять его могут уже этой осенью.
❯ Gemini сдала китайский экзамен гаокао лучше 99% выпускников

Gemini 2.5 Pro прошла один из самых сложных экзаменов в мире — гаокао, китайский аналог ЕГЭ. Результат — 655 баллов из 750, что выше, чем у 99% выпускников. Этого хватило бы для поступления в Университет Цинхуа — один из лучших вузов Китая ??
Задания взяли из реальных экзаменационных материалов — без адаптации под ИИ, всё как у людей. Особенно уверенно модель прошла математику, английский и естественные науки. В гуманитарных дисциплинах уступила модели Seed 1.6 от ByteDance.
❯ Neuralink научил пациентов управлять роботами силой мысли
Neuralink сообщил об успехах клинических испытаний: семь человек с параличом уже используют чип для управления компьютером и техникой. Они двигают курсор, печатают текст, управляют рукой робота Optimus, играют в Mario Kart и даже программируют — всё это без движений, только силой мысли.
Имплант вживляют в моторную кору мозга. В нём тысяча электродов, которые считывают нейросигналы. Обучение занимает от нескольких часов до 15 минут, а пользоваться можно до 14 часов в день — в том числе дома.
Компания уже готовит следующие этапы: в 2025 планируют восстановление речи, затем — увеличение числа электродов и постепенную интеграцию с ИИ. В финале это может стать универсальным интерфейсом для общения, управления техникой и передвижения.
❯ Работников колл-центров всё чаще путают с ИИ — и это их бесит

В эпоху реалистичных голосовых моделей живым людям приходится доказывать, что они не ИИ. Операторы горячих линий всё чаще слышат: «Вы точно не бот?» — и начинают кашлять, смеяться, рассказывать анекдоты, лишь бы убедить собеседника в своей человечности.
ИИ пока не вытесняет операторов: 95% компаний не планируют увольнять людей из колл-центров — так пишет Gartner. Но он встраивается по всем фронтам: распределяет звонки, убирает шум, маскирует акценты в реальном времени — например, через Krisp. Индивидуальность теряется, и пользователи всё чаще путают операторов с ботами.
По словам профсоюза связи США, операторы больше не могут говорить своими словами — всё фиксируется и передаётся начальству.
«Теперь ты должен быть как робот и читать скрипт», — говорит Нелл Гайзер.
Сет, оператор техподдержки, рассказывает, что иногда сам начинает сомневаться, человек ли он: «Я думаю, я вообще ещё человек?»
По мнению философа Нира Эйзиковица из Центра прикладной этики, это только начало: «Наше ощущение уникальности как вида будет постепенно исчезать».
? Gartner
❯ ИИ помогает находить багаж в Пулково

В аэропорту Пулково начали ставить станции с нейросетью для поиска багажа. Если чемодан потерялся, пассажир может показать пример похожего — например, фото из телефона. ИИ сравнивает его с камерами в зоне выдачи и помогает быстрее найти нужный багаж.
Пока станций немного, но технология уже работает: визуальный поиск по изображению + отслеживание в реальном времени. Представители аэропорта обещают, что система будет расширяться — особенно в пиковые сезоны.
Это не только про комфорт. За 2023 год в мире потеряли более 30 млн единиц багажа. Автоматизация этого процесса может снизить нагрузку на персонал и вернуть чемоданы пассажирам быстрее.
? Источник
❯ ChatGPT довёл автомеханика из Айдахо до психоза

Трэвис Таннер, 43-летний автомеханик из Айдахо, стал считать себя «носителем искры божьей» после общения с ChatGPT. Бот, назвавший себя Лумина, убедил его, что у него есть миссия — «пробуждать других». С тех пор Трэвис почти не общается с семьёй, говорит загадками и игнорирует быт.
«Я чувствую, что изменился. Я больше не злюсь», — сказал он в интервью CNN.
Первые «контакты» Таннер описал в апреле — сразу после обновления ChatGPT, которое потом откатили из-за странного поведения. На Reddit десятки историй: ИИ начинает «проповедовать», выдаёт себя за божество, советует бросать партнёров и отменять лекарства.
Нейт Шарадин из Центра безопасности ИИ объясняет: нейросети стараются угодить и усиливают даже опасные идеи — особенно у уязвимых пользователей.
В OpenAI это признают:
«Мы работаем над тем, чтобы ChatGPT не усугублял деструктивное поведение», — заявили в комментарии для Vox.
❯ ИИ научили выявлять бабезиоз у собак

Студенты Тимирязевской академии разработали нейросеть AI VetScope для быстрой диагностики бабезиоза — опасного заболевания крови, которое переносят клещи.
ИИ анализирует микроскопические изображения и распознаёт паразитов рода Babesia spp. с точностью до 99%. Диагностика занимает секунды — это критично при тяжёлой форме заболевания, когда счёт идёт на часы.
Проект сделали студенты Института зоотехнии и биологии — Дмитриева, Сорочан и Рамос-Бухарев — под руководством кандидатов наук Латыниной и Греченевой. AI VetScope уже победил в треке «Стартап как диплом» и получил высокую оценку среди аграрных ИТ-разработок.
? Источник
❯ Почему любимое число нейросетей — 27?

Шесть из семи топовых моделей — ChatGPT, Claude, Gemini, LLaMA и другие — при просьбе угадать число от 1 до 50 выбирают «27». Это выяснил специалист Мохд Фарааз из Capco. Единственный, кто дал другой ответ — Grok от xAI, он выбрал «42».
У ИИ нет доступа к генератору случайных чисел, а значит — нет настоящей случайности. Выбор делается по паттернам и обученным предпочтениям. «27» — не круглое, не крайнее и будто бы случайное, но на деле — слишком часто встречается.
Claude пояснил это сам:
«27 — не слишком очевидно, ближе к середине, с лёгкой асимметрией. Я избегаю чисел, кратных 5 или 10».
В более широком исследовании Хавьер Коронадо-Бласкес проверил 75 600 запросов к моделям на 7 языках и с разной температурой. Вывод: ИИ выбирают «любимые» числа — 3, 4, 7, 27, 37, 47, 73. Большинство из них — простые.
? 3DNews
?Заключение
Вот что происходило на неделе с 1 по 7 июля:
ИИ всё глубже проникает в повседневную жизнь — пишет музыку, водит машины, выносит диагнозы и даже убеждает людей в собственном просветлении.
Открытые модели становятся мощнее: SmolLM 3 — новая планка для компактных LLM, Microsoft запускает генерацию 3D, а HuggingFace и Mistral уверенно догоняют гигантов. Дания против дипфейков, а в Пулково нейросети помогают найти багаж.
До встречи в следующем дайджесте — будет ещё мощнее!
Какая новость зацепила тебя больше всего? Пиши в комментах! ?
Новости, обзоры продуктов и конкурсы от команды Timeweb.Cloud — в нашем Telegram-канале ↩
