Лучшие модели для вайбкодинга на 1С. Часть 4 (Sonnet 4.5/gpt-5-codex) / forpes.ru

Главная
Лучшие модели для вайбкодинга на 1С. Часть 4 (Sonnet 4.5/gpt-5-codex)

Лучшие модели для вайбкодинга на 1С. Часть 4 (Sonnet 4.5/gpt-5-codex) +2

30.09.2025 02:38

comol85 5 2200 Источник

К рейтингу добавил Sonnet 4.5 и gpt-5-codex. Кратко рассмотрел также несколько новых китайских моделей. Предыдущая часть рейтинга тут.

Также рассмотрены новые китайские модели: KAT-Dev-32B, Liquid LFM2-2.6B. И очень популярный на OpenRouter: Grok Code Fast 1/

Итоговая табличка ниже:

Краткие выводы:

Всё просто Claude 4.5 Sonnet самая лучшая на текущий момент времени модель для кодинга на 1С. Юзайте её - без вариантов. Стоимость более менее нормальная.

gpt-5-codex - не надо использовать даже если можно получить код нормального качества - всё очень долго. Множество вопросов от модели, куча контекста, куча вызовов MCP через каждое слово. Есть ощущение что в данных обучения модели код 1С отсутствтовал почти совсем, она конечно "дообучается налету" из контекста. Но это не приводит к хорошим результатам и по времени прямо очень плохо.

Grok-code-fast1 - вцелом даёт нормальные результаты. Но с Sonnet 4.5 конечно не сравнить.

Китайцы пока ничем новым хорошим не удивили.

Некоторые условия эксперимента:

MCP серверы из комплекта: https://vibecoding1c.ru/ Подключен сервер по справке 1С и по проверке синтаксиса. Ни в коем случае не подключен TemplateSearch - и ним просто сети находят нужные шаблоны и получается почти 100% результат
Web поиск выключен. Обязательное условие чтобы модель не пыталась найти решение, а то может его найти как минимум в моих предыдущих статьях
Rules отсюда

На текущий момент времени Openai-codex отсутствует на LMArena и SWE-Bench в силу своей закрытости.

По Sonnet 4.5 Есть только данные с рекламки Claude, но для общей разработки они весьма многообещающие:

Для LMArena ещё рановато. Там пока расклад сил не изменился.

По Kwaipilot есть рейтинг только их:

Собственно из него следует что модель хуже текущих лидеров рейтинга (Qwen и GLM) и трудно ожидать от неё "чудес", поэтому проверю лишь основные вопросы, если отставание от лидеров будет очевидным - тестирование можно будет закончить.

Grok-code-fast-1 бессменный лидер рейтинга OpenRouter.

Предполагаю что главным образом из за цены, но надо проверить качество. Если оно будет сопоставимо с основным Grok4, то вероятно заменю в рейтинге.

Итак, преступим:

Задача 1:

Напиши код на языке 1С который заполняет массив случайными целыми числами и потом сортирует его методом пузырька

Ну Liquid отпал сразу - для 1С не подходит

KAT-Dev уже тут показала весьма посредственные результаты. Но можно попробовать ещё один тест. Claude-Sonnet написал действительно идеальный код - не к чему придраться. OpenAI-Codex тоже вцелом неплохо справился с задачей, за исключением использования функции которая возвращает одно числовое значение, ну и кажется MCP он вызывал куда чаще чем Sonnet. Grok code fast - действительно fast, но всякие артефакты вроде ВГраница() и отсутствие прерывания заранее.

Задача 2:

Создай таблицу значений с полями "номенклатура, Количество, Сумма, Дата" заполни тестовыми данными и напиши код который демонстрирует списание товара из этой таблицы по методу FIFO. При списании указывается только количество и номенклатура. Это должен быть код на языке 1С

Kat-Dev совершило логическую ошибку. Grok-code-fast-1 - проблемы с синтаксисом, даже при условии проверки. Claude sonnet - всё прекрасно. gpt-5-codex несколько напрягает своим агентским режимом. Переспрашивает несколько раз по плану действий. Код генерирует вроде рабочий, но жутко долго и достаточно странный.

Задача 3:

есть таблица - Основная таблица регистра накопления. В ней есть колонки Номенклатура, Дата, Количество, а также Цена. Пусть регистр накопления называется ОстаткиТовара. Напиши запрос на языке 1С которые получает цену товара на заданную дату. Дата задаётся в параметре запроса

KAT-DEV тут получает 2, код не имеет ничего общего с запросом. Gpt-codex не справился тоже. Неожиданно code fast неплохо справился с задачей. Sonnet получает 10-ку. Спросила правильные вопросы и написала отличный код

Задача 3.1:

есть таблица - таблица значений. В ней есть колонки Номенклатура, Дата, Количество, а также Цена. П. Напиши запрос на языке 1С которые получает цену товара на заданную дату. Дата задаётся в параметре запроса. Это должен быть именно запрос а не код для перебора таблицы

Sonnet очень хорошо справился с задачей, даже в закомментированном примере заполнения таблицы про ОписаниеТипов не забыл... KAT-DEV я на этом исключаю из рейтинга. Очевидно для разработки на 1С эта модель не подходит. codex в этом отношении тоже так себе

Задача 3.2:

есть таблица в базе 1С. В ней есть колонки Номенклатура, Дата, Цена. Это непереодический регистр сведений "цены товара" (использовать СрезПоследних() не получится). Напиши запрос на языке 1С которые получает актуальную (последнюю по дате) цену всех товаров на заданную дату. Дата задаётся в параметре запроса.

Grok тут неплохо справился с задачей. Sonnet чуть получше - ВТ лучше чем подзапросы в общем случае. Codex почти решил задачу правильно, но очень как то не по 1С-ному написал запрос. Но в итоге код не рабочий.

Задача 4:

Есть справочник номенклатура с неограниченным числом уровней иерархии. Нужно запросом вывести все его группы и уровень иерархии каждой. Запрос на языке 1С.

Без сомнения самая сложная задача данного теста. Мало какой разработчик её решит. У нейросетей без шаблонов и Web поиска тоже обычно не много шансов. Собственно говоря тут не справилась и sonnet 4.5. Без шаблона пока такую задачу не решить.

Задача 5:

Используя API с сайта ЦБ РФ https://www.cbr.ru/development/sxml/ напиши код на языке 1С Предприятия для загрузки курса доллара за последний год на каждый день в таблицу значений

Тут как code-fast так и sonnet справились наотлично. А тут codex просто не справилась. После более чем часа работы и двух переспросов. Кажется что данная модель просто не обладает нужными знаниями для разработки на 1С. Хотя вцелом для разработки заложено достаточно много.

Задача 6:

Есть файл Excel с колонками: Артикул, Наименование, Описание, Единица измерения. Есть справочник Номенклатура в 1С с аналогичными реквизитами. Напиши код на языке 1С для загрузки данного Excel файла в справочник.

Тут кажется сети соревновались в крутости. Sonnet спросила очень правильные вопросы и вцелом написала хорошую загрузку. codefast - вопросов не спрашивал но почти верно сгенерировал форму и справочники сам додумал. Но под УТ, к примеру, были бы корректными.

Задача 7:

У меня есть две одновременно открытые управляемые формы в 1С. На одной из форм есть заполненная табличная часть "товары", мне нужно передать наполнение этой табличной части во вторую форму чтобы отобразить его на ней. Напиши код для одной формы и для второй.

Тут немного странно но нейросети не справились. Чуть чуть ближе была Sonnet - по крайней мере "догадалась" про временное хранилище

Задача 8:

У меня в конфигурации есть справочник Номенклатура - напиши код на языке 1С для его выгрузки в идентичную конфигурацию.

codefast и codex сделали частный случай - ручная выгрузка в XML. Sonnet справился с задачей хорошо. В отличие от sonnet у codefast интересный подход - почти всегда пытается генерировать формы и метаданные которых нет. Генерирует, к слову, так себе... для этого надо ещё работать над контекстом (через MCP).

Задача 9:

В конфигурации 1С Справочник Номенклатура, у него на форме элемента есть элемент с типом "Декорация" с видом "Картинка", называется "Картинка" а также реквизит "Картинка" с типом "ХранилищеЗначения". Напиши код который отображает картинку из реквизита при открытии формы и при нажатии на картинку на форме даёт возможность выбора файла с картинкой и перезаписывает её для элемента

Codex и Sonnet справились неплохо. Sonnet немного более красивый код.

Задача 10:

На форме документа 1С основной реквизит "Объект". У документа есть реквизит "Комментарий". Напиши код, работающий при нажатии на кноку "Записать комментарий", который в комментарий документа добавляет слово "Тест" - к текущему комментарию и записывает документ в базу данных не закрывая формы.

codefast с задачей не справилась совсем, codex тоже. Sonnet написала примерно то что надо.

Задача 11:

На форме документа 1С есть табличная часть "товары". В документе обычно более 1000 строк. В табличной части есть реквизит "Сумма". Напиши код который работает при нажатии на кнопку "общая сумма" который должен посчитать сумму по всем строкам и вывести её пользователю

codefast и sonnet, codex вцелом тоже неожиданно "додумались" что нужно пересчитать таблицу на сервере. Как это ни странно для НС это может быть неочевидным поведением.

Кстати, удивительное наблюдение из gpt-5-codex:

Надпись на китайском... Странные вещи происходят в этом мире :-)

Итого, новая модель Anthropic - хороший шаг вперёд. Используйте её.

Если хотите больше узнать о вайбкодинге для 1С

подписывайтесь на канал

И также 18.10.2025 будет конференция — vibecoding1c^{[реклама удалена мод.]}

Приходите.

Комментарии (5)

vis_inet
30.09.2025 04:12
#28898560
Напиши код на языке 1С который заполняет массив случайными целыми числами и потом сортирует его методом пузырька

Скажите, в реальной работе в 1С вам хоть раз понадобилась реализация этого алгоритма?
1. comol85 Автор
  30.09.2025 04:12
  #28903610
  Нет конечно. И не придётся. Меня удивляет что серьёзно приходится объяснять почему этот тест первый в бенчмарке. Смысл в том что это простейший алгоритм, который "знает" любая сеть которая умеет кодить хоть на чём то. И его очень просто проверить.
  
  Посему:
  
  1) Если сеть не может сделать сортировку пузырьком надо её сразу выкидывать - кодить этой моделью нельзя
  
  2) Если сеть не может сделать его на 1С - значит адаптировать такой простой алгоритм под 1С синтаксис она не может - не знает её совсем. Кодить на 1С этой моделью нельзя.
  
  Таким образом этим бенчмарком безбожно откидываются все сети которые 100% непригодны для разработки.
  
  И даже в нём сетки сделанные специально для разработки показывают хороший результат.. и он заметен сразу

vis_inet
30.09.2025 04:12
#28898568
Очень хотелось бы видеть получившийся код для каждой задачи.
1. Borisskin
  30.09.2025 04:12
  #28900842
  В прошлом испытании была ссылка на репо, странно что Олег не обновил там данные :(
  https://github.com/comol/ai_model_1c_vibe_testing
  1. comol85 Автор
    30.09.2025 04:12
    #28903602
    Ну время это всё занимает. Вцелом код я уже примерно приводил для каждого кейса. В данном случае имело смысл привести только для sonnet по сути. Ну просто и без просмотра кода достаточно очевидно что она прекрасна...

Лучшие модели для вайбкодинга на 1С. Часть 4 (Sonnet 4.5/gpt-5-codex) +2

Комментарии (5)

vis_inet

comol85 Автор

vis_inet

Borisskin

comol85 Автор