OpenAI опубликовали фреймворк, на который мало кто обратил внимание. Исследование OpenAI (да и не только их) показало: компании внедряют ИИ, но часть из них не получает ожидаемого эффекта. В этом фреймворке на мой взгляд обозначены принципы отделяющие посредственные решения от тех которые делают внедрение AI в бизнес эффективным.

https://openai.com/index/evals-drive-next-chapter-of-ai/

KPI и OKR остаются бизнес-целями. Evals — метрики, которые показывают, как AI помогает достигать целей. Либо evals становятся частью KPI, либо контролируют качество AI, который двигает показатели вверх.

Это нужно, если бизнесу важны:
- Понятный путь к окупаемости (ROI)
- Свести критические ошибки к минимуму
- Предсказуемость результатов для клиентов
- AI, который выдерживает рост нагрузки без сбоев

Evals – конкурентное преимущество. Промпты скопируют, архитектуру evals – нет. Это скрытый слой, который недоступен ни поставщикам моделей, ни конкурентам.Evals гарантируют стабильность при обновлениях промптов, переходе на другие модели или архитектуру. Так AI-решение постоянно улучшается под задачи бизнеса не теряя в качестве.

Фреймворк OpenAI из 3 шагов:
1. Определение – превратите размытые цели в конкретные: "Конвертировать письма компаний с бюджетом 100K+ в демо, сохраняя стиль бренда"
2. Измерение – тестируйте на клиентских запросах и пограничных случаях
3. Улучшение – развивайте на основе результатов тестов, а не надейтесь на удачу

Для этого процесса создали BotMetrica.com – слой надёжности, который делает AI готовым к промышленному использованию.

В ближайшие дни поделюсь тем, как BotMetrica формализует каждый шаг этого процесса с конкретными примерами.

"Don't hope for 'great.' Specify it, measure it, and improve toward it" / "Не полагайтесь на удачу. Определите 'отличное', измерьте и улучшайте" – OpenAI

Пишите в личку – отвечу на вопросы и покажу сервис: @ovashchukov или на oleg@botmetrica.com

Комментарии (4)


  1. oleghka Автор
    29.11.2025 05:29

    Я здесь не писал с 2011 года. Вы уж сильно не пинайте


  1. oleghka Автор
    29.11.2025 05:29

    А может хоть один кто минусует сказать в чем проблема? Я не туда написал, или что-то не то сказал? Просто странно, написал текст вручную, картинки нарисовал, да с нанобананой, но все равно. В итоге одни минусы. Тут так принято на Хабре или я что-то не понимаю?


    1. Hardcoin
      29.11.2025 05:29

      Почему вас удивляет, что рекламу минусуют? Не можете же вы всерьез это спрашивать? А вот почему вашу рекламу минусуют сильнее, чем соседние посты, вам вряд ли кто-то расскажет.


      1. oleghka Автор
        29.11.2025 05:29

        Я делаю сервис и им делюсь под обоснованным и актуальным предлогом обзора статьи. Мне интересно, а как здесь на Хабре принято делиться своими проектами? Да, я правда не понимаю. В прошлый раз опубликовал свой перевод статьи о Adobe Fireworks и меня никто не хейтил за рекламу Adobe Fireworks.