• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом бенчмаркинг

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет +14

  • 30.06.2026 06:32
  • alenusch
  • 1
  • Блог компании Сбер
  • Машинное обучение
  • Искусственный интеллект

Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front +8

  • 27.06.2026 16:21
  • Happynood
  • 1
  • Машинное обучение
  • Python
  • Open source
  • Высоконагруженные системы
  • DevOps

Свой инструмент для бенчмаркинга ИИ-агентов: архитектура, надёжность и интеграция с Airflow +4

  • 10.06.2026 08:40
  • TruthIsNear
  • 1
  • Блог компании Сбер
  • Машинное обучение
  • Тестирование IT-систем

Как бенчмаркать ИИ, и как это делаем мы? +6

  • 17.04.2026 11:35
  • Kodik_AI
  • 2
  • Блог компании Kodik
  • Искусственный интеллект
  • качество кода

Битрикс24 бенчмарк для оценки LLM +3

  • 30.07.2025 08:00
  • Alian3785
  • 6
  • 1С-Битрикс
  • Искусственный интеллект
  • Исследования и прогнозы в IT
  • CRM-системы

Бенчмарки и метрики сравнения с продуктами-конкурентами как инструменты повышения качества мобильного приложения

  • 14.07.2025 06:33
  • YoloGuy
  • 0
  • Исследования и прогнозы в IT
  • Монетизация мобильных приложений
  • Разработка мобильных приложений
  • Тестирование мобильных приложений
  • Управление продуктом

Оценка систем LLM: основные метрики, бенчмарки и лучшие практики +2

  • 22.01.2025 11:34
  • kucev
  • 0
  • Big Data
  • Data Engineering
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение

Мы дарим подарок для вашего будущего проекта — аналитику за свой счет

  • 25.12.2024 08:24
  • AntonLis
  • 0
  • Аналитика мобильных приложений
  • Управление проектами
  • Управление разработкой
  • Управление продуктом
  • Разработка мобильных приложений

Сравнение бенчмарков LLM для разработки программного обеспечения +5

  • 14.11.2024 13:33
  • kucev
  • 2
  • Big Data
  • Data Engineering
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение

Как мы исследовали энергоэффективность инференса нейросетей на планшете +21

  • 14.11.2024 09:45
  • burchanie
  • 0
  • Блог компании YADRO
  • Искусственный интеллект
  • Тестирование IT-систем
  • Планшеты
  • Процессоры

Шлепа — Большой Русский Бенчмарк

  • 02.09.2024 07:00
  • alexwortega
  • 11
  • Python
  • Искусственный интеллект
  • Natural Language Processing

LIBRA: Long Input Benchmark for Russian Analysis

  • 08.08.2024 09:02
  • Gscraid
  • 0
  • Блог компании SberDevices
  • Открытые данные
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Почему новый процесс в Node порождается так медленно?

  • 04.08.2024 10:11
  • Sivchenko_translate
  • 4
  • JavaScript
  • Программирование
  • Node.JS
  • Исследования и прогнозы в IT

Арифметика с плавающей точкой без ошибок

  • 07.06.2024 07:10
  • zergon321
  • 10
  • Programming
  • Algorithms
  • Mathematics
  • Программирование
  • Алгоритмы
  • Математика

Как так вышло, что при лишнем шаге сборки моё приложение на Zig ускоряется в 10 раз

  • 29.04.2024 07:54
  • Sivchenko_translate
  • 7
  • Занимательные задачки
  • Программирование
  • Zig
  • «
  • 1
  • 2
  • 3
  • 4
  • »
Страница 1 из 4
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
10:05

Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +51

08:32

Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +49

09:02

Почему cron — самый опасный инструмент в Linux +32

12:30

Passkey без Apple, Google и облаков: делаем собственный аппаратный ключ за 4 евро +29

12:00

Пузырь ИИ лопнул? Бизнес отказывается от ChatGPT, а Microsoft пытается спасти положение софтом: ML-дайджест +29

07:05

kafkactl — другой взгляд на работу с Kafka +29

07:03

Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +27

07:04

Умеют ли трансформеры водить машину +26

07:01

Шахматная память: как гроссмейстеры запоминают тысячи партий и почему это не мнемотехника +20

09:17

Почему опасно покупать Intel Core i7 и i9 с рук: разбираемся с деградацией процессоров 13900K и 14900K +19

08:01

Распределённый монолит: как одну проблему превратить в целый кластер проблем +17

13:01

Flappy Bird: делаем игру сложнее и добавляем автопилот на чистой математике +16

09:09

Проектируем с нуля калькулятор на FPGA. Часть 6: CPU +16

07:01

Реконструкция мониторинга в ЦОД без боли и переучивания персонала +16

14:27

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого… +15

08:00

Как мы реализовали оптимальное обучение CV-моделей в Luna Line. Часть 2. Сегментация +14

06:32

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет +14

14:42

Почему сгорел Нотр-Дам: человеческий фактор, SHERPA и HTA в UX-проектировании интерфейса +13

10:26

Я декомпилировал свою зависимость: как программист раскидал курение на 100+ субличностей и перестал курить +13

07:23

Как я написал систему мониторинга диабета на Django для своей дочери. От жизненной проблемы до архитектуры решения +13

15:10

Народная карта бензина собрала почти 2 млн посетителей за три дня. Её навайбкодил один человек +103

05:26

Как Яндекс меня кинул на фестивале для будущих яндексоидов, или Хроники одного YoungCon +60

07:01

Манипуляция ответами нейронок — как сеошники убивают интернет +55

07:59

Как мы работаем со студентами: дипломы, которые становятся частью YDB +46

07:59

Как мы работаем со студентами: дипломы, которые становятся частью YDB +46

11:12

Event Sourcing в платформе данных: миграция с JSON на Avro +42

11:13

Айсберг Доменов Верхнего Уровня (ICANN и не только) +40

07:05

Размагничивание кораблей: мины, физика и Курчатов. Часть 2 +40

09:01

TeamPCP: как команда хакеров-любителей «Дюны» закинула в наши Node.js-пакеты червей Shai-Hulud +38

05:05

Как одна операция из линейной алгебры захватила мир ИИ +37

21:02

Рунет без Google Login: что теперь делать с авторизацией +35

06:00

Человек-легенда, давший нам Спектрум и предсказавший ИИ +34

07:06

Семь раз подумай, один раз пошардируй: как мы начали горизонтально масштабировать метаданные чатов Телемоста +33

11:19

Как я переехал с Altium Designer на KiCAD +31

13:01

Триллионы километров данных: ваш автомобиль следит за вами, и это только начало +30

08:09

Обзор необычного и очень мощного мини-ПК Khadas Mind 2 +30

18:13

Как «ужать» мегаполис до размеров iPhone 4 +24

15:05

И снова самый быстрый парсер JSON. Очередной +24

06:28

Забор из волшебных палочек +24

17:14

Что на самом деле означают теоремы Гёделя о неполноте? +23

13:31

Берлин, 1927: танец на вулкане +106

09:01

Раньше ПО работало шустро, потому что иначе было никак +69

13:01

Rekam iLook 500: бюджетный китайский OEM под видом канадского бренда +51

09:53

Организовал весь пентест-арсенал в одном месте: всё под рукой, офлайн и на русском +42

16:25

Arcanum: стимпанк, черный юмор и свобода +36

10:11

Все демонические насельники ИИ… по старшинству +31

08:00

Испанская барахолка: жара, ламповый Philips, клон Dendy и CD-гигант Sony на 200 дисков +28

10:18

Структуры данных на практике. Глава 16: Фильтры Блума и вероятностные структуры данных +24

18:05

«Это ABSOLUTE CINEMA». Почему 007: First Light — лучшая игра про Бонда и главный сюрприз года +23

18:05

Подключаем к ПЛИС оперативную память SDRAM +21

12:14

Загружаем bitstream из Linux через FPGA Manager на Zynq-7000 +21

12:29

Как я писал диплом в LaTeX: Docker, CI/CD, Latexmk, Mermaid, и многое другое +18

11:32

Как заставить LLM выбирать осмысленные фрагменты из часовой расшифровки: почему «найди интересные моменты» не работает +17

09:39

Как с помощью Мегафон и Max навсегда потерять доступ к клиентам- информационная безопасность на уровне тупика +16

16:41

Многоэтапные сборки в Docker: как уменьшить образ с 1,2 ГБ до 50 МБ +15

09:48

Первый промт-инженер компьютерных душ: как Алан Тьюринг предлагал воспитывать ИИ +13

00:56

Граф кода одной командой: ставим graphlens-mcp в проект и перестаём жечь токены на grep +12

08:43

Машина, которая умоляет +11

18:27

В поисках идеального тона: хроники гитарного энтузиаста +10

14:49

После симметрии: сверхИИ и несвободное сохранение человека +10

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Народная карта бензина собрала почти 2 млн посетителей за три дня. Её навайбкодил один человек +103

    • 172

    Рунет без Google Login: что теперь делать с авторизацией +35

    • 104

    Раньше ПО работало шустро, потому что иначе было никак +69

    • 97

    Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +51

    • 85

    Как вернуть былую энергию после 40? Тренировки, образ жизни, чек-ап, пептиды +5

    • 82

    Как с помощью Мегафон и Max навсегда потерять доступ к клиентам- информационная безопасность на уровне тупика +16

    • 59

    Как Let's Encrypt, только роднее: автоматическое получение бесплатного RSA DV-сертификата НУЦ +15

    • 57

    Что лучше — C++ или C#? +5

    • 51

    Дело на вечер: собираем домашний ИИ-сервер +17

    • 50

    Что на самом деле означают теоремы Гёделя о неполноте? +23

    • 49

    Перспективы ИИ в России: снова на исходной позиции, как и 100 лет назад (про политику) -2

    • 36

    Вычурное название для вредной еды +10

    • 35

    VK выпилили из AppStore, а также рекордная жара в Европе +21

    • 28

    И все‑таки самая реальная защита дома или квартиры — электронно‑механический шлюз -9

    • 26

    HTCE: когнитивное ядро нового поколения, которое не верит без доказательств +3

    • 26

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.