• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

Реализуем Q learning на Python +1

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT +16

  • 25.09.2025 11:10
  • MaxiEnergy
  • 4
  • Блог компании К2Тех
  • Информационная безопасность
  • Интернет вещей
  • Беспроводные технологии
  • Машинное обучение

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +5

  • 01.08.2025 12:48
  • redmadrobot
  • 1
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

  • 24.07.2025 21:44
  • redmadrobot
  • 8
  • red_mad_robot corporate blog
  • Artificial Intelligence
  • Research and forecasts in IT
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

LiberalMind 1.5 новая LLM из России +7

  • 23.07.2025 12:15
  • teodor_unusov_official
  • 10
  • TensorFlow
  • Искусственный интеллект
  • Машинное обучение

ИИ простыми словами, часть 2. Reinforcement Learning (RL) +4

  • 06.02.2025 16:18
  • ElKornacio
  • 10
  • Машинное обучение
  • Искусственный интеллект

ИИ на путях: как решить задачу перепланирования расписания движения поездов +5

  • 23.01.2025 15:30
  • artur_temievich
  • 4
  • Первая грузовая компания (ПГК) corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Первая грузовая компания (ПГК)
  • Искусственный интеллект
  • Машинное обучение

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

  • 15.01.2025 16:19
  • Ariman
  • 17
  • Искусственный интеллект
  • Python
  • Машинное обучение
  • Программирование
  • Разработка игр

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

  • 14.11.2024 08:01
  • KirillKhrylchenko
  • 1
  • Блог компании Яндекс
  • Машинное обучение
  • Алгоритмы
  • Natural Language Processing
  • Анализ и проектирование систем

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

  • 01.10.2024 11:34
  • ruslandevlabs
  • 14
  • Машинное обучение
  • Искусственный интеллект

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

  • 26.09.2024 07:06
  • AmigoRRR
  • 0
  • Блог компании Сбер
  • Программирование
  • Машинное обучение
  • Робототехника
  • Искусственный интеллект

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

  • 19.09.2024 13:16
  • anna_schenikova
  • 1
  • Блог компании МТС
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Reinforcement Learning в задаче групповой оптимизации цен

  • 08.07.2024 10:34
  • muxeu
  • 0
  • Блог компании X5 Tech
  • Математика
  • Машинное обучение
  • IT-компании

Создание масштабируемых RL систем с Ape-X

  • 01.06.2024 08:56
  • badcasedaily1
  • 1
  • Блог компании OTUS
  • Python
  • Программирование
  • Машинное обучение
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • »
Страница 1 из 5
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
02:49

Интеграция компьютерного зрения и многопараметрического анализа в оценку симптоматики шизофрении +1

09:01

Про ультразвуковые ножи +57

08:16

Как я купил Lenovo Thinkpad и начал понимать что такое настоящее терпение +50

07:05

Его величество — Маховик +33

13:51

Погружение в IT на Merge Baltic: зачем айтишнику ехать на конференцию у моря, и что привезти с собой из Светлогорска +27

13:08

Как владение кошкой влияет на мозг человека (и на мозг кошки) +27

13:01

Enya Inspire — умная углепластиковая электрогитара для гиков +27

14:15

«Русскоязычных пособий по Lua катастрофически не хватает. Мы решаем эту проблему». Читаем главу о введении в стек +24

07:10

QR-код по запросу: знакомство с QRious +24

12:41

Топ-30 бесплатных нейросетей, которые облегчат вашу жизнь +23

10:28

Отделяем мух от Kotlett. Динамические обновления без релизов и BDUI +21

10:28

Отделяем мух от Kotlett. Динамические обновления без релизов и BDUI +21

08:22

Улучшаем качество приёма с помощью фильтров и малошумящих усилителей +21

14:05

Нейро-дайджест: ключевые события мира AI за 1-ю неделю октября 2025 +17

11:00

Если вы перешли на лысую сторону +16

08:11

Как дизайнеры совершенствуют проектные процессы в Авито с помощью матрицы DACI +16

07:00

Ловим ошибки в диалогах поддержки с помощью LLM: опыт команды Yandex Crowd +16

08:01

Эмоциональный дизайн в интерфейсе: как внедрение практики влияет на метрики +15

10:36

«Вы делили на ноль?»: QA-разбор проблем утечки памяти в новой macOS Tahoe 26 +14

09:55

Линус Торвальдс жёстко отверг поддержку big-endian RISC-V +13

10:23

Откуда берётся запутанный код +12

05:00

Хватит писать «чистый» код. Пора писать понятный код +92

09:01

Изучаем рефаб Nokia 5300 за $20: как китайцы возвращают к жизни старые телефоны +72

07:01

Cherry MX: чем маленькая инновация 80-х покоряет современный мир +66

08:30

«Колобок»: история одной советской мыши, которая не хочет работать +64

09:00

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1 +49

13:01

Оптимальный уровень мошенничества — выше нуля +38

10:35

Как умерли небольшие контентные сайты +38

07:05

Pytest. Гайд для тех, кто ни разу про него не слышал +38

11:14

Как с помощью локальной LLM автоматизировать рутину и облегчить жизнь себе и коллегам +31

15:37

ESP32: Базовые алгоритмы машинного обучения +29

06:15

Компьютерное зрение + ARKit = AR-навигация внутри зданий +29

04:00

DIY Open Source принтер. Часть 2. Логика управления печатающей головой HP123 +29

09:21

Как PHP «теряет» цифры: большие числа, double и неожиданные баги +27

16:29

Чёрные дыры подтвердили правоту Стивена Хокинга самым чётким сигналом на сегодняшний день +26

07:00

Полный гайд по golden-тестам во Flutter: зачем нужны и как настроить +22

14:35

PostgreSQL 18: быстрее, умнее, нагляднее +21

09:00

ИТ-менеджер, который перестал быть «пожарным». История управления 40 проектами и система, которая меня спасла +15

11:02

Бэктестер для торговых стратегий на GPU со скоростью просчёта 150 тыс стратегий за 1 секунду +13

10:59

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом +13

12:28

Погружаемся в недра Retrofit +12

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Как я купил Lenovo Thinkpad и начал понимать что такое настоящее терпение +52

    • 179

    Как умерли небольшие контентные сайты +38

    • 157

    Хватит писать «чистый» код. Пора писать понятный код +92

    • 116

    «Колобок»: история одной советской мыши, которая не хочет работать +64

    • 69

    Его величество — Маховик +33

    • 53

    Про ультразвуковые ножи +57

    • 48

    Чёрные дыры подтвердили правоту Стивена Хокинга самым чётким сигналом на сегодняшний день +26

    • 44

    Линус Торвальдс жёстко отверг поддержку big-endian RISC-V +13

    • 42

    Бэктестер для торговых стратегий на GPU со скоростью просчёта 150 тыс стратегий за 1 секунду +13

    • 38

    Изучаем рефаб Nokia 5300 за $20: как китайцы возвращают к жизни старые телефоны +72

    • 35

    Как с помощью локальной LLM автоматизировать рутину и облегчить жизнь себе и коллегам +31

    • 24

    Приказ 221 v2 Роскомнадзора для простых админов — создать XML и выжить +4

    • 23

    Cherry MX: чем маленькая инновация 80-х покоряет современный мир +66

    • 23

    14 российских аналогов Telegram и WhatsApp для звонков в России -16

    • 22

    Всевидящее небо: дроны и конец приватности +2

    • 22

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.