• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

Intro Reinforcement Learning +3

  • 15.10.2025 14:51
  • anikengur
  • 0
  • Искусственный интеллект

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT +16

  • 25.09.2025 11:10
  • MaxiEnergy
  • 4
  • Блог компании К2Тех
  • Информационная безопасность
  • Интернет вещей
  • Беспроводные технологии
  • Машинное обучение

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +5

  • 01.08.2025 12:48
  • redmadrobot
  • 1
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

  • 24.07.2025 21:44
  • redmadrobot
  • 8
  • red_mad_robot corporate blog
  • Artificial Intelligence
  • Research and forecasts in IT
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

LiberalMind 1.5 новая LLM из России +7

  • 23.07.2025 12:15
  • teodor_unusov_official
  • 10
  • TensorFlow
  • Искусственный интеллект
  • Машинное обучение

ИИ простыми словами, часть 2. Reinforcement Learning (RL) +4

  • 06.02.2025 16:18
  • ElKornacio
  • 10
  • Машинное обучение
  • Искусственный интеллект

ИИ на путях: как решить задачу перепланирования расписания движения поездов +5

  • 23.01.2025 15:30
  • artur_temievich
  • 4
  • Первая грузовая компания (ПГК) corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Первая грузовая компания (ПГК)
  • Искусственный интеллект
  • Машинное обучение

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

  • 15.01.2025 16:19
  • Ariman
  • 17
  • Искусственный интеллект
  • Python
  • Машинное обучение
  • Программирование
  • Разработка игр

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

  • 14.11.2024 08:01
  • KirillKhrylchenko
  • 1
  • Блог компании Яндекс
  • Машинное обучение
  • Алгоритмы
  • Natural Language Processing
  • Анализ и проектирование систем

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

  • 01.10.2024 11:34
  • ruslandevlabs
  • 14
  • Машинное обучение
  • Искусственный интеллект

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

  • 26.09.2024 07:06
  • AmigoRRR
  • 0
  • Блог компании Сбер
  • Программирование
  • Машинное обучение
  • Робототехника
  • Искусственный интеллект

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

  • 19.09.2024 13:16
  • anna_schenikova
  • 1
  • Блог компании МТС
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Reinforcement Learning в задаче групповой оптимизации цен

  • 08.07.2024 10:34
  • muxeu
  • 0
  • Блог компании X5 Tech
  • Математика
  • Машинное обучение
  • IT-компании
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • »
Страница 1 из 6
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
07:30

Вы не сможете это развидеть: краткий гайд по определению LLM-текстов на хабре +20

07:00

Открывашка из трубки домофона +20

07:05

Закрепи меня покрепче: Pin, самоссылки и почему всё падает +11

08:00

Что происходит, когда вы добавляете строку в PostgreSQL +10

07:43

Samsung Q1: крошечный ПК, который пытался изменить мир +7

06:03

От Dutch courage до Mexican standoff: гид по «национальным» идиомам английского языка +7

07:01

Канцелярия 2.0: автоматизация ключевых процессов  от архива до курьерской доставки +6

08:05

Система мониторинга и подсчета перелетных птиц +5

06:47

Что такое STATIK и с чем его едят: системный подход для внедрения Kanban «снизу вверх» +4

06:27

Как математики решают обратную задачу для строительства в Арктике +4

06:35

Писк модема, LAN-пати и облака: как сеть научилась играть +3

05:24

Крупнейшая база скринов российских приложений, поиск точек роста в диалогах с клиентами — и ещё 8 российских стартапов +3

08:50

Что такое платформа оркестрации Voice AI +2

08:15

Как я с нуля культивировал свою open-source платформу для изучения японского до 10 000 ежемесячных пользователей +2

08:08

Импортозамещение: как мы в процессинге внедряли отечественный HSM +2

07:10

Как сделать ИИ-агентов и RAG действительно автономными +2

05:16

Я построю свою метеостанцию, с E-Ink и Tuya +2

00:23

Почему я слежу за open-source проектом cia76/FinLabPy и считаю, что он важен для работы с Мосбиржей +2

08:31

Специфика перехода к сервисной архитектуре в финтех-проектах: кейс команды разработки финтеха ВКонтакте +1

08:24

Windows XP: 20-летняя система до сих пор работает на миллионах устройств +1

12:58

IT. Конец «золотого века» +99

07:05

Сказ о том, как сделать самый большой флот автономных грузовиков в России с нуля… +50

22:49

Как SMM Газпрома устроили добровольный «слив» данных клиентов +43

13:01

Реверс-инжиниринг шифрования прошивки радиостанции +40

08:06

Как работают ИИ-агенты и кому они на самом деле нужны +37

18:16

Архитектура слежки: Сравнительный анализ приватности веб-браузеров +31

07:05

Ищем ошибку в работе WiFi у платы ESP32-C3 SuperMini +30

04:57

Чебурахнувшийся робот, а также ИГРОКУБ от Valve +30

09:01

Дирижабли нового поколения и летающие ветряки +29

08:00

Как работают федеративные системы: рассказываем на примере YDB +28

13:57

Helm v4: разбираем ключевые отличия от Helm v3 +26

16:02

Как мои земляки изобрели трезвого дворника. Коммунальный пылесос для маленького города +25

13:43

Принц Древнего Египта, который очень любил свою кошку⁠… +22

12:00

Балансировка нагрузки в Яндексе: новые проблемы роста +20

14:49

Обнаружена первая фигура, не способная пройти через саму себя +19

12:00

Как ускорить управление сетевой подсистемой Linux: пишем Netlink-обертку на C++ +19

09:15

Почему корпорации зарабатывают миллиарды на «бесплатном» коде. История Open source +19

09:00

Как настроить Nginx, чтобы выдержать DDoS +19

09:00

Как настроить Nginx, чтобы выдержать DDoS +19

07:00

Как мы проектируем и ставим импланты детям в виде божьих коровок, чтобы им лучше дышалось +17

13:20

Нижегородское метро: 40 горьких лет +149

12:15

Что скрывается за «сертификатами безопасности» от Минцифры? +102

11:19

Как за 5 дней с помощью Claude я создал приложение для кошки с диабетом (и кажется запустил стартап) +80

14:38

На смерть Джеймса Уотсона +53

13:01

Теория неоднородной Вселенной как альтернатива тёмной энергии +45

08:00

Hi-tech наушники Sony WH-1000XM6: мой опыт использования и впечатления из первых рук +33

07:05

Ностальгические игры: Fallout New Vegas +33

06:31

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера +33

17:28

Как устроена цензура изнутри. На примере слитого китайского фаерволла (блокировки Tor, VPN, анализ трафика) +30

16:09

Многопоточность без боли: моя шпаргалка для собесов в Java +28

09:01

Digital Ocean преследует меня из-за $0,01 или Полезный урок по автоматизации +25

18:31

Пример реализации агентного RAG'а +17

19:16

Какой Ai-шник нынче нужон?! / Исследование ИИ рынка труда РФ +15

19:14

Руководство по архитектуре браузерных песочниц: как работает изоляция JavaScript-кода +14

15:16

Архитектура фронтенда. Навеяно болью от использования FSD +13

07:00

Самые необычные серверы Minecraft: от умной лампочки до микроконтроллера. Как это работает? +12

14:17

3D-таймлайн на чистом JavaScript: как я собирал этот слайдер по шагам +9

12:00

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности +9

06:00

GitHub SpecKit: вайб-кодинг на основе спецификаций +9

14:31

ПДн в нашем доме или 152-ФЗ в практике ЖКХ +7

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Концепт идеального коттеджа – комфортно, дешево, технологично +4

    • 407

    Что скрывается за «сертификатами безопасности» от Минцифры? +102

    • 325

    Нижегородское метро: 40 горьких лет +149

    • 288

    IT. Конец «золотого века» +99

    • 173

    Русский JavaScript — это не баг, это фича будущего. Представляю RJS -28

    • 160

    Как за 5 дней с помощью Claude я создал приложение для кошки с диабетом (и кажется запустил стартап) +80

    • 69

    Ностальгические игры: Fallout New Vegas +33

    • 58

    Hi-tech наушники Sony WH-1000XM6: мой опыт использования и впечатления из первых рук +33

    • 55

    Как устроена цензура изнутри. На примере слитого китайского фаерволла (блокировки Tor, VPN, анализ трафика) +30

    • 43

    Архитектура фронтенда. Навеяно болью от использования FSD +13

    • 40

    Сказ о том, как сделать самый большой флот автономных грузовиков в России с нуля… +50

    • 35

    На смерть Джеймса Уотсона +53

    • 33

    Так ли страшен полиграф, как о нем говорят? Полиграф при трудоустройстве +1

    • 32

    Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера +33

    • 32

    Манифест цифровой приватности: От Zero Trust до анонимных сетей +1

    • 28

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.