Публикации с тегом reinforcement learning / forpes.ru

Публикации с тегом reinforcement learning

Intro Reinforcement Learning +3

Искусственный интеллект

Реализуем Q learning на Python +3

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT +16

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +5

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

LiberalMind 1.5 новая LLM из России +7

ИИ простыми словами, часть 2. Reinforcement Learning (RL) +4

ИИ на путях: как решить задачу перепланирования расписания движения поездов +5

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

Reinforcement Learning в задаче групповой оптимизации цен

«
1
2
3
4
5
6
»

Страница 1 из 6