• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement learning

От «Долгого Джонта» Кинга до pip install: пишем HAL для атомного манипулятора +4

  • 25.03.2026 05:37
  • formeo
  • 0
  • Научно-популярное
  • Python
  • Open source

Intro Reinforcement Learning +3

  • 15.10.2025 14:51
  • anikengur
  • 0
  • Искусственный интеллект

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

Почему молчит умный счетчик? Побеждаем коллизии в сетях NB-IoT +16

  • 25.09.2025 11:10
  • MaxiEnergy
  • 4
  • Блог компании К2Тех
  • Информационная безопасность
  • Интернет вещей
  • Беспроводные технологии
  • Машинное обучение

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Новый метод поиска от Sakana: расширение inference-time scaling и коллективный разум +5

  • 01.08.2025 12:48
  • redmadrobot
  • 1
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

От мозга к мультиагентным системам: как устроены Foundation Agents нового поколения +3

  • 24.07.2025 21:44
  • redmadrobot
  • 8
  • red_mad_robot corporate blog
  • Artificial Intelligence
  • Research and forecasts in IT
  • Блог компании red_mad_robot
  • Искусственный интеллект
  • Исследования и прогнозы в IT

LiberalMind 1.5 новая LLM из России +7

  • 23.07.2025 12:15
  • teodor_unusov_official
  • 10
  • TensorFlow
  • Искусственный интеллект
  • Машинное обучение

ИИ простыми словами, часть 2. Reinforcement Learning (RL) +4

  • 06.02.2025 16:18
  • ElKornacio
  • 10
  • Машинное обучение
  • Искусственный интеллект

ИИ на путях: как решить задачу перепланирования расписания движения поездов +5

  • 23.01.2025 15:30
  • artur_temievich
  • 4
  • Первая грузовая компания (ПГК) corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Первая грузовая компания (ПГК)
  • Искусственный интеллект
  • Машинное обучение

Практическое обучение с подкреплением: от забав с MuJoCo'м до битв на арене +26

  • 15.01.2025 16:19
  • Ariman
  • 17
  • Искусственный интеллект
  • Python
  • Машинное обучение
  • Программирование
  • Разработка игр

ML-тренды рекомендательных технологий: шесть приёмов, которые помогают угадывать желания пользователя +17

  • 14.11.2024 08:01
  • KirillKhrylchenko
  • 1
  • Блог компании Яндекс
  • Машинное обучение
  • Алгоритмы
  • Natural Language Processing
  • Анализ и проектирование систем

OpenAI o1 — LLM, обученная выполнять сложные логические рассуждения +3

  • 01.10.2024 11:34
  • ruslandevlabs
  • 14
  • Машинное обучение
  • Искусственный интеллект

Научно-исследовательский кружок по ИИ в робототехнике для студентов и взрослых +27

  • 26.09.2024 07:06
  • AmigoRRR
  • 0
  • Блог компании Сбер
  • Программирование
  • Машинное обучение
  • Робототехника
  • Искусственный интеллект

Поиск данных, прокачанная тренировка и судейская оценка. Как с минимальными ресурсами улучшить качество дообучения LLM +10

  • 19.09.2024 13:16
  • anna_schenikova
  • 1
  • Блог компании МТС
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing
  • «
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • »
Страница 1 из 6
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
10:46

Давайте уже сделаем отдельный хаб: «Я собрал приложение за вечер — зачем теперь разработчики?» +67

08:00

Муравьи против трансформеров: старый алгоритм 1992 года, который вернулся +49

09:00

Как Monium приручил GC: разбираемся со сборщиками мусора в observability‑платформе +24

08:50

Чебурнет близко +24

07:05

Что делает match после того, как вы нажали Compile +21

07:01

Как запускать LLM-агентов без облачных API: VPS, локальные модели и требования к железу +21

13:31

Голосуй, или проиграешь! разбор фишинга, который пытается угнать Telegram +20

09:01

Flappy Bird: код веб-клона под микроскопом +19

07:00

Как подготовиться к алгоритмическим соревнованиям: опыт финалиста ICPC +19

05:29

Баги, которые не ловит Rust +19

12:00

Люди скупают Mac Mini M4, а SpaceX покупает Cursor за $60 млрд: ML-дайджест +17

08:00

Создание чат-бота в портале Битрикс24 с помощью AI-агентов +16

12:03

«У нас было 230 тысяч строк легаси-кода». Как мы изменяли приложение «Настройки» +15

13:01

Гонка ИИ-вооружений — как LLM вносят уязвимости в код и как другие LLM их находят +14

08:00

Можно ли заменить диктора open‑source TTS‑моделью: тестируем OmniVoice на русском языке +14

05:30

Писать или не писать… свой мессенджер — вот в чем вопрос +14

13:22

«Алгоритмы на языке Go». Книга, которую ждали +13

08:32

Коэффициент токсичности задачи: как одна метрика снизила текучку в команде до 10% +13

07:40

200 OK по протоколу, но не OK для клиента: автоматизация контроля совместимости API и приложения +13

13:20

Как Runtime Radar помогает обнаруживать атаки на цепочку поставок: кейс LiteLLM +12

08:00

Вентиляция в съемной квартире +129

17:12

Я ЛОХ, меня развели в максе +76

10:03

Senior‑разработчики как исчезающий вид +66

10:13

Манипуляции: как распознать и не поддаться +62

09:01

Зря вы забыли эти HTML- и CSS-фичи +49

14:38

Linux диванного гитариста +42

08:03

Может ли ИИ напечатать годную модель на 3D-принтере? +40

07:00

Двигается как утка, выглядит как утка, но не утка +40

09:00

За два месяца вместо года: как мы переписали 97 тысяч строк кода с Objective-C на Swift +38

07:05

Немного об «имитаторах» вечного движения… +35

15:24

НЕкраткая история телеграфа +32

13:01

10 лучших инструментов для бэкапа VDS +31

07:01

Smart Timber: измеряем лес смартфоном. Часть 1: Роль продуктового подхода в успехе проекта +22

05:30

Как я подключил ну очень много датчиков пульса к часам Garmin +22

10:01

Закон о суверенном ИИ и его борьба с матчастью +21

07:30

Reactive Resume — создаём стильное CV за 10 минут +21

07:27

Гайд душного айтишника из СНГ по Вьетнаму +20

14:15

Минпромторг исключил бренды компьютерной электроники из перечня параллельного импорта, разбираем аналоги и влияние +16

11:55

OCR в кармане: как HunyuanOCR на 1B параметров потеснил гигантов в задачах парсинга документов +16

10:58

Как одна OC может запускать приложения из разных миров +16

07:27

Когда пет-проект выходит из-под контроля: пишем свой tun2socks и закрываем дыры в Android VPN +84

19:55

Я сделал приложение за вечер без навыков программирования. Зачем теперь разработчики? +78

13:01

Синхронизация часов — это кошмар +59

05:30

Как сайты собирают цифровой отпечаток пользователя — почему VPN больше не спасает (О Fingerprinting) +53

09:01

Эдсгер Дейкстра. Человек, который придумал параллельные вычисления +51

04:58

Налоговая слежка за переводами на карту, а также начало суда Маска против Альтмана +38

23:36

Настройка GitLab CI/CD: понимаем принципы работы и запускаем первый pipeline +37

06:51

Remoded: разбираем демо-эффекты (часть 1) +36

13:24

По понедельникам нейросеть говорит мне что делать. Так я зарабатываю на маркетплейсах 120 млн в год +34

08:00

Как гигантским корпорациям стало выгоднее вкладываться в AI, чем в майнинг биткоина +33

07:05

Создаем I2C Master Controller на Verilog. Переходим на новый уровень +30

07:05

ILM: Фабрика грёз Джорджа Лукаса +28

18:46

Как Rust обманывает процессор: тайная жизнь niche-оптимизации, drop flags и MIR +24

07:00

Скрытая цена LLM: как KV-cache увеличивает стоимость инференса и как эту проблему решает Google TurboQuant +21

01:37

MarkMello: быстрый Markdown viewer для тех, кто каждый день живёт в .md +21

13:56

Проектный менеджмент умер: почему проекты больше не ведут, а только синхронизируют) +19

05:07

FastCGI исполнилось 30 лет, и он до сих пор лучше HTTP для прокси-к-бэкенду +19

13:00

Русская рулетка с поиском: почему каждый десятый ответ в AI-выдаче — ложь +15

08:00

Почему self-hosted LLM падает в проде +15

16:28

Шпионим за конкурентами легально: анализ рынка с нейросетями за один день вместо недели +14

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Я ЛОХ, меня развели в максе +76

    • 221

    Я сделал приложение за вечер без навыков программирования. Зачем теперь разработчики? +78

    • 220

    Зачем нам цифровой рубль? +4

    • 173

    Как сайты собирают цифровой отпечаток пользователя — почему VPN больше не спасает (О Fingerprinting) +53

    • 111

    Вентиляция в съемной квартире +129

    • 108

    Senior‑разработчики как исчезающий вид +66

    • 98

    По понедельникам нейросеть говорит мне что делать. Так я зарабатываю на маркетплейсах 120 млн в год +34

    • 75

    Синхронизация часов — это кошмар +59

    • 43

    Когда пет-проект выходит из-под контроля: пишем свой tun2socks и закрываем дыры в Android VPN +84

    • 43

    MarkMello: быстрый Markdown viewer для тех, кто каждый день живёт в .md +21

    • 42

    Чебурнет близко +24

    • 40

    Linux диванного гитариста +42

    • 39

    Мифы про REST API. Часть 3 +15

    • 37

    Как я подключил ну очень много датчиков пульса к часам Garmin +22

    • 36

    Давайте уже сделаем отдельный хаб: «Я собрал приложение за вечер — зачем теперь разработчики?» +67

    • 34

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.