• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Вчера
  • Позавчера
05:00

Хватит писать «чистый» код. Пора писать понятный код +64

07:01

Cherry MX: чем маленькая инновация 80-х покоряет современный мир +56

09:01

Изучаем рефаб Nokia 5300 за $20: как китайцы возвращают к жизни старые телефоны +52

08:30

«Колобок»: история одной советской мыши, которая не хочет работать +45

07:05

Pytest. Гайд для тех, кто ни разу про него не слышал +28

04:00

DIY Open Source принтер. Часть 2. Логика управления печатающей головой HP123 +28

10:35

Как умерли небольшие контентные сайты +27

06:15

Компьютерное зрение + ARKit = AR-навигация внутри зданий +24

07:00

Полный гайд по golden-тестам во Flutter: зачем нужны и как настроить +22

13:01

Оптимальный уровень мошенничества выше нуля +18

15:37

ESP32: Базовые алгоритмы машинного обучения +15

09:21

Как PHP «теряет» цифры: большие числа, double и неожиданные баги +15

10:59

Читаем вместе. ИИ в AppSec: могут ли LLM работать с уязвимым кодом +13

14:35

PostgreSQL 18: быстрее, умнее, нагляднее +12

13:00

Что умел Nokia 3510i: ретрообзор хитового телефона. Разбираем и изучаем ветерана +11

11:14

Как с помощью локальной LLM автоматизировать рутину и облегчить жизнь себе и коллегам +11

09:00

ИТ-менеджер, который перестал быть «пожарным». История управления 40 проектами и система, которая меня спасла +11

09:00

Как обмануть LLM: обход защиты при помощи состязательных суффиксов. Часть 1 +11

13:51

Платежные системы — вчера, сегодня и… завтра? +10

12:28

Погружаемся в недра Retrofit +9

09:31

Рынок эйчара +168

13:30

Тихий апокалипсис: я устал читать сгенерированные статьи +151

06:32

Восстание терпил +76

13:01

Что такое DevOps и почему он автоматизировал не всё +52

09:01

Странные CSS-свойства, но, возможно, полезные +47

11:17

DevSecOps за 20 миллионов? Я сделал свой сканер и выложил бесплатно +36

09:00

JavaScript, отдохни! Делаем интерактивные вещи на HTML и CSS +35

08:57

$220К в месяц на индексации сайтов для Google +34

07:00

Как появилась программа багбаунти? История развития +31

07:01

Как мы запретили писать код с багами в локализации или «Без права на bug» +27

19:45

Декодирование IR сигнала с TV (или исследование пультовых лучей) +24

12:11

Как властители мира собираются жить вечно: для них старение – техническая задача, которую надо решить +24

09:58

Kandinsky 5.0 Video Lite — лучший open-source генератор видео высокого качества в классе лёгких моделей +23

15:26

Оптимизация декодера изображений для 6502 с 70 минут до одной +22

11:03

Как сделать сложный технический текст простым и понятным: приемы из практики технического писателя +22

18:26

Как вероятность 1 к 73 000 000 стала приговором для матери двух младенцев: дело Салли Кларк +20

09:39

Алгоритмы, базы и порядок: практическая подборка книг для разработчиков +20

08:07

Оптимизация выравнивания и заполнения структур в Go. В 2025 г. всё ещё экономим на спичках +20

09:30

Собственное файловое хранилище для 400 Пбайт видеоконтента +19

09:30

Собственное файловое хранилище для 400 Пбайт видеоконтента +19

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Тихий апокалипсис: я устал читать сгенерированные статьи +151

    • 216

    Рынок эйчара +168

    • 209

    Как властители мира собираются жить вечно: для них старение – техническая задача, которую надо решить +24

    • 119

    Восстание терпил +76

    • 104

    Хватит писать «чистый» код. Пора писать понятный код +64

    • 54

    «Колобок»: история одной советской мыши, которая не хочет работать +45

    • 38

    $220К в месяц на индексации сайтов для Google +34

    • 38

    Как умерли небольшие контентные сайты +27

    • 37

    Как вероятность 1 к 73 000 000 стала приговором для матери двух младенцев: дело Салли Кларк +20

    • 36

    DevSecOps за 20 миллионов? Я сделал свой сканер и выложил бесплатно +36

    • 24

    Стоит ли покупать дешевые клавиатуры и мышки в офис -2

    • 22

    Собственное файловое хранилище для 400 Пбайт видеоконтента +19

    • 21

    Собственное файловое хранилище для 400 Пбайт видеоконтента +19

    • 21

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.