• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом RL

Machine Unlearning. Как измерить и достичь «забывания»? +11

  • 06.05.2026 09:00
  • MidavNibush
  • 0
  • Блог компании Конференции Олега Бунина (Онтико)
  • Блог компании Raft
  • Искусственный интеллект
  • Машинное обучение
  • Data Engineering

Как мы обеспечили +33% к точности на сложных SQL-запросах +15

  • 08.10.2025 11:19
  • Safreliy
  • 7
  • Блог компании Postgres Professional
  • Искусственный интеллект
  • Машинное обучение
  • SQL
  • PostgreSQL

Reflect, Retry, Reward: как RL учит LLM рефлексировать и становиться лучше +4

  • 11.08.2025 09:30
  • ai-talent
  • 1
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Разработка LLM моделей для обновления кода приложений на более высокие версии фреймворков или языков программирования +5

  • 20.06.2025 19:01
  • inigomontoya722
  • 2
  • JavaScript
  • Python
  • Машинное обучение
  • Искусственный интеллект

Обыгрываем казино, с блэкджеком и стратегиями +7

  • 12.06.2025 14:45
  • monkey_llm
  • 4
  • Python
  • Машинное обучение

Действительно ли у ИИ-агента есть внутренняя картина мира и представление о себе? +2

  • 12.05.2025 12:55
  • andre_dataist
  • 6
  • Машинное обучение
  • Искусственный интеллект

RL RecSys в проде: хайп или игра вдолгую +8

  • 14.02.2025 10:50
  • fotol
  • 1
  • Машинное обучение
  • Блог компании Т-Банк

Динамическая адаптация награды с помощью Pydantic +4

  • 12.12.2024 04:26
  • techevangelist
  • 1
  • Машинное обучение
  • Блог компании OTUS

RLHF. История становления идеи — 4. HHH: helpful, honest, harmless, Instruct LLM, Constitutional AI

  • 10.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 3. Supervised finetune, Протокольный сбор обратной связи, Batch RL

  • 03.08.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

RLHF. История становления идеи — 2

  • 26.07.2024 06:00
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Обучение с подкреплением на основе обратной связи от человека (RLHF). История становления идеи

  • 19.07.2024 20:11
  • MrsWallbreaker
  • 0
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Создание масштабируемых RL систем с Ape-X

  • 01.06.2024 08:56
  • badcasedaily1
  • 1
  • Блог компании OTUS
  • Python
  • Программирование
  • Машинное обучение

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Глаза боятся, а ИИ делает: как эмоции помогают ИИ лучше управлять автомобилем

  • 25.12.2023 12:31
  • Lithium_vn
  • 2
  • Блог компании BotHub
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
08:32

Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +62

10:05

Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +58

12:30

Passkey без Apple, Google и облаков: делаем собственный аппаратный ключ за 4 евро +41

09:02

Почему cron — самый опасный инструмент в Linux +38

12:00

Пузырь ИИ лопнул? Бизнес отказывается от ChatGPT, а Microsoft пытается спасти положение софтом: ML-дайджест +37

07:05

kafkactl — другой взгляд на работу с Kafka +29

14:42

Почему сгорел Нотр-Дам: человеческий фактор, SHERPA и HTA в UX-проектировании интерфейса +28

07:03

Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +28

07:04

Умеют ли трансформеры водить машину +26

09:17

Почему опасно покупать Intel Core i7 и i9 с рук: разбираемся с деградацией процессоров 13900K и 14900K +22

09:09

Проектируем с нуля калькулятор на FPGA. Часть 6: CPU +20

07:01

Шахматная память: как гроссмейстеры запоминают тысячи партий и почему это не мнемотехника +20

13:01

Flappy Bird: делаем игру сложнее и добавляем автопилот на чистой математике +19

08:01

Распределённый монолит: как одну проблему превратить в целый кластер проблем +17

08:00

Как мы реализовали оптимальное обучение CV-моделей в Luna Line. Часть 2. Сегментация +17

14:27

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого… +16

07:01

Реконструкция мониторинга в ЦОД без боли и переучивания персонала +16

07:32

Структуры данных на практике. Глава 18: Очереди драйверов устройств +15

10:26

Я декомпилировал свою зависимость: как программист раскидал курение на 100+ субличностей и перестал курить +14

06:32

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет +14

08:32

Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +72

10:05

Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +58

12:30

Passkey без Apple, Google и облаков: делаем собственный аппаратный ключ за 4 евро +41

09:02

Почему cron — самый опасный инструмент в Linux +38

12:00

Пузырь ИИ лопнул? Бизнес отказывается от ChatGPT, а Microsoft пытается спасти положение софтом: ML-дайджест +37

07:05

kafkactl — другой взгляд на работу с Kafka +29

14:42

Почему сгорел Нотр-Дам: человеческий фактор, SHERPA и HTA в UX-проектировании интерфейса +28

07:03

Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +28

07:04

Умеют ли трансформеры водить машину +26

09:17

Почему опасно покупать Intel Core i7 и i9 с рук: разбираемся с деградацией процессоров 13900K и 14900K +22

09:09

Проектируем с нуля калькулятор на FPGA. Часть 6: CPU +20

07:01

Шахматная память: как гроссмейстеры запоминают тысячи партий и почему это не мнемотехника +20

13:01

Flappy Bird: делаем игру сложнее и добавляем автопилот на чистой математике +19

08:01

Распределённый монолит: как одну проблему превратить в целый кластер проблем +17

08:00

Как мы реализовали оптимальное обучение CV-моделей в Luna Line. Часть 2. Сегментация +17

14:27

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого… +16

07:01

Реконструкция мониторинга в ЦОД без боли и переучивания персонала +16

07:32

Структуры данных на практике. Глава 18: Очереди драйверов устройств +15

10:26

Я декомпилировал свою зависимость: как программист раскидал курение на 100+ субличностей и перестал курить +14

06:32

Как оценивать LLM на практике, если времени на «идеальный бенчмарк» нет +14

13:31

Берлин, 1927: танец на вулкане +106

09:01

Раньше ПО работало шустро, потому что иначе было никак +69

13:01

Rekam iLook 500: бюджетный китайский OEM под видом канадского бренда +54

09:53

Организовал весь пентест-арсенал в одном месте: всё под рукой, офлайн и на русском +42

16:25

Arcanum: стимпанк, черный юмор и свобода +36

10:11

Все демонические насельники ИИ… по старшинству +31

08:00

Испанская барахолка: жара, ламповый Philips, клон Dendy и CD-гигант Sony на 200 дисков +28

10:18

Структуры данных на практике. Глава 16: Фильтры Блума и вероятностные структуры данных +24

18:05

«Это ABSOLUTE CINEMA». Почему 007: First Light — лучшая игра про Бонда и главный сюрприз года +23

18:05

Подключаем к ПЛИС оперативную память SDRAM +21

12:14

Загружаем bitstream из Linux через FPGA Manager на Zynq-7000 +21

12:29

Как я писал диплом в LaTeX: Docker, CI/CD, Latexmk, Mermaid, и многое другое +18

11:32

Как заставить LLM выбирать осмысленные фрагменты из часовой расшифровки: почему «найди интересные моменты» не работает +17

09:39

Как с помощью Мегафон и Max навсегда потерять доступ к клиентам- информационная безопасность на уровне тупика +16

16:41

Многоэтапные сборки в Docker: как уменьшить образ с 1,2 ГБ до 50 МБ +15

09:48

Первый промт-инженер компьютерных душ: как Алан Тьюринг предлагал воспитывать ИИ +13

00:56

Граф кода одной командой: ставим graphlens-mcp в проект и перестаём жечь токены на grep +12

08:43

Машина, которая умоляет +11

18:27

В поисках идеального тона: хроники гитарного энтузиаста +10

14:49

После симметрии: сверхИИ и несвободное сохранение человека +10

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Народная карта бензина собрала почти 2 млн посетителей за три дня. Её навайбкодил один человек +103

    • 179

    Рунет без Google Login: что теперь делать с авторизацией +37

    • 107

    Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +58

    • 96

    Как Let's Encrypt, только роднее: автоматическое получение бесплатного RSA DV-сертификата НУЦ +16

    • 57

    Что лучше — C++ или C#? +5

    • 56

    Дело на вечер: собираем домашний ИИ-сервер +17

    • 52

    Что на самом деле означают теоремы Гёделя о неполноте? +25

    • 49

    И все‑таки самая реальная защита дома или квартиры — электронно‑механический шлюз -10

    • 28

    VK выпилили из AppStore, а также рекордная жара в Европе +21

    • 28

    Манипуляция ответами нейронок — как сеошники убивают интернет +58

    • 26

    Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +28

    • 25

    Отрежьте мне миллиард символов: как C++20, string_view и шаблонный ад могут скрывать баг годами +18

    • 24

    Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +72

    • 22

    Как я переехал с Altium Designer на KiCAD +31

    • 21

    И снова самый быстрый парсер JSON. Очередной +24

    • 20

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.