• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

Что я вынес из Oxford Machine Learning Summer School 2025

  • 13.10.2025 16:02
  • SuperEstrad
  • 0
  • Natural Language Processing
  • Машинное обучение
  • Робототехника
  • Учебный процесс в IT

Реализуем Q learning на Python +3

  • 02.10.2025 10:23
  • Andrey_Biryukov
  • 1
  • Блог компании OTUS
  • Машинное обучение
  • Искусственный интеллект
  • Python

AI-движки на примере Knowledge Distillation, GAN, Reinforcement learning -1

  • 28.09.2025 12:06
  • xitri_kot
  • 0
  • Python
  • TensorFlow

GEPA вместо RL: как рефлексивная эволюция промптов обгоняет обучение с подкреплением +1

  • 11.09.2025 11:00
  • kucev
  • 0
  • Data Engineering
  • Big Data
  • Машинное обучение
  • Искусственный интеллект
  • Data Mining

Скорость, стратегия и алгоритмы: будущее Формулы-1 в эпоху AI -2

  • 04.09.2025 11:00
  • kucev
  • 0
  • Artificial Intelligence
  • Machine Learning
  • Data Mining
  • Искусственный интеллект
  • Машинное обучение
  • Big Data
  • Data Engineering

LLM на прокачку: практический гайд по Alignment +8

  • 18.08.2025 10:26
  • DeadSailor
  • 0
  • Точка corporate blog
  • Artificial Intelligence
  • Machine Learning
  • Блог компании Точка
  • Блог компании Точка банк
  • Natural Language Processing
  • Python
  • Искусственный интеллект
  • Машинное обучение

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
08:06

Как работают ИИ-агенты и кому они на самом деле нужны +30

07:05

Сказ о том, как сделать самый большой флот автономных грузовиков в России с нуля… +19

04:57

Чебурахнувшийся робот, а также ИГРОКУБ от Valve +19

07:05

Ищем ошибку в работе WiFi у платы ESP32-C3 SuperMini +18

07:00

Как мы проектируем и ставим импланты детям в виде божьих коровок, чтобы им лучше дышалось +15

08:00

API для LLM: разбираем по пунктам, как устроен и как работает протокол MCP +13

08:00

Как работают федеративные системы: рассказываем на примере YDB +10

09:01

Дирижабли нового поколения и летающие ветряки +9

08:05

Как провести быстрый аудит разработки без изучения кода, часть 2 +9

10:31

Почему крупные компании строят свои дата-центры, а остальным они не нужны +8

07:14

Mentorpiece установил абсолютный рекорд трудоустройств (без накрутки опыта!) +6

05:16

Краткая история создания аудиокассеты. Часть вторая +6

09:13

Есть ли надежда на бессмертие и как в этом помогает AI? +5

09:00

Как настроить Nginx, чтобы выдержать DDoS +5

07:17

Гарантированная доставка данных с помощью библиотеки Polly. Наш опыт взаимодействия с единым реестром интернет-рекламы +5

07:03

Ваши тесты упали по причине JavaScript +5

06:36

NewOnGears | Невангеры 2 на Godot 4 +4

06:17

Cуперкомпьютеры в России помогают проектировать тихие сверхзвуковые самолеты +4

05:30

N8n, GigaChat и Telegram: как я собрал идеальную систему для утреннего дайджеста +4

03:41

Клеточный автомат по закону Коллатца — когда числа живут +4

13:20

Нижегородское метро: 40 горьких лет +108

12:15

Что скрывается за «сертификатами безопасности» от Минцифры? +64

11:19

Как за 5 дней с помощью Claude я создал приложение для кошки с диабетом (и кажется запустил стартап) +63

14:38

На смерть Джеймса Уотсона +43

13:01

Теория неоднородной Вселенной как альтернатива тёмной энергии +35

08:00

Hi-tech наушники Sony WH-1000XM6: мой опыт использования и впечатления из первых рук +30

07:05

Ностальгические игры: Fallout New Vegas +29

06:31

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера +27

09:01

Digital Ocean преследует меня из-за $0,01 или Полезный урок по автоматизации +25

16:09

Многопоточность без боли: моя шпаргалка для собесов в Java +23

17:28

Как устроена цензура изнутри. На примере слитого китайского фаерволла (блокировки Tor, VPN, анализ трафика) +18

19:16

Какой Ai-шник нынче нужон?! / Исследование ИИ рынка труда РФ +13

18:31

Пример реализации агентного RAG'а +12

07:00

Самые необычные серверы Minecraft: от умной лампочки до микроконтроллера. Как это работает? +12

15:16

Архитектура фронтенда. Навеяно болью от использования FSD +11

14:17

3D-таймлайн на чистом JavaScript: как я собирал этот слайдер по шагам +9

12:00

GPU Intel Arc на Raspberry Pi и non-x86 платформах — запуск, настройка и анализ производительности +9

19:14

Руководство по архитектуре браузерных песочниц: как работает изоляция JavaScript-кода +8

11:20

Предпосылки формирования месторождений. Общая геология +7

13:16

Квантовая гравитация, горизонты и тёмный сектор +6

14:05

Мультитул для инженера: волшебная коробочка с I2C/SPI/UART/JTAG за 1.000 рублей +63

04:42

Вводная глава учебника по матанализу нового типа +59

09:01

Дни недели в честь планет: почему в Англии, Индии, Японии и других странах с древности используют одну и ту же схему? +58

13:01

Старые игры для iOS (и немного для Android): во что поиграть? +35

10:52

Заводной абрикос +35

07:15

Работает в моменте — разоряет на дистанции, или Как исчез самый большой капитал США XIX века +33

08:00

Дайджест железа за октябрь: ARM, Intel и материнские платы Selectel +31

12:01

Бенчмарки для теста телефона на производительность +25

17:02

Собираем простейшую RAG-систему на PHP с фреймворком Neuron AI за вечер +20

08:29

Как устроены зеркала в Sims 4 +18

16:45

Копирайт отправляет российский Интернет в Средневековье +14

16:19

Стандартная модель. От симметрий к кваркам +14

10:56

Исследователи обнаружили эффективный способ оптимизации +10

21:00

Альтернативный raycast +9

12:46

Куда исчезает молочный шоколад и при чём тут изменение климата? +9

06:27

Я устал от приложений для английского и сделал свою таблицу. Или как учить английский в Telegram, если нет времени +9

19:16

La Perf — бенчмарк локального ИИ, или M-серия наносит ответный удар +8

11:18

Размышления о машине Тьюринга и причинах возникновения ошибок в языках программирования +8

09:32

Можно ли заменить datetime? Как Pendulum делает работу с датой и временем удовольствием +8

23:21

Flutter 3.38 — Что нового во Flutter? +7

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Концепт идеального коттеджа – комфортно, дешево, технологично +1

    • 255

    Что скрывается за «сертификатами безопасности» от Минцифры? +74

    • 215

    Русский JavaScript — это не баг, это фича будущего. Представляю RJS -27

    • 149

    Вводная глава учебника по матанализу нового типа +59

    • 135

    Копирайт отправляет российский Интернет в Средневековье +14

    • 113

    Интерференционная модель Единого Поля (часть 1: гравитация, электромагнетизм, сильное и слабое взаимодействия) -5

    • 112

    Нижегородское метро: 40 горьких лет +108

    • 82

    Мультитул для инженера: волшебная коробочка с I2C/SPI/UART/JTAG за 1.000 рублей +63

    • 70

    Hi-tech наушники Sony WH-1000XM6: мой опыт использования и впечатления из первых рук +30

    • 49

    Как за 5 дней с помощью Claude я создал приложение для кошки с диабетом (и кажется запустил стартап) +63

    • 45

    Ностальгические игры: Fallout New Vegas +29

    • 45

    Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера +27

    • 31

    Как устроена цензура изнутри. На примере слитого китайского фаерволла (блокировки Tor, VPN, анализ трафика) +17

    • 29

    На смерть Джеймса Уотсона +43

    • 27

    Я устал от приложений для английского и сделал свою таблицу. Или как учить английский в Telegram, если нет времени +9

    • 27

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.