• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом reinforcement-learning

GSPO (Qwen RL Algorithm by Alibaba Cloud) +2

  • 10.08.2025 17:56
  • Verbasik
  • 2
  • Машинное обучение

RL-агент для алгоритмической торговли на Binance Futures: архитектура, бэктест, результаты +12

  • 05.08.2025 14:15
  • quantAIengineer
  • 14
  • Python
  • Искусственный интеллект
  • Криптовалюты
  • Машинное обучение

«Скайнет» наоборот: как вырастить и обучить ИИ с помощью Дарвин-Гёдель машины для улучшения человеческой демографии

  • 25.06.2025 13:12
  • Antony_Rain
  • 6
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Python
  • GitHub
  • Машинное обучение

Как мы обучили беспилотники в симуляции для гонок в смешанной реальности +17

  • 24.01.2025 08:42
  • Dataist
  • 1
  • Artificial Intelligence
  • Machine Learning
  • Искусственный интеллект
  • Машинное обучение

Контекстные бандиты в ценообразовании

  • 28.12.2024 09:06
  • muxeu
  • 1
  • Блог компании X5 Tech
  • Машинное обучение
  • Алгоритмы
  • Математика

Как нейросети, RL и байесовскую оптимизацию стали использовать на ускорителях заряженных частиц +7

  • 22.12.2024 14:19
  • kseniiakeera
  • 0
  • Блог компании Open Data Science
  • Машинное обучение
  • Физика
  • Инженерные системы
  • Научно-популярное

Мультимодальные приложения на Llama 3.2 и Llama Stack +6

  • 21.10.2024 08:37
  • ruslandevlabs
  • 13
  • Машинное обучение
  • Искусственный интеллект

Нейронные оптимизаторы запросов в реляционных БД (Часть 2): На пути к продуктивизации +6

  • 04.10.2024 11:24
  • Safreliy
  • 4
  • Блог компании Postgres Professional
  • Машинное обучение
  • Искусственный интеллект
  • PostgreSQL
  • Алгоритмы

Нейронные оптимизаторы запросов в реляционных БД (Часть 1) +27

  • 09.09.2024 10:54
  • Safreliy
  • 9
  • Блог компании Postgres Professional
  • PostgreSQL
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT +91

  • 28.05.2024 09:00
  • cydoroga
  • 2
  • Блог компании Яндекс
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект
  • Natural Language Processing

Гайд на Reinforcement Learning для новичков. Реализация простой задачи

  • 07.04.2024 09:17
  • alexmusyka
  • 1
  • Программирование
  • Алгоритмы
  • Машинное обучение
  • Искусственный интеллект

Многорукие бандиты в задаче ритейла

  • 28.12.2023 10:31
  • muxeu
  • 2
  • Блог компании X5 Tech
  • Алгоритмы
  • Математика
  • Машинное обучение

Обучение с блэкджеком и подкреплением. Ищем оптимальную стратегию игры +3

  • 14.11.2023 09:00
  • MarkWatney
  • 8
  • Игры и игровые консоли
  • Алгоритмы
  • Математика
  • Машинное обучение

Нейросеть, генерирующая нейросети. Часть 2. RL агент создаёт свои первые нейросети

  • 03.10.2023 06:49
  • SimsiGenerativeBot
  • 0
  • Open source
  • Машинное обучение
  • Искусственный интеллект

Нейросеть, генерирующая нейросети. Часть 1. Генерация случайной свёрточной нейронной сети +2

  • 27.09.2023 06:51
  • SimsiGenerativeBot
  • 3
  • Open source
  • Занимательные задачки
  • Python
  • Машинное обучение
  • Искусственный интеллект
  • «
  • 1
  • 2
  • »
Страница 1 из 2
ЛУЧШЕЕ

  • Сегодня
  • Вчера
  • Позавчера
09:01

Переезжаем в Firefox. Советы по настройке +47

11:08

Eee PC 701 в 2025 году: зачем я снова включил этот древний нетбук +29

08:00

Августовские мини-ПК: новинки на Strix Point, Meteor Lake плюс 2.5GbE +19

11:20

«Ничего, потерпят!»* или о нештатной ситуации, когда вроде всё работает штатно +18

11:08

Google XIX столетия.  Карл Цейс и его компаньоны +18

13:01

Реальна ли Мультивселенная? Часть первая +17

15:15

Оператор «NOT IN» и коварный NULL +14

15:59

Визуализатор сборок в режиме реального времени +11

07:00

Joomla исполнилось 20 лет. Поздравления с юбилеем от сообщества +11

08:05

Физические носители игр: как обстоят дела сейчас и есть ли будущее у такого формата +10

05:39

Пять паттернов поведения: где у команды «кнопки» и почему люди выгорают? +8

14:05

Гонка вооружений: топ-5 детекторов нейросетей +7

12:21

Telegram Bot API 9.2: прямые сообщения и рекомендуемые посты +6

08:00

Как и почему бизнес в 2025-м переходит с Windows на Linux +6

05:56

QTune — open-source решение для быстрого файн-тюнинга моделей +6

11:43

Как Исаак Зингер создал один из главных бытовых приборов прошлых веков +5

07:50

Взять и собрать ИИ-агента: редактор сценариев, мультимодальная основа и другие открытые инструменты +5

07:44

Свой LLM-агент на Typescript с использованием MCP +5

05:25

Flutter 3.35 — Что нового во Flutter? +4

12:20

MemorySanitizer (MSAN), когда он нужен и как внедрять +3

09:01

ЭВМ и роботы на страницах советской научной фантастики: вариации на тему «Электроника» и «Час быка» Ефремова +47

14:05

Устройства, которые мы потеряли: Как Siemens C65 стал культовым гиковским гаджетом +45

12:10

Как отличить грамотного спеца +45

07:12

Общение с социопатом: руководство по выживанию +45

11:20

Соленый вопрос +27

12:55

Надежное хранение личной информации — 2025 год +25

18:04

Как правильно вызывать CUDA +24

08:00

Kaisen Linux официально закрыт: что теряют сисадмины и какие есть альтернативы +23

00:27

Murmulator OS 2.0 под RP2350 (Raspberry Pi Pico 2) +23

09:33

Плагин Homepage. Как настроить домашнюю страницу для быстрой работы в Obsidian? +18

09:16

Чего хотят от Go-разработчиков и что им предлагают в середине 2025 года +16

06:05

Ревизии современных ретро консолей и их комплектации. Что купить прямо сейчас и не пожалеть +15

14:20

Я устроил битву ИИ в игре: GPT-5 против Grok, YandexGPT и GigaChat +14

20:57

Создаем простого грид-бота для Московской биржи через QUIK и Python +12

08:00

Списки, дзен и компромиссы. Как путешествовать, когда ты контрол-фрик +12

00:00

С монолита на микросервисы: проблемы, решения, практические рекомендации +11

11:51

Кем вы себя видите через 5 лет? +8

08:24

Учёные вычислили, как в океане формируются гигантские волны-убийцы +8

06:09

Почему не взлетел Wireless USB, а также карманный хот-спот и другие материалы в подборке о беспроводных технологиях +8

12:16

Как за один слайд увидеть, кого в команду нанимать, кого учить, а что перестать делать +7

09:01

Почему мы до сих пор используем пиксели: графика в играх и UI +56

08:11

Самый странный самолет в истории: Советский ВВА-14 +49

08:35

AWS удалил мой 10‑летний аккаунт и все данные без предупреждения +45

17:10

Теория Видома-Ларсена: почему физики снова говорят о холодном синтезе +44

13:16

Криптография для котиков или почему открытый ключ не может расшифровать сообщение +40

14:38

Как написать bzip2-архиватор на Python: разбираем преобразование Барроуза-Уилера +39

17:00

Мода на медиану +35

13:01

Рынок найма глазами инженера +35

12:00

Новые ИИ-ускорители и SSD на 245 ТБ: дайджест железа за июль +33

08:05

Кто убил интеллект? Расследование деградации ChatGPT, Claude, Gemini и других LLM +32

08:24

Снижение цен на видеокарты в облаке, машинное обучение на практике и не только: дайджест за июль +28

14:05

История игровой журналистики в России. Часть 5: Забытые журналы 90-х +20

07:30

Виртуальный рассказчик 2.0: эволюция нейросетевого рассказчика в Яндекс Книгах +18

20:29

Почему квантовая лавина подобна лесному пожару +16

17:38

Парадокс Джевонса и «эффект Черномырдина» ИТ проектов: как оптимизация приводит к катастрофе +16

12:00

Домашний NAS Buffalo LinkStation LS220D в 2025 году: медленный, но надежный +16

11:35

Legen… Wait, Wait… Dary! Разбираемся с рефлексией LLM +14

09:47

Выбираем архитектуру данных для компании: руководство от дата-инженера +13

11:58

История одного выгорания +12

08:35

Что умеет крошечный компьютер NanoPi R3S-LTS за 25 долларов +12

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Надежное хранение личной информации — 2025 год +25

    • 161

    Как отличить грамотного спеца +45

    • 129

    Теория Видома-Ларсена: почему физики снова говорят о холодном синтезе +44

    • 80

    Программисты против вайбкодеров -5

    • 73

    «Зелёная» энергетика в мире и России +5

    • 70

    Общение с социопатом: руководство по выживанию +45

    • 60

    Устройства, которые мы потеряли: Как Siemens C65 стал культовым гиковским гаджетом +45

    • 59

    Как избежать кошмара параллелизма в IoT: автоматы вместо потоков и корутин +2

    • 57

    AWS удалил мой 10‑летний аккаунт и все данные без предупреждения +45

    • 52

    Переезжаем в Firefox. Советы по настройке +45

    • 48

    Самый странный самолет в истории: Советский ВВА-14 +49

    • 46

    Eee PC 701 в 2025 году: зачем я снова включил этот древний нетбук +29

    • 41

    Кто убил интеллект? Расследование деградации ChatGPT, Claude, Gemini и других LLM +32

    • 37

    Скачиваем с YouTube без рекламы и SMS: гайд по созданию консольной утилиты на C# +4

    • 35

    Мода на медиану +35

    • 33

Подписка


  • Главная
  • Контакты
© 2025. Все публикации принадлежат авторам.