• Главная
  • Контакты
Подписаться:
  • Twitter
  • Facebook
  • RSS
  • VK
  • PushAll
logo

logo

  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные
  • За год
    • Положительные
    • Отрицательные
  • Сортировка
    • По дате (возр)
    • По дате (убыв)
    • По рейтингу (возр)
    • По рейтингу (убыв)
    • По комментам (возр)
    • По комментам (убыв)
    • По просмотрам (возр)
    • По просмотрам (убыв)
Главная
  • Все
    • Положительные
    • Отрицательные
  • За сегодня
    • Положительные
    • Отрицательные
  • За вчера
    • Положительные
    • Отрицательные
  • За 3 дня
    • Положительные
    • Отрицательные
  • За неделю
    • Положительные
    • Отрицательные
  • За месяц
    • Положительные
    • Отрицательные

Публикации с тегом vllm

Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front +8

  • 27.06.2026 16:21
  • Happynood
  • 1
  • Машинное обучение
  • Python
  • Open source
  • Высоконагруженные системы
  • DevOps

Облачная LLM на 16 ГБ VRAM — часть 3: ChatGPT-интерфейс для ваших LangGraph-агентов +23

  • 27.06.2026 08:00
  • yakvenalex
  • 2
  • Блог компании Selectel
  • Искусственный интеллект
  • Python
  • NestJS
  • DevOps

Как оптимизировать LLM-инференс в 2026 году +18

  • 22.06.2026 15:40
  • sir-off
  • 2
  • GPGPU
  • Блог компании Cloud.ru
  • Машинное обучение
  • Параллельное программирование
  • DevOps
  • Искусственный интеллект

DeepSeek‑V4‑Flash на двух DGX Spark: как мы убрали очередь и получили multi‑user +10

  • 22.06.2026 11:53
  • AGmind
  • 3
  • Open source
  • Системное администрирование
  • DevOps
  • Искусственный интеллект

Ubuntu 26.04 на клоне DGX Spark (Asus GX10) +9

  • 18.06.2026 14:55
  • vasimv
  • 3
  • Машинное обучение
  • Системное администрирование
  • Искусственный интеллект

Anthropic, Fable 5, Claude Code и большой отбор игрушек -5

  • 13.06.2026 08:48
  • Kir_Moisha
  • 16
  • Искусственный интеллект
  • Информационная безопасность
  • Серверное администрирование
  • Машинное обучение
  • GitHub

GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера +3

  • 11.06.2026 07:04
  • levashove
  • 0
  • Блог компании VK Tech
  • Kubernetes
  • DevOps
  • Микросервисы
  • Машинное обучение

Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают +32

  • 02.06.2026 12:57
  • devpew
  • 43
  • TypeScript
  • JavaScript
  • Go

Qwen3.5 на двух V100, reverse SSH вместо Cloudflare в Telegram Mini App: собираю AI-репетитора английского +1

  • 01.06.2026 11:48
  • EnglishAI
  • 2
  • Искусственный интеллект
  • Программирование
  • Python
  • Машинное обучение

Визуальный поиск: Новый подход к обнаружению объектов

  • 31.05.2026 10:48
  • avetissian
  • 0
  • Машинное обучение

Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать

  • 21.05.2026 11:22
  • kmoseenk
  • 0
  • Блог компании OTUS
  • Искусственный интеллект
  • Машинное обучение

Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы

  • 21.05.2026 10:36
  • a-pismennyi
  • 6
  • Блог компании Sminex
  • Искусственный интеллект
  • Open source
  • Kubernetes
  • Natural Language Processing

Архитектура AI-сервисов: почему монолит убивает latency и GPU

  • 21.05.2026 06:51
  • sproshchaev
  • 3
  • Блог компании OTUS
  • Карьера в IT-индустрии
  • Data Engineering
  • Искусственный интеллект

Как развернуть Mistral 7B на GPU-сервере через vLLM

  • 20.05.2026 08:00
  • natlysky
  • 4
  • Блог компании Selectel
  • Машинное обучение
  • Системное администрирование
  • Облачные сервисы
  • Видеокарты

DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан +19

  • 09.05.2026 14:47
  • AGmind
  • 20
  • Машинное обучение
  • Open source
  • IT-инфраструктура
  • «
  • 1
  • 2
  • 3
  • »
Страница 1 из 3
ЛУЧШЕЕ

  • Вчера
  • Позавчера
08:32

Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +72

10:05

Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +60

12:30

Passkey без Apple, Google и облаков: делаем собственный аппаратный ключ за 4 евро +43

12:00

Пузырь ИИ лопнул? Бизнес отказывается от ChatGPT, а Microsoft пытается спасти положение софтом: ML-дайджест +37

09:02

Почему cron — самый опасный инструмент в Linux +37

07:03

Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +31

07:05

kafkactl — другой взгляд на работу с Kafka +29

14:42

Почему сгорел Нотр-Дам: человеческий фактор, SHERPA и HTA в UX-проектировании интерфейса +27

07:04

Умеют ли трансформеры водить машину +26

09:17

Почему опасно покупать Intel Core i7 и i9 с рук: разбираемся с деградацией процессоров 13900K и 14900K +22

09:09

Проектируем с нуля калькулятор на FPGA. Часть 6: CPU +20

07:01

Шахматная память: как гроссмейстеры запоминают тысячи партий и почему это не мнемотехника +20

13:01

Flappy Bird: делаем игру сложнее и добавляем автопилот на чистой математике +19

08:01

Распределённый монолит: как одну проблему превратить в целый кластер проблем +19

14:27

Я больше не объясняю нейросети контекст. Вот что я сделал вместо этого… +17

08:00

Как мы реализовали оптимальное обучение CV-моделей в Luna Line. Часть 2. Сегментация +17

07:01

Реконструкция мониторинга в ЦОД без боли и переучивания персонала +16

07:32

Структуры данных на практике. Глава 18: Очереди драйверов устройств +15

10:26

Я декомпилировал свою зависимость: как программист раскидал курение на 100+ субличностей и перестал курить +14

14:00

Как мы настраивали терминалы сбора данных на складах Ozon +13

15:10

Народная карта бензина собрала почти 2 млн посетителей за три дня. Её навайбкодил один человек +105

05:26

Как Яндекс меня кинул на фестивале для будущих яндексоидов, или Хроники одного YoungCon +60

07:01

Манипуляция ответами нейронок — как сеошники убивают интернет +58

07:59

Как мы работаем со студентами: дипломы, которые становятся частью YDB +46

07:59

Как мы работаем со студентами: дипломы, которые становятся частью YDB +46

11:12

Event Sourcing в платформе данных: миграция с JSON на Avro +42

09:01

TeamPCP: как команда хакеров-любителей «Дюны» закинула в наши Node.js-пакеты червей Shai-Hulud +41

07:05

Размагничивание кораблей: мины, физика и Курчатов. Часть 2 +41

11:13

Айсберг Доменов Верхнего Уровня (ICANN и не только) +40

05:05

Как одна операция из линейной алгебры захватила мир ИИ +38

21:02

Рунет без Google Login: что теперь делать с авторизацией +37

13:01

Триллионы километров данных: ваш автомобиль следит за вами, и это только начало +34

06:00

Человек-легенда, давший нам Спектрум и предсказавший ИИ +34

07:06

Семь раз подумай, один раз пошардируй: как мы начали горизонтально масштабировать метаданные чатов Телемоста +33

11:19

Как я переехал с Altium Designer на KiCAD +31

08:09

Обзор необычного и очень мощного мини-ПК Khadas Mind 2 +30

18:13

Как «ужать» мегаполис до размеров iPhone 4 +25

17:14

Что на самом деле означают теоремы Гёделя о неполноте? +25

15:05

И снова самый быстрый парсер JSON. Очередной +25

06:28

Забор из волшебных палочек +24

СЕРВИСЫ
  • logo

    CloudLogs.ru - Облачное логирование

    • Храните логи вашего сервиса или приложения в облаке. Удобно просматривайте и анализируйте их.
ОБСУЖДАЕМОЕ

  • Народная карта бензина собрала почти 2 млн посетителей за три дня. Её навайбкодил один человек +105

    • 180

    Рунет без Google Login: что теперь делать с авторизацией +37

    • 118

    Почему я ухожу из Timeweb Cloud: 46 часов простоя в Амстердаме за два месяца — по данным самого хостера +60

    • 102

    Что лучше — C++ или C#? +6

    • 58

    Как Let's Encrypt, только роднее: автоматическое получение бесплатного RSA DV-сертификата НУЦ +16

    • 57

    Дело на вечер: собираем домашний ИИ-сервер +17

    • 52

    Что на самом деле означают теоремы Гёделя о неполноте? +25

    • 52

    VK выпилили из AppStore, а также рекордная жара в Европе +21

    • 30

    И все‑таки самая реальная защита дома или квартиры — электронно‑механический шлюз -10

    • 28

    Манипуляция ответами нейронок — как сеошники убивают интернет +58

    • 26

    Почтовый ящик пандоры. Какие сервисы работают с внешними почтовыми клиентами в России в 2026 году +31

    • 25

    Отрежьте мне миллиард символов: как C++20, string_view и шаблонный ад могут скрывать баг годами +18

    • 24

    Почему Минобрнауки боится ИИ и правда ли, что дипломные работы утратили смысл? +2

    • 23

    Что такое парадокс изогнутой трубы — и почему интуиция нас подводит +89

    • 23

    И снова самый быстрый парсер JSON. Очередной +25

    • 23

Подписка


  • Главная
  • Контакты
© 2026. Все публикации принадлежат авторам.