Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front +8 27.06.2026 16:21 Happynood 1 Машинное обучение Python Open source Высоконагруженные системы DevOps
Облачная LLM на 16 ГБ VRAM — часть 3: ChatGPT-интерфейс для ваших LangGraph-агентов +23 27.06.2026 08:00 yakvenalex 2 Блог компании Selectel Искусственный интеллект Python NestJS DevOps
Как оптимизировать LLM-инференс в 2026 году +18 22.06.2026 15:40 sir-off 2 GPGPU Блог компании Cloud.ru Машинное обучение Параллельное программирование DevOps Искусственный интеллект
DeepSeek‑V4‑Flash на двух DGX Spark: как мы убрали очередь и получили multi‑user +10 22.06.2026 11:53 AGmind 3 Open source Системное администрирование DevOps Искусственный интеллект
Ubuntu 26.04 на клоне DGX Spark (Asus GX10) +9 18.06.2026 14:55 vasimv 3 Машинное обучение Системное администрирование Искусственный интеллект
Anthropic, Fable 5, Claude Code и большой отбор игрушек -5 13.06.2026 08:48 Kir_Moisha 16 Искусственный интеллект Информационная безопасность Серверное администрирование Машинное обучение GitHub
GPU-автоскейлинг на Kubernetes с KEDA: создание внешнего скейлера +3 11.06.2026 07:04 levashove 0 Блог компании VK Tech Kubernetes DevOps Микросервисы Машинное обучение
Как я разогнал Qwen3.6-27B до 73 токен/с в llama.cpp: параметры, которые реально работают +32 02.06.2026 12:57 devpew 43 TypeScript JavaScript Go
Qwen3.5 на двух V100, reverse SSH вместо Cloudflare в Telegram Mini App: собираю AI-репетитора английского +1 01.06.2026 11:48 EnglishAI 2 Искусственный интеллект Программирование Python Машинное обучение
Визуальный поиск: Новый подход к обнаружению объектов 31.05.2026 10:48 avetissian 0 Машинное обучение
Нехватка CUDA-памяти при обучении с GRPO: как перестать гадать и начать считать 21.05.2026 11:22 kmoseenk 0 Блог компании OTUS Искусственный интеллект Машинное обучение
Как мы построили корпоративную LLM-платформу: архитектура, грабли и выводы 21.05.2026 10:36 a-pismennyi 6 Блог компании Sminex Искусственный интеллект Open source Kubernetes Natural Language Processing
Архитектура AI-сервисов: почему монолит убивает latency и GPU 21.05.2026 06:51 sproshchaev 3 Блог компании OTUS Карьера в IT-индустрии Data Engineering Искусственный интеллект
Как развернуть Mistral 7B на GPU-сервере через vLLM 20.05.2026 08:00 natlysky 4 Блог компании Selectel Машинное обучение Системное администрирование Облачные сервисы Видеокарты
DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан +19 09.05.2026 14:47 AGmind 20 Машинное обучение Open source IT-инфраструктура