Снижаем стоимость инференса. Часть 2. IBM KServe ModelMesh, vLLM Production Stack и что внутри у нашего решения +3 03.10.2025 14:00 ddgudynin 0 Блог компании Cloud.ru IT-инфраструктура Облачные сервисы Искусственный интеллект Машинное обучение
Снижаем стоимость инференса. Часть 1. Популярные подходы и что помогло нам повысить утилизацию GPU на 70% +8 24.09.2025 11:38 ddgudynin 2 Блог компании Cloud.ru Облачные сервисы IT-инфраструктура Искусственный интеллект DevOps