Публикации автора ddgudynin / forpes.ru

Публикации автора ddgudynin

Снижаем стоимость инференса. Часть 2. IBM KServe ModelMesh, vLLM Production Stack и что внутри у нашего решения +6

Снижаем стоимость инференса. Часть 1. Популярные подходы и что помогло нам повысить утилизацию GPU на 70% +8

Страница 1 из 1