Скрытая цена LLM: как KV-cache увеличивает стоимость инференса и как эту проблему решает Google TurboQuant +21 04.05.2026 07:00 konstantin_kozhin 0 Блог компании МТС Искусственный интеллект Машинное обучение Natural Language Processing Сжатие данных