Публикации с тегом инференс / forpes.ru

Публикации с тегом инференс

Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front +8

4.6-битные сети: от теории к практике. Причём здесь HardTanh? +5

В 14 раз быстрее: как мы ускорили генерацию эмбеддингов в Manticore через ONNX +4

Tensordyne Napier — еще одно решение на замену традиционных GPU в инференсе +38

Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic +138

Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону +2

Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке

Архитектура AI-сервисов: почему монолит убивает latency и GPU

Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax

NPU в ноутбуках: что меняется для тех, кто закупает корпоративную технику +15

Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU +11

DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан +19

vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделями +4

Compute crunch пришёл: как считать экономику LLM в 2026 +7

«
1
2
3
4
»

Страница 1 из 4