Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front +8 27.06.2026 16:21 Happynood 1 Машинное обучение Python Open source Высоконагруженные системы DevOps
4.6-битные сети: от теории к практике. Причём здесь HardTanh? +5 26.06.2026 10:07 SmartEngines 1 Блог компании Smart Engines Машинное обучение Искусственный интеллект Математика Программирование
В 14 раз быстрее: как мы ускорили генерацию эмбеддингов в Manticore через ONNX +4 26.06.2026 04:18 ManticoreSearch 0 Open source Поисковая оптимизация Поисковые технологии SQL Базы данных
Tensordyne Napier — еще одно решение на замену традиционных GPU в инференсе +38 23.06.2026 08:01 skovalev 5 Блог компании Selectel IT-компании IT-инфраструктура Видеокарты Компьютерное железо
Vibecode по дешевке — домашний сервер с Qwen Code за 25к, который не отключит Anthropic +138 18.06.2026 10:25 milka713 208 GPGPU Машинное обучение Искусственный интеллект Компьютерное железо
Anthropic выпустила Fable 5 — и я задумался, не движемся ли мы не в ту сторону +2 09.06.2026 22:38 nlaik 30 Машинное обучение Искусственный интеллект
Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026 26.05.2026 21:18 kliment_ceo 35 Искусственный интеллект Машинное обучение Конференции Будущее здесь
Inspector v3: как я сделал свой центр управления Kubernetes на старом ноутбуке 26.05.2026 10:38 artegaspb 4 Блог компании YADRO DevOps Kubernetes Системное администрирование Машинное обучение
Архитектура AI-сервисов: почему монолит убивает latency и GPU 21.05.2026 06:51 sproshchaev 3 Блог компании OTUS Карьера в IT-индустрии Data Engineering Искусственный интеллект
Тестируем NVIDIA HGX B300 — инференс-сервер с 8 GPU и 2,3 ТБ VRAM на DeepSeek, Qwen и MiniMax 15.05.2026 08:00 nsforth 5 Блог компании Selectel IT-инфраструктура Искусственный интеллект Машинное обучение Компьютерное железо
NPU в ноутбуках: что меняется для тех, кто закупает корпоративную технику +15 11.05.2026 13:00 golangloves 1 Блог компании МТС Искусственный интеллект Ноутбуки Системное администрирование IT-инфраструктура
Новая архитектура для агентов: как Intel и SambaNova разделили инференс между GPU, RDU и CPU +11 10.05.2026 07:10 Andvecher 0 Блог компании МТС IT-инфраструктура Машинное обучение Серверное администрирование
DGX Spark на 256K контексте: тестирую конфигурации vLLM, реальные замеры и почему NVFP4 в mainline сломан +19 09.05.2026 14:47 AGmind 20 Машинное обучение Open source IT-инфраструктура
vLLM, LoRA и GPU-кластеры: техническая анатомия обогащения поисковой выдачи Авито мультимодальными моделями +4 23.04.2026 09:12 Kirill0720 0 Блог компании AvitoTech Машинное обучение Искусственный интеллект
Compute crunch пришёл: как считать экономику LLM в 2026 +7 17.04.2026 18:33 Xronofag 7 Анализ и проектирование систем Бизнес-модели Искусственный интеллект Облачные вычисления