Новый бенчмарк по кодингу для LLM ProgramBench: 9 топ моделей, 200 задач, 248 тысяч тестов. Полностью решённых — ноль 15.05.2026 11:19 Maslennikovig 4 Программирование Машинное обучение