
Привет, Хабр! Производительность мобильного устройства важна не только для пользователей, но и для разработчиков приложений. После обновлений смартфон может работать медленнее, а новые версии игр и ПО предъявляют все более высокие требования к железу. Чтобы объективно оценить возможности устройства и сравнить их с эталонами, используют специальные приложения — бенчмарки. В статье разберем, какие из популярных инструментов применяются чаще всего и как правильно интерпретировать их результаты.
Что такое бенчмарк и зачем проверять процессор телефона
Бенчмарк — это специальное приложение для измерения производительности телефона. Такие программы загружают устройство различными задачами и проверяют, насколько хорошо оно справляется. По сути, это объективный тест возможностей смартфона, который показывает его реальную мощность, а не только характеристики на бумаге.
Современные бенчмарки тестируют все ключевые компоненты телефона:
Процессор (CPU) — выполняет основные вычислительные задачи.
Графический ускоритель (GPU) — отвечает за игры и отображение интерфейса.
Оперативную и постоянную память — влияют на скорость работы приложений.
Систему охлаждения — определяет, как долго устройство может работать на полной мощности.
После тестирования программа выдает результат в баллах. Они позволяют объективно сравнить разные устройства между собой. Чем выше балл, тем лучше производительность.
Тест телефона на производительность позволяет:
оценить, потянет ли смартфон современные игры, AR-приложения и другие ресурсоемкие задачи;
сравнить реальную производительность разных моделей при выборе нового устройства;
выявить проблемы с охлаждением и падение скорости при длительной работе;
проверить, как обновления системы влияют на быстродействие;
разработчикам понять, как их приложения будут нагружать разные устройства.
Бенчмарки дают информацию о производительности устройства, которую сложно получить другим способом. Но на деле показатели тестов не всегда соответствуют ощущениям пользователя. Ниже рассмотрим основные преимущества и недостатки использования бенчмарков для оценки мобильных устройств.

Онлайн-квест для новичков и профи в IT. 24-28 ноября
Найдите спрятанные коды первыми и сообщите нам, чтобы выиграть эксклюзивный мерч и бонусы на сервисы Selectel.
Преимущества и недостатки использования бенчмарков
Бенчмарки стали популярны для оценки производительности смартфонов, но, как и любой инструмент, они имеют свои сильные и слабые стороны.
Преимущества
Упрощают сравнение устройств. Единые сценарии тестирования позволяют корректно сопоставлять результаты между моделями при одинаковых условиях.
Помогают выявлять троттлинг и перегрев. Троттлинг — это ситуация, когда телефон автоматически снижает мощность при сильном нагреве, чтобы защитить себя от повреждений. Результаты стресс-тестов показывают, насколько падает частота и стабильность системы под нагрузкой и как быстро устройство теряет мощность при нагреве.
Отслеживают изменения производительности. Регулярные прогоны показывают, как на скорость влияют обновления системы и приложений и как падает мощность по мере естественного старения гаджета.
Проверяют влияние обновлений ОС и ПО. Можно оценить, улучшилось ли быстродействие после новой версии системы или приложения. Это особенно важно для старых моделей.
Помогают при покупке нового или б/у смартфона. Результаты тестов дают представление о реальных возможностях устройства и помогают выбрать модель. Кроме того, можно оценить состояние подержанного устройства.
Определяют оптимальные настройки для игр. Зная возможности своего устройства, легче подобрать графические настройки, которые обеспечат плавную игру без подтормаживаний.
Недостатки
Не отражают реального опыта пользователя. Высокие баллы не гарантируют плавной работы интерфейса или быстрого запуска приложений. Синтетические тесты не всегда соответствуют повседневным задачам.
Подвержены манипуляциям. Некоторые производители добавляют в свои устройства специальные режимы, которые определяют запуск бенчмарка и временно повышают производительность. При обычном использовании эта мощность недоступна.
Результаты нестабильны. На тесты влияет температура телефона, уровень заряда, фоновые процессы и даже влажность воздуха. Из-за этого одно и то же устройство может показывать разные результаты в разное время.
Учитывают только определенные параметры. Бенчмарки не измеряют время автономной работы, качество камеры, дисплея или звука, хотя эти характеристики часто важнее сырой производительности.
Нет универсального стандарта. Разные бенчмарки используют разные методики тестирования и могут показывать противоречивые результаты. Устройство может быть лидером в одном тесте и отставать в другом.
Показывают кратковременную производительность. Большинство тестов длится всего несколько минут и не отражает, как устройство справляется с длительными нагрузками.
Бенчмарки дают количественные ориентиры для сравнения устройств, но на результаты влияет множество факторов — от сценария теста до типа нагрузки. Важно выбирать инструмент, подходящий конкретным задачам и целям измерений.
Как выбрать приложение для проверки телефона
Бенчмарки различаются по функционалу и точности. Чтобы результаты были полезными и сопоставимыми, инструмент должен соответствовать цели теста, платформе и условиям запуска. Вот ключевые параметры, на которые стоит опираться при выборе:
Тип нагрузки. Измеряет CPU, GPU / игровые сцены, «реальные» сценарии, AI/NPU. Для многопоточных задач выбирайте тесты, акцентированные на multi-core/compute.
Совместимость с устройством. Обращайте внимание на требуемые версии ОС и графических/ML-API (Metal, Vulkan, OpenCL, NNAPI/Core ML), а также на поддержку функций (например, RT).
Кросс-платформенность. Для сравнения iOS и Android используйте одну версию бенчмарка и похожие пресеты. Учитывайте, что разные бэкенды могут влиять на результат.
Доступность и способ установки. Предпочтительнее официальные версии из Google Play и App Store. При загрузке с сайта разработчика оценивайте риски и происхождение APK/IPA.
Защита от манипуляций. Обращайте внимание на специализированные тесты стабильности, которые выявляют случаи временного повышения производительности.
Актуальность тестов. Важно использовать бенчмарки, учитывающие современные архитектуры процессоров и графических подсистем. Для тестирования нейронных процессоров в современных флагманах подбирайте специализированные тесты для оценки AI-производительности.
Прозрачность и репутация. Выбирайте бенчмарки, у которых есть открытая методика, changelog, база публичных результатов, активное комьюнити.
На рынке существуют десятки различных бенчмарков — от комплексных до узкоспециализированных. Чтобы вам было легче выбрать тест, подходящий именно под ваши задачи, рассмотрим наиболее популярные и проверенные временем инструменты.
Обзор популярных бенчмарков для смартфонов
В таблице сравнили распространенные бенчмарки по ключевым характеристикам: типу нагрузки, совместимости с различными платформами, точности результатов. Дополнительно подсветили особенности, которые отличают их от аналогов.
Бенчмарк |
Тип нагрузки |
Совместимость |
Точность |
Особенности |
AnTuTu Benchmark |
• CPU • GPU • Память • UX (общая производительность) |
• Android (APK) • iOS |
• Показывает комплексный балл • Подвержен вариативности • Возможны искажения от «оптимизаций» производителей |
• Самый массовый тест • Удален из Google Play в 2020-м • Включает тесты ИИ |
Geekbench 6 |
• CPU (single/multi) • GPU Compute (OpenCL, Metal, Vulkan) |
• Android • iOS |
• Высокая воспроизводимость при равных условиях • Удобен для кросс-платформенного сравнения • Может искажаться оптимизациями прошивок |
• Позволяет сравнивать устройства на разных платформах • Отдельные тесты для одноядерной и многоядерной производительности |
3DMark |
• Графика (GPU) • Игровые сценарии (Wild Life, Solar Bay/RT и другие) |
• Android • iOS |
• Высокая для графических тестов • Стандартизированные игровые сцены • Подходит для сравнения устройств по графике |
• Сценарии близки к реальным играм • Включает тест Wild Life Stress Test для оценки стабильности GPU • Визуализирует результаты в виде FPS |
PCMark for Android |
• Реальные сценарии: браузинг, документы, фото, видео • Тест автономности |
• Android • Актуальные тесты: Work 3.0, Storage 2.0 |
Средняя; иногда нестабильная работа |
• Эмулирует повседневную работу • Позволяет тестировать батарею |
MLPerf Mobile |
• ИИ-нагрузки (инференс на NPU, CPU, GPU) • Задачи машинного обучения |
• Android (Google Play) • iOS — ограниченная поддержка в коде/репозитории |
• Признанный индустриальный стандарт • Регулярные публикации результатов (два раза в год) • База сравнений пока ограничена |
• Фокус на ИИ-сценариях • Отражает перспективные нагрузки (ML/AI) • Развивается под эгидой MLCommons • Сложнее в интерпретации результатов |
Рекомендации по выбору приложения для проверки телефона
Если сравнение по параметрам не дало четкого понимания, какой именно инструмент выбрать, отталкивайтесь от своей основной цели — будь то покупка нового гаджета, выявление проблем с имеющимся смартфоном или сравнение производительности после обновления системы. Ниже привели сценарии использования бенчмарков с примерами подходящих инструментов:
Для теста общей производительности подойдут комплексные бенчмарки, которые измеряют работу процессора, графики, памяти и пользовательского интерфейса:
AnTuTu Benchmark показывает понятный общий балл с разбивкой по компонентам. Особенно полезен при сравнении устройств одного производителя или на одной платформе.
Geekbench (CPU + GPU-тесты) предоставляет оценку производительности процессора с разделением на одноядерный и многоядерный режимы. Это важно, поскольку многие приложения не полностью оптимизированы для многоядерных процессоров.
Для проверки графической производительности нужны тесты, которые моделируют поведение устройства в играх и при сложной визуализации:
3DMark — наиболее показательный тест для оценки возможностей в играх. Для флагманов используйте Wild Life Extreme или Solar Bay. Для устройств среднего класса подойдет обычный Wild Life. Важная функция — стресс-тест (20 минут непрерывной нагрузки), который показывает, насколько стабильно устройство поддерживает производительность со временем. Показатель стабильности ниже 70% говорит о серьезном троттлинге.
Basemark GPU — альтернатива 3DMark, позволяет сравнивать производительность разных графических API (OpenGL и Vulkan для Android). Это важно для понимания, как конкретные игры будут работать на вашем устройстве в зависимости от используемого ими API.
Для анализа ИИ-производительности подойдут специализированные тесты, оценивающие эффективность работы нейронных процессоров и ускорителей искусственного интеллекта в современных устройствах:
MLPerf Mobile оценивает скорость обработки популярных задач ИИ: распознавание изображений, обработку естественного языка и другие. Подходит для флагманских устройств 2024–2025 годов, где производители активно внедряют ИИ-функции.
AI Benchmark — более простая альтернатива MLPerf, доступная в Google Play. Тестирует различные сценарии использования ИИ, включая сегментацию изображений, распознавание лиц и анализ речи.
Для оценки производительности в реальных сценариях используйте бенчмарки, которые имитируют повседневную работу пользователя с различными приложениями и задачами:
PCMark for Android показывает, как устройство справляется с повседневными задачами: с просмотром веб-страниц, работой с документами, редактированием фото. Включает тест Work 3.0 для проверки производительности и Battery Life для оценки времени автономной работы.
Для проверки стабильности при длительных нагрузках выбирайте инструменты, способные поддерживать постоянную высокую нагрузку на систему и отслеживать изменения производительности с течением времени:
CPU Throttling Test выявляет проблемы с охлаждением, которые скажутся при длительных играх или использовании навигации.
Для наиболее полной картины рекомендуем использовать комбинацию из нескольких тестов. Например, для выбора нового смартфона оптимально проверить:
AnTuTu или Geekbench — для общей оценки возможностей устройства;
3DMark Wild Life (обычный + стресс-тест) — для оценки графической производительности и стабильности;
PCMark Work 3.0 — для понимания скорости работы в повседневных задачах.
Однако даже идеально подобранный набор бенчмарков может дать искаженные результаты из-за неправильно проведенного тестирования. Далее разберемся, как получить наиболее объективные данные и правильно их анализировать.

Мобильная ферма Selectel
Начните тестировать на реальных устройствах за 2 минуты – откуда угодно.
Как правильно протестировать телефон и что делать с результатами
Чтобы результаты бенчмарков были сопоставимыми, тесты проводят в контролируемой среде: фиксируют настройки, минимизируют фоновые факторы и повторяют прогоны. Ниже — чек-лист подготовки, порядок запуска и базовые принципы интерпретации.
Подготовка устройства
Создайте оптимальные условия: зарядите аккумулятор минимум до 80% и подключите зарядное устройство, чтобы исключить влияние режима энергосбережения. Закройте все фоновые приложения через диспетчер задач — они могут снизить результаты на 10–15%.
Если на устройстве есть режим «Производительность», включите его.
Дайте телефону остыть до комнатной температуры, если он разогрелся после игр или длительной работы. Перегретый смартфон может показать на 20–30% худшие результаты.
Отключите автоматические обновления и синхронизацию, а перед тестом перезагрузите телефон. Так результаты будут более стабильными.
Проведение теста
Запускайте тесты не менее трех раз с перерывами около 5–10 минут между запусками, чтобы устройство успевало остывать. Во время работы бенчмарка не используйте телефон для других задач.
Для оценки игровой производительности используйте стресс-тесты длительностью не менее 20 минут. Например, в 3DMark выбирайте режим Wild Life Stress Test вместо стандартного Wild Life.
Если тестируете флагманский смартфон с нейронным процессором, используйте специализированные тесты для оценки ИИ-возможностей, например MLPerf Mobile.
Сохраняйте результаты каждого запуска, чтобы отслеживать динамику результатов и изменения после обновлений системы или установки новых приложений.
Интерпретация результатов
Вычислите среднее значение по всем запускам и сравните с показателями аналогичных моделей. Отклонения до 15–20% от эталонных значений считаются нормой. На результаты влияет версия прошивки, установленные приложения и даже температура помещения.
В стресс-тестах обращайте внимание на показатель стабильности. Например, в 3DMark значение выше 90% означает отличную систему охлаждения, 70–80% — нормальный результат, а ниже 60% указывает на сильный троттлинг, который будет заметен в играх.
Когда стоит беспокоиться
Результаты более чем на 30% ниже средних показателей для вашей модели — возможны проблемы с системой или вредоносные программы.
Устройство нагревается выше 45 ℃ при тестировании — проблемы с системой охлаждения, которые приводят к троттлингу, нестабильной работе в играх, быстрому разряду батареи и потенциально сокращают срок службы компонентов.
Показатель стабильности в графических тестах ниже 60% — телефон быстро теряет производительность из-за перегрева.
Тесты завершаются с ошибкой, или устройство перезагружается — возможны аппаратные проблемы.
После обновления ОС производительность упала более чем на 25% — плохая оптимизация новой версии.
Заметные задержки и подтормаживания в работе интерфейса при высоких баллах в бенчмарках — признак проблем с оптимизацией системы. Это несоответствие может быть вызвано тяжелой оболочкой производителя, неэффективной работой фоновых процессов или конфликтами между приложениями.
Если что-то из этого произошло, попробуйте очистить кеш, освободить память и перезагрузить устройство. Если проблема сохранится, возможно, понадобится сброс до заводских настроек.
Помните, что бенчмарк — это инструмент диагностики, а не абсолютный показатель удобства использования. Телефон с меньшим количеством баллов, но с хорошей оптимизацией часто работает субъективно быстрее, чем устройство с рекордными цифрами в тестах.
Как Selectel помогает тестировать мобильные приложения
Мобильная ферма предоставляет удаленный доступ к реальным смартфонам на разных версиях Android и iOS. С ее помощью разработчики могут проверять совместимость и производительность на широком наборе SoC, экранов и схем охлаждения, включая сценарии длительной нагрузки и анализ троттлинга.
Для автоматизации доступны:
прогон UI- и нагрузочных тестов через Appium;
интеграция в CI/CD (например, GitHub Actions, GitLab CI) для регулярных прогонов на пуле устройств;
сбор логов, метрик и артефактов для повторяемого анализа.
Такой подход помогает выявлять деградации между сборками, сравнивать поведение на разных чипсетах и фиксировать стабильность под длительной нагрузкой — до публикации релиза.
Заключение
Бенчмарки помогают взглянуть на смартфон без эмоций — цифрами подтвердить или опровергнуть ощущения от работы устройства. Они показывают сильные и слабые стороны аппаратной части, помогают выявить перегрев, оценить влияние обновлений и понять, насколько телефон справится с рабочими нагрузками.
Но важно помнить: ни один тест не отражает всю картину. Реальная производительность зависит не только от железа, но и от оптимизации системы, конкретных приложений и сценариев использования. Именно поэтому использовать бенчмарки стоит как инструмент анализа, а не как единственный критерий при выборе или оценке устройства.
Регулярное тестирование и внимательное отношение к результатам позволяют продлить жизнь смартфона и избежать неожиданных проблем с его производительностью — будь то личное устройство или рабочий инструмент разработчика.
kulibyaka
Простите за тавтологию: а где тесты тестов? Без этого статья - не статья (имхо).
P.S.: во времена 4-го андроида, достаточно было прописать в build.prop дешёвого девайса, какой-нибудь флагман, и количество "попугаев" в AnTuTu взлетало в заоблачную высь :D