Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Технологии
17 сентября 2024

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Если вы всё ещё верите в них, самое время начать сомневаться.
Фото автора Артём Козориз
Артём Козориз

Автор Лайфхакера

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Термин бенчмарк в широком понимании подразумевает специальный эталонный тест (англ. benchmark — эталон) для измерения эффективности различных систем и формирования шкалы оценки для их последующего сравнения. 

Сначала появились компьютерные бенчмарки, но с распространением смартфонов возникла необходимость и в мобильных аналогах. Одним из первых стал китайский AnTuTu, позже добавились «младшие» версии известных компьютерных тестов 3DMark, PCMark, Geekbench. Все они, помимо подробных сведений о смартфоне, позволяют оценить производительность процессора, видеочипа, памяти, накопителя, а также протестировать другие компоненты.

Результаты общих тестов обычно представлены в виде абстрактных баллов, которые иронично называют «попугаями» — с отсылкой к старому мультфильму, где удава измеряли в птицах, мартышках и слонах. 

Однако всё меньше пользователей и экспертов доверяют бенчмаркам. Сейчас они почти утратили свою актуальность, и вот почему.

Производительность смартфонов выровнялась

Развитие мобильных чипсетов привело к достижению так называемого порога достаточности, и теперь почти любые смартфоны обеспечивают необходимую производительность для повседневных задач вроде проверки социальных сетей, просмотра видео, работы с мессенджерами и браузером.

Как следствие, устройства одной ценовой категории работают плюс-минус одинаково быстро. Более того, даже между среднебюджетными смартфонами и флагманами разница в быстродействии почти незаметна для обычного человека. 

А если говорить о сравнении топовых устройств, то различия едва ли уловимы — производители давно упёрлись в тот предел мощности, когда последующее наращивание уже не даёт ощутимых изменений.

Бенчмарки не оценивают реальное быстродействие

Сравнение устройств в тестах AnTuTu
Сравнение устройств в тестах AnTuTu. Кадр: Versus / YouTube

Главная претензия к бенчмаркам — сугубо синтетические тесты, которые мало того что проводятся в идеальных условиях, так ещё и редко встречаются в реальной жизни. 

Например: работа процессора на максимальной частоте, кодирование видео или шифрование больших объёмов данных. В то время как более важные плавность интерфейса, скорость открытия приложений и взаимодействия с ними в режиме многозадачности искусственные сценарии не учитывают. Фоновые процессы, нагрев, микрофризы — всё это тоже игнорируется.

Баллы, которые мы видим в результатах бенчмарков, и есть пресловутые попугаи. Они почти полностью оторваны от реальности, а интерпретировать их для понимания фактической производительности довольно сложно, если не невозможно. Именно поэтому выбирать смартфон, ориентируясь на баллы в тестах, — худшее, что можно придумать.

Высокие оценки не гарантируют хороший пользовательский опыт

Информативность бенчмарков довольно сомнительна. Рекордные баллы создают иллюзию безупречного опыта использования, тогда как на деле всё может быть иначе, поскольку зависит от многих других факторов.

Ключевую роль играют оптимизация софта и удобство оболочек, которые в смартфонах каждого производителя различаются. Нередко устройство с меньшим количеством баллов приятнее и отзывчивее в работе. 

Кадр из презентации Xiaomi
Кадр из презентации Xiaomi, которая хвалится высочайшим результатом Redmi K60 Ultra в AnTuTu

Плавность работы измерить никак нельзя, поэтому производители, особенно китайские бренды, упорно продолжают хвастаться рекордами в AnTuTu прямо на презентации новинок — да ещё с фанфарами и звуковым эффектом взрыва. 

Тесты не учитывают производительность в реальной жизни

Существенный недостаток большинства бенчмарков в том, что процесс тестирования длится всего несколько минут и не отражает условий реальной эксплуатации. Бенчмарки выполняются на стерильных устройствах с пустым накопителем, без установленных приложений и фоновых процессов. 

Не учитывается не только нагрев при длительной работе, но и «замусоренность» памяти, падение производительности под влиянием постоянной активности сервисов Google и китайских аналогов, а также естественная деградация аккумулятора, способная влиять на производительность процессора.

Идеальные результаты, полученные единожды, не гарантируют такие же через несколько недель или месяцев, не говоря уже о более длинных дистанциях в 2–3 года.

То же самое относится и к автономности, которая важна не менее, чем быстродействие. Краткосрочные непрерывные тесты аккумуляторов совершенно не объективны, поскольку не учитывают индивидуальные привычки пользователей, разные режимы работы и постепенное химическое старение батареи.

Производители оптимизируют устройства под бенчмарки

Повальное увлечение тестами привело к тому, что бренды стали хитрить. Они добавляют алгоритмы, которые распознают запуск популярных бенчмарков и переключают смартфоны в режим максимального быстродействия для достижения лучших результатов любой ценой. В реальной жизни их, разумеется, никогда не будет.

В тестах временно повышается тактовая частота процессора, отключаются или снижаются температурные ограничения, а процесс бенчмарка получает максимальный приоритет перед системными или обычными приложениями. 

Ещё в 2013‑м Samsung уличили в оптимизации работы смартфона Galaxy S4 в тестах: они разблокировали недоступную в обычной жизни частоту графического процессора и улучшили тем самым результаты на 11%. Китайские компании давно переняли этот опыт.

Маркетологи тоже не гнушаются подтасовкой фактов. Часто в рекламных кампаниях используют лишь выгодные, громкие показатели, а не столь впечатляющие опускаются. Та же Apple на презентациях сопоставляет мощность новых устройств с абстрактными смартфонами «других производителей». Либо сравнивает свой флагман не с предыдущим, а со старшим на два-три поколения, чтобы показать прирост производительности в три, а то и в пять раз.

Что дальше будет с бенчмарками

Вероятно, время безоговорочного доверия бенчмаркам подходит к концу. И хотя тесты по-прежнему дают определённую информацию о технических характеристиках, очевидно, что они не способны спрогнозировать реальный пользовательский опыт.

Проверка скорости последовательного запуска  приложений на двух смартфонах
Пример с куда более полезным тестом, где проверяется скорость последовательного запуска различных приложений на двух смартфонах. Кадр из видео PhoneBuff / YouTube 

Гораздо релевантнее становятся полноценные тесты в разных сценариях повседневной эксплуатации на протяжении недель и месяцев, которые проводят техноблогеры, а также отзывы реальных владельцев. В отрыве от этого бенчмарки не значат почти ничего. Только комплексный подход позволит оценить возможности смартфона.

А как вы относитесь к бенчмаркам? Расскажите в комментариях!

Что ещё почитать про смартфоны
📲
Журналисты сравнили камеры свежего Pixel 9 и прошлогоднего iPhone 15 Pro Max
8 причин, почему Xiaomi уже не топ
Автономность Google Pixel 9 и 9 Pro XL сравнили с iPhone 15 Pro Max и другими флагманами
15 крутых бюджетных смартфонов, которые не разочаруют
Какой iPhone купить в 2025 году: топ-7 моделей
Обложка: Лайфхакер
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Пусковое устройство от GEARCON

Забираем за полцены пусковое устройство с кучей полезных функций

аккумуляторные батарейки

Экономим на пальчиковых батарейках с аккумуляторным вариантом от imuto

10 naborov ruchnyh instrumentov, kotorye dolzhny byt' u kazhdogo

10 наборов ручных инструментов, которые должны быть у каждого

Дрель-шуруповёрт от Kolner

Надо брать: надёжная дрель-шуруповёрт от Kolner со скидкой 70%

Какую зимнюю обувь стоит купить у Nike, adidas и других популярных брендов

10 пар тёплой обуви от популярных брендов с приятными ценами

Надо брать: микроволновка от Tuvio со скидкой 58% и тысячами довольных отзывов

Надо брать: микроволновка от Tuvio со скидкой 58% и тысячами довольных отзывов

9 очень разных, но одинаково удобных пар джинсов с высокой посадкой

9 очень разных, но одинаково удобных пар джинсов с высокой посадкой

Смартфон POCO M8 Pro

Свежий смартфон POCO M8 Pro отдают со скидкой 56% на AliExpress

Это интересно
Где в России покататься на коньках

Самый большой или самый длинный? 7 главных катков России

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Что такое «Редуксин Форте» и как он работает

Что такое «Редуксин Форте» и как он работает

3 главных мифа о работниках старшего поколения 

3 главных мифа о работниках старшего поколения 

Комментарии
Denis Kotov
17.09.24 18:15
Интересно, есть какой нить тест, как быстро устройство работает с PDF, по работе постоянно надо.
Timoteo Cirkla
18.09.24 01:20
Вообще-то решают.
Alexandr Al
18.09.24 03:42
Примерно тоже самое писалось лет 20 назад про тесты компьютеров. Результаты мы видим - бенчмарки и тесты отлично продолжают существовать, и они всё решают. Со смартфонами всё соже самое. Любой, кто возьмет аппараты, отличающиеся по бенчмаркам в 2-3 раза, сразу почувствует разницу. Собственно любой это может проверить, взяв свой старый телефон.
Виктор Подволоцкий
18.09.24 09:19
Ну 2-3 раза это как правило большая разница в цене. Здесь скорее поинт в сравнении аналогов, когда именно на бенчмарки ориентируются.
Алексей Михайлов
18.09.24 07:07
А что тут думать? Одна из метрик. У автомобиля та же история. Помимо максимальной скорости есть разгон до сотни, есть торможение с 80 км/час.
Артём Козориз
18.09.24 16:19
Верно подмечено, что одна из, согласен. А так аналогия с авто тоже хорошо подходит — по времени разгона до 100 км/ч не совсем правильно выбирать машину, вернее совсем не правильно, мягко говоря.
Алексей Михайлов
18.09.24 18:22
Тем более что "попугаи" это не "разгон до сотни", а "максимальная скорость". Ещё более бесполезная метрика в мире авто.
Давлет В.
18.09.24 15:45
Лучше б стабильный компас сделали
axcap
19.09.24 10:15
Спасибо автору за статью. Хорошо написана, понятная подача. Всё объяснил тем, кто так рьяно пытается доказать, что попугаи объективно что-то решают. Это как бег на дальнюю дистанцию, когда первые пару сотен метров все бегут +/- одинаково быстро, но продолжать бежать в том же темпе может уже не каждый.
Что вы могли пропустить
Microsoft показала верхнюю панель инструментов для Windows 11 — как в macOS, только гибче
Microsoft показала верхнюю панель инструментов для Windows 11 — как в macOS, только гибче
0
17:10
Windows
Новости
Лучшие смартфоны января
Лучшие смартфоны января
0
16:00
Устройства
Устройства
Авторитетный инсайдер раскрыл дату анонса линейки Samsung Galaxy S26
Авторитетный инсайдер раскрыл дату анонса линейки Samsung Galaxy S26
0
13:17
Новости
Устройства
40 красивейших фото на смартфон от команды Лайфхакера — забирайте на обои и делитесь своими шедеврами
40 красивейших фото на смартфон от команды Лайфхакера — забирайте на обои и делитесь своими шедеврами
0
13:00
Редакция
Технологии
В пару кликов: как переслать сообщение в Telegram без пометки «Переслано»
В пару кликов: как переслать сообщение в Telegram без пометки «Переслано»
0
10:00
Технологии
Технологии
Капча для людей: OpenAI разрабатывает соцсеть, в которую не смогут попасть боты
Капча для людей: OpenAI разрабатывает соцсеть, в которую не смогут попасть боты
0
Вчера
Новости
Технологии
Доминирование двух брендов: названы 10 самых продаваемых смартфонов в 2025 году
Доминирование двух брендов: названы 10 самых продаваемых смартфонов в 2025 году
0
Вчера
Новости
Технологии
Вышло крупное обновление браузера Chrome с интеграцией Gemini и Nano Banana
Вышло крупное обновление браузера Chrome с интеграцией Gemini и Nano Banana
0
Вчера
Браузеры
Новости
14 устаревших стереотипов о технике, в которые странно верить в 2026 году
14 устаревших стереотипов о технике, в которые странно верить в 2026 году
0
Вчера
Технологии
Технологии
Усиленная прочность, приятная камера, флагманская выносливость: обзор REDMI Note 15 Pro+ 5G
Усиленная прочность, приятная камера, флагманская выносливость: обзор REDMI Note 15 Pro+ 5G
Вчера
Технологии
Технологии
Отдых для мозга: сайт со звуками леса из разных уголков мира
Отдых для мозга: сайт со звуками леса из разных уголков мира
0
28 января
Технологии
Технологии
Google случайно показала Android для ПК: первые скриншоты Aluminium OS
Google случайно показала Android для ПК: первые скриншоты Aluminium OS
0
28 января
Android
Новости
«Джарвис уже существует»: в Сети завирусился Moltbot — ИИ‑агент, который «реально что-то умеет»
«Джарвис уже существует»: в Сети завирусился Moltbot — ИИ‑агент, который «реально что-то умеет»
0
28 января
Новости
Технологии
OpenAI запустила Prism — бесплатное ИИ‑пространство для написания курсовых работ и научных исследований
OpenAI запустила Prism — бесплатное ИИ‑пространство для написания курсовых работ и научных исследований
0
28 января
Веб-сервисы
Новости
Павел Дуров вновь высказался про WhatsApp — его поддержал Илон Маск
Павел Дуров вновь высказался про WhatsApp — его поддержал Илон Маск
0
27 января
Новости
Технологии

Новые комментарии

Аватар автора комментария
Алексей Хромов18 минут назад

0 / 0

Да, закралась ошибочка в описание, спасибо. А вот в новом, кажется, уже и про капитализм будет.
13 самых ожидаемых мультфильмов 2026 года
Аватар автора комментария
Гог Магог42 минуты назад

0 / 0

К сведению автора : "двойной нырок в атмосферу" вынужденный манёвр спускаемого аппарата, чтобы уменьшить перегрузки при торможении в атмосфере Земли, и любая ошибка угла входа в атмосферу увеличивает промах в желаемый район приземления на тысячи километров. Ничего подобного НАСА не сообщало о своих, якобы, полётах на Луну по программе "Аполлон", потому что они тогда даже не представляли какие реальные задачи следует решить при таких полётах. Температуры нагрева поверхности спускаемого аппарата при торможении в атмосфере достигают 3.5-6 тыс град К в зависимости от режима планирования на гиперзвуке. Американцы до сих пор робко пытаются сообщать о якобы создании гиперзвукового оружия со скоростями чуть выше Мах = 5, а тут нас дурачат и сообщают о скоростях входа в 40000 км/час - это свыше Мах = 35 ! Люди, вам "вешают огромную лапшу на уши" !!!
NASA показало видео с корабля Orion, входящего в атмосферу Земли на скорости 40 000 км/ч
Аватар автора комментария
Сергей Беляев47 минут назад

0 / 0

Надеюсь не испортят экранизацию, Колесо времени невозможно смотреть было.
Рождение новой телевселенной: Apple TV экранизирует фэнтези-книги серии «Космер» Брендона Сандерсона
Аватар автора комментария
Ivan F1 час назад

0 / 0

Вот еще. Горы не выкладываю, горы - это не спортивно))
40 красивейших фото на смартфон от команды Лайфхакера — забирайте на обои и делитесь своими шедеврами
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях