Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Рецепты на Масленицу
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Технологии
17 сентября 2024

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Если вы всё ещё верите в них, самое время начать сомневаться.
Фото автора Артём Козориз
Артём Козориз

Автор Лайфхакера

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Термин бенчмарк в широком понимании подразумевает специальный эталонный тест (англ. benchmark — эталон) для измерения эффективности различных систем и формирования шкалы оценки для их последующего сравнения. 

Сначала появились компьютерные бенчмарки, но с распространением смартфонов возникла необходимость и в мобильных аналогах. Одним из первых стал китайский AnTuTu, позже добавились «младшие» версии известных компьютерных тестов 3DMark, PCMark, Geekbench. Все они, помимо подробных сведений о смартфоне, позволяют оценить производительность процессора, видеочипа, памяти, накопителя, а также протестировать другие компоненты.

Результаты общих тестов обычно представлены в виде абстрактных баллов, которые иронично называют «попугаями» — с отсылкой к старому мультфильму, где удава измеряли в птицах, мартышках и слонах. 

Однако всё меньше пользователей и экспертов доверяют бенчмаркам. Сейчас они почти утратили свою актуальность, и вот почему.

Производительность смартфонов выровнялась

Развитие мобильных чипсетов привело к достижению так называемого порога достаточности, и теперь почти любые смартфоны обеспечивают необходимую производительность для повседневных задач вроде проверки социальных сетей, просмотра видео, работы с мессенджерами и браузером.

Как следствие, устройства одной ценовой категории работают плюс-минус одинаково быстро. Более того, даже между среднебюджетными смартфонами и флагманами разница в быстродействии почти незаметна для обычного человека. 

А если говорить о сравнении топовых устройств, то различия едва ли уловимы — производители давно упёрлись в тот предел мощности, когда последующее наращивание уже не даёт ощутимых изменений.

Бенчмарки не оценивают реальное быстродействие

Сравнение устройств в тестах AnTuTu
Сравнение устройств в тестах AnTuTu. Кадр: Versus / YouTube

Главная претензия к бенчмаркам — сугубо синтетические тесты, которые мало того что проводятся в идеальных условиях, так ещё и редко встречаются в реальной жизни. 

Например: работа процессора на максимальной частоте, кодирование видео или шифрование больших объёмов данных. В то время как более важные плавность интерфейса, скорость открытия приложений и взаимодействия с ними в режиме многозадачности искусственные сценарии не учитывают. Фоновые процессы, нагрев, микрофризы — всё это тоже игнорируется.

Баллы, которые мы видим в результатах бенчмарков, и есть пресловутые попугаи. Они почти полностью оторваны от реальности, а интерпретировать их для понимания фактической производительности довольно сложно, если не невозможно. Именно поэтому выбирать смартфон, ориентируясь на баллы в тестах, — худшее, что можно придумать.

Высокие оценки не гарантируют хороший пользовательский опыт

Информативность бенчмарков довольно сомнительна. Рекордные баллы создают иллюзию безупречного опыта использования, тогда как на деле всё может быть иначе, поскольку зависит от многих других факторов.

Ключевую роль играют оптимизация софта и удобство оболочек, которые в смартфонах каждого производителя различаются. Нередко устройство с меньшим количеством баллов приятнее и отзывчивее в работе. 

Кадр из презентации Xiaomi
Кадр из презентации Xiaomi, которая хвалится высочайшим результатом Redmi K60 Ultra в AnTuTu

Плавность работы измерить никак нельзя, поэтому производители, особенно китайские бренды, упорно продолжают хвастаться рекордами в AnTuTu прямо на презентации новинок — да ещё с фанфарами и звуковым эффектом взрыва. 

Тесты не учитывают производительность в реальной жизни

Существенный недостаток большинства бенчмарков в том, что процесс тестирования длится всего несколько минут и не отражает условий реальной эксплуатации. Бенчмарки выполняются на стерильных устройствах с пустым накопителем, без установленных приложений и фоновых процессов. 

Не учитывается не только нагрев при длительной работе, но и «замусоренность» памяти, падение производительности под влиянием постоянной активности сервисов Google и китайских аналогов, а также естественная деградация аккумулятора, способная влиять на производительность процессора.

Идеальные результаты, полученные единожды, не гарантируют такие же через несколько недель или месяцев, не говоря уже о более длинных дистанциях в 2–3 года.

То же самое относится и к автономности, которая важна не менее, чем быстродействие. Краткосрочные непрерывные тесты аккумуляторов совершенно не объективны, поскольку не учитывают индивидуальные привычки пользователей, разные режимы работы и постепенное химическое старение батареи.

Производители оптимизируют устройства под бенчмарки

Повальное увлечение тестами привело к тому, что бренды стали хитрить. Они добавляют алгоритмы, которые распознают запуск популярных бенчмарков и переключают смартфоны в режим максимального быстродействия для достижения лучших результатов любой ценой. В реальной жизни их, разумеется, никогда не будет.

В тестах временно повышается тактовая частота процессора, отключаются или снижаются температурные ограничения, а процесс бенчмарка получает максимальный приоритет перед системными или обычными приложениями. 

Ещё в 2013‑м Samsung уличили в оптимизации работы смартфона Galaxy S4 в тестах: они разблокировали недоступную в обычной жизни частоту графического процессора и улучшили тем самым результаты на 11%. Китайские компании давно переняли этот опыт.

Маркетологи тоже не гнушаются подтасовкой фактов. Часто в рекламных кампаниях используют лишь выгодные, громкие показатели, а не столь впечатляющие опускаются. Та же Apple на презентациях сопоставляет мощность новых устройств с абстрактными смартфонами «других производителей». Либо сравнивает свой флагман не с предыдущим, а со старшим на два-три поколения, чтобы показать прирост производительности в три, а то и в пять раз.

Что дальше будет с бенчмарками

Вероятно, время безоговорочного доверия бенчмаркам подходит к концу. И хотя тесты по-прежнему дают определённую информацию о технических характеристиках, очевидно, что они не способны спрогнозировать реальный пользовательский опыт.

Проверка скорости последовательного запуска  приложений на двух смартфонах
Пример с куда более полезным тестом, где проверяется скорость последовательного запуска различных приложений на двух смартфонах. Кадр из видео PhoneBuff / YouTube 

Гораздо релевантнее становятся полноценные тесты в разных сценариях повседневной эксплуатации на протяжении недель и месяцев, которые проводят техноблогеры, а также отзывы реальных владельцев. В отрыве от этого бенчмарки не значат почти ничего. Только комплексный подход позволит оценить возможности смартфона.

А как вы относитесь к бенчмаркам? Расскажите в комментариях!

Что ещё почитать про смартфоны
📲
Журналисты сравнили камеры свежего Pixel 9 и прошлогоднего iPhone 15 Pro Max
8 причин, почему Xiaomi уже не топ
Автономность Google Pixel 9 и 9 Pro XL сравнили с iPhone 15 Pro Max и другими флагманами
15 крутых бюджетных смартфонов, которые не разочаруют
Какой iPhone купить в 2025 году: топ-7 моделей
Обложка: Лайфхакер
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

3D-принтер для большой печати Creality Ender-5 Max

Надо брать: 3D-принтер для большой печати Creality Ender-5 Max со скидкой 56%

Моющий пылесос Dreame G10 Pro

Популярный моющий пылесос Dreame G10 Pro отдают за полцены на AliExpress

Забираем дебетовку «Т-банка» с 2 000 баллов и повышенным кешбэком на автоуслуги

Забираем дебетовку «Т-банка» с 2 000 баллов и повышенным кешбэком за автоуслуги

Непромокаемые кроссовки от Li-Ning

Кроссовки от Li-Ning, которые не боятся слякоти, отдают со скидкой 37%

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Находки AliExpress: самые интересные и полезные товары недели

Находки AliExpress: самые интересные и полезные товары недели

Нескользящий коврик для йоги

Нескользящий коврик для йоги, на который можно залипнуть после тренировки

7 надёжных камер для безопасности людей и питомцев

7 надёжных камер для безопасности людей и питомцев

Это интересно
Правда ли, что диабет молодеет? Разбираемся с эндокринологом

Правда ли, что диабет молодеет? Разбираемся с эндокринологом

3 настолки, которые можно подарить на любой праздник

3 настолки, которые можно подарить на любой праздник

«Мне с любовью от меня»: 5 подарков в форме сердца, которыми можно порадовать себя 14 февраля

«Мне с любовью от меня»: 5 подарков в форме сердца, которыми можно порадовать себя 14 февраля

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Три необычных продукта, которые точно стоит попробовать во «ВкусВилле»

Комментарии
Denis Kotov
17.09.24 18:15
Интересно, есть какой нить тест, как быстро устройство работает с PDF, по работе постоянно надо.
Timoteo Cirkla
18.09.24 01:20
Вообще-то решают.
Alexandr Al
18.09.24 03:42
Примерно тоже самое писалось лет 20 назад про тесты компьютеров. Результаты мы видим - бенчмарки и тесты отлично продолжают существовать, и они всё решают. Со смартфонами всё соже самое. Любой, кто возьмет аппараты, отличающиеся по бенчмаркам в 2-3 раза, сразу почувствует разницу. Собственно любой это может проверить, взяв свой старый телефон.
Виктор Подволоцкий
18.09.24 09:19
Ну 2-3 раза это как правило большая разница в цене. Здесь скорее поинт в сравнении аналогов, когда именно на бенчмарки ориентируются.
Алексей Михайлов
18.09.24 07:07
А что тут думать? Одна из метрик. У автомобиля та же история. Помимо максимальной скорости есть разгон до сотни, есть торможение с 80 км/час.
Артём Козориз
18.09.24 16:19
Верно подмечено, что одна из, согласен. А так аналогия с авто тоже хорошо подходит — по времени разгона до 100 км/ч не совсем правильно выбирать машину, вернее совсем не правильно, мягко говоря.
Алексей Михайлов
18.09.24 18:22
Тем более что "попугаи" это не "разгон до сотни", а "максимальная скорость". Ещё более бесполезная метрика в мире авто.
Давлет В.
18.09.24 15:45
Лучше б стабильный компас сделали
axcap
19.09.24 10:15
Спасибо автору за статью. Хорошо написана, понятная подача. Всё объяснил тем, кто так рьяно пытается доказать, что попугаи объективно что-то решают. Это как бег на дальнюю дистанцию, когда первые пару сотен метров все бегут +/- одинаково быстро, но продолжать бежать в том же темпе может уже не каждый.
Что вы могли пропустить
Apple анонсировала мартовскую презентацию — на ней могут представить недорогой MacBook и iPhone 17e
Apple анонсировала мартовскую презентацию — на ней могут представить недорогой MacBook и iPhone 17e
0
16 февраля
Новости
Устройства
8 способов подключить телефон к телевизору
8 способов подключить телефон к телевизору
0
16 февраля
Ликбез
Устройства
Названы устройства Xiaomi, Redmi и Poco, которые получат Android 17 — в списке более 70 моделей
Названы устройства Xiaomi, Redmi и Poco, которые получат Android 17 — в списке более 70 моделей
0
16 февраля
Android
Новости
Как полностью удалить файлы на iPhone
Как полностью удалить файлы на iPhone
0
15 февраля
iOS
Ликбез
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
В Microsoft назвали точные сроки, когда ИИ сможет заменить офисных сотрудников — скоро
0
14 февраля
Новости
Технологии
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
Samsung Galaxy S26 и S26+ показали на фото со всех сторон
0
14 февраля
Новости
Устройства
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
Как скачать видео с любого сайта без дополнительных программ: 10 универсальных сервисов
0
14 февраля
Веб-сервисы
Ликбез
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
Бюджетный iPhone 17e показали на рендерах — его могут выпустить в феврале
0
13 февраля
Новости
Устройства
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
Дублинский стартап создал «парктроник» с ИИ для велосипедистов
0
13 февраля
Новости
Устройства
Sony впервые за три года выпустила флагманские TWS‑наушники
Sony впервые за три года выпустила флагманские TWS‑наушники
0
13 февраля
Новости
Устройства
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
Как сделать парное фото на 14 февраля с кем угодно: 20 промптов
0
13 февраля
Ликбез
Технологии
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
В Сети вирусится бой Тома Круза и Брэда Питта — это ролик нейросети Seedance 2.0, удивившей даже кинематографистов
0
13 февраля
Новости
Технологии
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
В пару кликов: как удалить тяжёлые письма в Gmail и освободить место на «Google Диске»
0
12 февраля
Технологии
Технологии
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
Xiaomi выпустила бюджетный аналог AirTag, который работает с сетями Apple и Google
0
12 февраля
Новости
Устройства
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
«Белый список» сайтов и приложений в России: что в него входит и как пользоваться
0
12 февраля
Ликбез
Технологии

Новые комментарии

Аватар автора комментария
Viktor Surko9 минут назад

0 / 0

Фигня полнейшая, получились просто мягки бананы
Банановые чипсы в духовке
Аватар автора комментария
всем нам кирдык, и вам тоже35 минут назад

0 / 0

Вики говорит, что четвёртый и последний сезон ожидается в 2028-ом.
У третьего сезона «Дом Дракона» появилось окно релиза — скоро выйдет тизер
Аватар автора комментария
Ivan F3 часа назад

0 / 0

да, у Яндекса были права на бренд Убер до 2026 года
«Яндекс» анонсировал Fasten — приложение для вызова такси без лишних сервисов
Аватар автора комментария
Ivan F3 часа назад

0 / 0

ну в Убер Раша поездки, в среднем, на 100-150р дешевле, чем в Го. а это просто ребрендинг Убер Раши
«Яндекс» анонсировал Fasten — приложение для вызова такси без лишних сервисов
Что такое «Велгия» и «Велгия Эко» и как они работают

Что такое «Велгия» и «Велгия Эко» и как они работают

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях