Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Технологии
17 сентября 2024

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Если вы всё ещё верите в них, самое время начать сомневаться.
Фото автора Артём Козориз
Артём Козориз

Автор Лайфхакера

К чёрту бенчмарки смартфонов: почему «‎попугаи» уже давно ничего не решают

Термин бенчмарк в широком понимании подразумевает специальный эталонный тест (англ. benchmark — эталон) для измерения эффективности различных систем и формирования шкалы оценки для их последующего сравнения. 

Сначала появились компьютерные бенчмарки, но с распространением смартфонов возникла необходимость и в мобильных аналогах. Одним из первых стал китайский AnTuTu, позже добавились «младшие» версии известных компьютерных тестов 3DMark, PCMark, Geekbench. Все они, помимо подробных сведений о смартфоне, позволяют оценить производительность процессора, видеочипа, памяти, накопителя, а также протестировать другие компоненты.

Результаты общих тестов обычно представлены в виде абстрактных баллов, которые иронично называют «попугаями» — с отсылкой к старому мультфильму, где удава измеряли в птицах, мартышках и слонах. 

Однако всё меньше пользователей и экспертов доверяют бенчмаркам. Сейчас они почти утратили свою актуальность, и вот почему.

Производительность смартфонов выровнялась

Развитие мобильных чипсетов привело к достижению так называемого порога достаточности, и теперь почти любые смартфоны обеспечивают необходимую производительность для повседневных задач вроде проверки социальных сетей, просмотра видео, работы с мессенджерами и браузером.

Как следствие, устройства одной ценовой категории работают плюс-минус одинаково быстро. Более того, даже между среднебюджетными смартфонами и флагманами разница в быстродействии почти незаметна для обычного человека. 

А если говорить о сравнении топовых устройств, то различия едва ли уловимы — производители давно упёрлись в тот предел мощности, когда последующее наращивание уже не даёт ощутимых изменений.

Бенчмарки не оценивают реальное быстродействие

Сравнение устройств в тестах AnTuTu
Сравнение устройств в тестах AnTuTu. Кадр: Versus / YouTube

Главная претензия к бенчмаркам — сугубо синтетические тесты, которые мало того что проводятся в идеальных условиях, так ещё и редко встречаются в реальной жизни. 

Например: работа процессора на максимальной частоте, кодирование видео или шифрование больших объёмов данных. В то время как более важные плавность интерфейса, скорость открытия приложений и взаимодействия с ними в режиме многозадачности искусственные сценарии не учитывают. Фоновые процессы, нагрев, микрофризы — всё это тоже игнорируется.

Баллы, которые мы видим в результатах бенчмарков, и есть пресловутые попугаи. Они почти полностью оторваны от реальности, а интерпретировать их для понимания фактической производительности довольно сложно, если не невозможно. Именно поэтому выбирать смартфон, ориентируясь на баллы в тестах, — худшее, что можно придумать.

Высокие оценки не гарантируют хороший пользовательский опыт

Информативность бенчмарков довольно сомнительна. Рекордные баллы создают иллюзию безупречного опыта использования, тогда как на деле всё может быть иначе, поскольку зависит от многих других факторов.

Ключевую роль играют оптимизация софта и удобство оболочек, которые в смартфонах каждого производителя различаются. Нередко устройство с меньшим количеством баллов приятнее и отзывчивее в работе. 

Кадр из презентации Xiaomi
Кадр из презентации Xiaomi, которая хвалится высочайшим результатом Redmi K60 Ultra в AnTuTu

Плавность работы измерить никак нельзя, поэтому производители, особенно китайские бренды, упорно продолжают хвастаться рекордами в AnTuTu прямо на презентации новинок — да ещё с фанфарами и звуковым эффектом взрыва. 

Тесты не учитывают производительность в реальной жизни

Существенный недостаток большинства бенчмарков в том, что процесс тестирования длится всего несколько минут и не отражает условий реальной эксплуатации. Бенчмарки выполняются на стерильных устройствах с пустым накопителем, без установленных приложений и фоновых процессов. 

Не учитывается не только нагрев при длительной работе, но и «замусоренность» памяти, падение производительности под влиянием постоянной активности сервисов Google и китайских аналогов, а также естественная деградация аккумулятора, способная влиять на производительность процессора.

Идеальные результаты, полученные единожды, не гарантируют такие же через несколько недель или месяцев, не говоря уже о более длинных дистанциях в 2–3 года.

То же самое относится и к автономности, которая важна не менее, чем быстродействие. Краткосрочные непрерывные тесты аккумуляторов совершенно не объективны, поскольку не учитывают индивидуальные привычки пользователей, разные режимы работы и постепенное химическое старение батареи.

Производители оптимизируют устройства под бенчмарки

Повальное увлечение тестами привело к тому, что бренды стали хитрить. Они добавляют алгоритмы, которые распознают запуск популярных бенчмарков и переключают смартфоны в режим максимального быстродействия для достижения лучших результатов любой ценой. В реальной жизни их, разумеется, никогда не будет.

В тестах временно повышается тактовая частота процессора, отключаются или снижаются температурные ограничения, а процесс бенчмарка получает максимальный приоритет перед системными или обычными приложениями. 

Ещё в 2013‑м Samsung уличили в оптимизации работы смартфона Galaxy S4 в тестах: они разблокировали недоступную в обычной жизни частоту графического процессора и улучшили тем самым результаты на 11%. Китайские компании давно переняли этот опыт.

Маркетологи тоже не гнушаются подтасовкой фактов. Часто в рекламных кампаниях используют лишь выгодные, громкие показатели, а не столь впечатляющие опускаются. Та же Apple на презентациях сопоставляет мощность новых устройств с абстрактными смартфонами «других производителей». Либо сравнивает свой флагман не с предыдущим, а со старшим на два-три поколения, чтобы показать прирост производительности в три, а то и в пять раз.

Что дальше будет с бенчмарками

Вероятно, время безоговорочного доверия бенчмаркам подходит к концу. И хотя тесты по-прежнему дают определённую информацию о технических характеристиках, очевидно, что они не способны спрогнозировать реальный пользовательский опыт.

Проверка скорости последовательного запуска  приложений на двух смартфонах
Пример с куда более полезным тестом, где проверяется скорость последовательного запуска различных приложений на двух смартфонах. Кадр из видео PhoneBuff / YouTube 

Гораздо релевантнее становятся полноценные тесты в разных сценариях повседневной эксплуатации на протяжении недель и месяцев, которые проводят техноблогеры, а также отзывы реальных владельцев. В отрыве от этого бенчмарки не значат почти ничего. Только комплексный подход позволит оценить возможности смартфона.

А как вы относитесь к бенчмаркам? Расскажите в комментариях!

Что ещё почитать про смартфоны
📲
Журналисты сравнили камеры свежего Pixel 9 и прошлогоднего iPhone 15 Pro Max
8 причин, почему Xiaomi уже не топ
Автономность Google Pixel 9 и 9 Pro XL сравнили с iPhone 15 Pro Max и другими флагманами
15 крутых бюджетных смартфонов, которые не разочаруют
Какой iPhone купить в 2025 году: топ-7 моделей
Обложка: Лайфхакер
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

10 гаджетов, чтобы не упахиваться во время генеральной уборки

10 гаджетов, чтобы не упахиваться во время генеральной уборки

Внешний аккумулятор от Nitecore

Надо брать: неубиваемый внешний аккумулятор от Nitecore

Новинка от Roborock: робот-пылесос для тщательной уборки со скидкой 53%

Новинка от Roborock: робот-пылесос для тщательной уборки со скидкой 53%

Со скидкой 59% можно купить наушники от Edifier сейчас на AliExpress

Со скидкой 59% можно купить наушники от Edifier сейчас на AliExpress

Автоматическая кофемашина от DeLonghi 

Надо брать: автоматическая кофемашина от DeLonghi со скидкой 23%

Nahodki AliExpress: samye interesnye i poleznye tovary nedeli

Находки AliExpress: самые интересные и полезные товары недели

15 товаров с AliExpress для тех, кому надоел интерьер дома

15 товаров с AliExpress для тех, кому надоел интерьер дома

Надо брать: демисезонные кроссовки от Baasploa со скидкой 69%

Надо брать: демисезонные кроссовки от Baasploa со скидкой 69%

Это интересно
Как найти покупателей без помощи социальных сетей

Как найти покупателей без помощи социальных сетей

321 проект и 3,1 млрд рублей: как прошёл первый год работы Президентского фонда природы

321 проект и 3,1 млрд рублей: как прошёл первый год работы Президентского фонда природы

Семейная ипотека — 2026: как изменились правила получения льготного кредита

Семейная ипотека — 2026: как изменились правила получения льготного кредита

Куда поехать за классным сувениром: 7 точек Золотого кольца с удивительными народными промыслами

Куда поехать за классным сувениром: 7 точек Золотого кольца с удивительными народными промыслами

Комментарии
Denis Kotov
17.09.24 18:15
Интересно, есть какой нить тест, как быстро устройство работает с PDF, по работе постоянно надо.
Timoteo Cirkla
18.09.24 01:20
Вообще-то решают.
Alexandr Al
18.09.24 03:42
Примерно тоже самое писалось лет 20 назад про тесты компьютеров. Результаты мы видим - бенчмарки и тесты отлично продолжают существовать, и они всё решают. Со смартфонами всё соже самое. Любой, кто возьмет аппараты, отличающиеся по бенчмаркам в 2-3 раза, сразу почувствует разницу. Собственно любой это может проверить, взяв свой старый телефон.
Виктор Подволоцкий
18.09.24 09:19
Ну 2-3 раза это как правило большая разница в цене. Здесь скорее поинт в сравнении аналогов, когда именно на бенчмарки ориентируются.
Алексей Михайлов
18.09.24 07:07
А что тут думать? Одна из метрик. У автомобиля та же история. Помимо максимальной скорости есть разгон до сотни, есть торможение с 80 км/час.
Артём Козориз
18.09.24 16:19
Верно подмечено, что одна из, согласен. А так аналогия с авто тоже хорошо подходит — по времени разгона до 100 км/ч не совсем правильно выбирать машину, вернее совсем не правильно, мягко говоря.
Алексей Михайлов
18.09.24 18:22
Тем более что "попугаи" это не "разгон до сотни", а "максимальная скорость". Ещё более бесполезная метрика в мире авто.
Давлет В.
18.09.24 15:45
Лучше б стабильный компас сделали
axcap
19.09.24 10:15
Спасибо автору за статью. Хорошо написана, понятная подача. Всё объяснил тем, кто так рьяно пытается доказать, что попугаи объективно что-то решают. Это как бег на дальнюю дистанцию, когда первые пару сотен метров все бегут +/- одинаково быстро, но продолжать бежать в том же темпе может уже не каждый.
Что вы могли пропустить
Looking Glass представила фоторамку, превращающую любые изображения в голограммы
Looking Glass представила фоторамку, превращающую любые изображения в голограммы
0
Вчера
Новости
Устройства
Кризис памяти ударит по экранам iPhone 18 Pro и смартфонов на Android
Кризис памяти ударит по экранам iPhone 18 Pro и смартфонов на Android
0
Вчера
Новости
Устройства
В пару кликов: как загрузить любые свои треки в «Яндекс Музыку»
В пару кликов: как загрузить любые свои треки в «Яндекс Музыку»
0
Вчера
Технологии
Технологии
Xiaomi раскрыла график выхода HyperOS 3.1 — обновление получат 56 устройств
Xiaomi раскрыла график выхода HyperOS 3.1 — обновление получат 56 устройств
0
Вчера
Android
Новости
iRobot представила компактный робот‑пылесос Roomba Mini — он как игрушечный
iRobot представила компактный робот‑пылесос Roomba Mini — он как игрушечный
0
Вчера
Новости
Устройства
«Mac для масс»: крупные СМИ расхвалили бюджетный MacBook Neo в первых рецензиях
«Mac для масс»: крупные СМИ расхвалили бюджетный MacBook Neo в первых рецензиях
0
Вчера
Новости
Устройства
Как проверить, не написал ли текст ИИ, и есть ли в этом смысл
Как проверить, не написал ли текст ИИ, и есть ли в этом смысл
0
Вчера
Ликбез
Технологии
В Photoshop появился ИИ-помощник, который сам редактирует изображения
В Photoshop появился ИИ-помощник, который сам редактирует изображения
0
Вчера
Новости
Технологии
В ChatGPT появился Shazam: бот теперь умеет определять и находить песни
В ChatGPT появился Shazam: бот теперь умеет определять и находить песни
0
10 марта
Новости
Технологии
11 программ для диагностики компьютера, которые должны быть под рукой
11 программ для диагностики компьютера, которые должны быть под рукой
0
10 марта
Технологии
Технологии
От ChatGPT до GigaChat: названы 100 лучших ИИ-сервисов в мире
От ChatGPT до GigaChat: названы 100 лучших ИИ-сервисов в мире
0
10 марта
Новости
Технологии
Технология красоты: 3 продвинутых гаджета Dreame для ухода за собой, которые по-настоящему удивят
Технология красоты: 3 продвинутых гаджета Dreame для ухода за собой, которые по-настоящему удивят
10 марта
Устройства
Устройства
18 бесплатных видеоредакторов для компьютера и смартфона
18 бесплатных видеоредакторов для компьютера и смартфона
0
10 марта
Ликбез
Технологии
«Матрица для мухи»: учёные воссоздали мозг дрозофилы и подключили к виртуальному телу в симуляции
«Матрица для мухи»: учёные воссоздали мозг дрозофилы и подключили к виртуальному телу в симуляции
0
10 марта
Новости
Технологии
iPhone Ultra и не только: Apple готовит линейку устройств сверхпремиального уровня
iPhone Ultra и не только: Apple готовит линейку устройств сверхпремиального уровня
0
10 марта
Новости
Устройства

Новые комментарии

Аватар автора комментария
Che Gue XXV1 час назад

0 / 0

В этом году какой-то странный Оскар. Как-то привычно, что на нем побеждает проходняк, но обычно в номинациях есть сильные работы. А в этот раз весь список номинантов сплошной проходняк, все сильные ленты года проигнорированы. Из списка фильмов в статье видел 4 работы и еще 2 в планах. Из виденного откровенно не понравился только Микки-17, как фантастика слабая, как комедия тупая, как сатира пресная. Орудия хоррор не без изъянов, но точно более достоин номинации, чем Грешники, Новая волна отличная производственная комедия, хоть и не всем зайдёт. Метод исключения на данный момент персональный фаворит года, кинематографически немного слабее Паразитов, но с куда более неоднозначной моралью и не такой прямолинейный.
9 фильмов, которые не номинировали на «Оскар-2026», и совершенно зря
Аватар автора комментария
Ersten2 часа назад

0 / 0

Какой же бред написан...
Правда ли девушки из полных семей — лучшие жёны
Аватар автора комментария
Ivan Kireev3 часа назад

0 / 0

Несмотря на множественные обсуждения и жаркие дискуссии относительно ролевых игр БДСМ, "воз и ныне там!" Иными словами, категория граждан, считающая это увлечение ... Дурью, вряд ли изменит своё мнение. Противоположная сторона, т.н. "тематики" представляют противоположный лагерь и считают БДСМ, своим жизненным выбором. Хорошо ли это, или нет. Как известно, человеческая душа - "потёмки", поэтому, мы вряд ли, когда-нибудь, доберёмся до истины. Тем более, что у каждого, своя правда. Все остальные нюансы, относятся к области психиатрии и уголовного кодекса!
Кто и зачем практикует БДСМ
Аватар автора комментария
BVGf6 часов назад

0 / 0

И Mi 6 хоть и старичок, но оказался вполне живучим и до сих пор тянет многие приложения не ограниченные версией андроид. А его внезапным и приятным плюсом оказалась поддержка старых приложений и игр с 4PDA
Xiaomi раскрыла график выхода HyperOS 3.1 — обновление получат 56 устройств
Подарки, которые сближают: 5 товаров с распродажи Авито для второй половинки  

Подарки, которые сближают: 5 товаров с распродажи Авито для второй половинки  

Реклама
Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях