Что нужно знать о технологии распознавания лиц

Как эта технология используется государствами и бизнесом, можно ли обмануть камеру с системой идентификации лиц и получится ли найти человека в интернете по фото.

Заур Абуталимов
Директор по продуктам сервиса облачного видеонаблюдения и видеоаналитики для бизнеса Ivideon.
Елена Глазкова
Маркетолог Ivideon.

Для государства распознавание лиц — важная часть системы безопасности и внушительная статья бюджета. Для журналистов — либо панацея, либо орудие мирового заговора. Для бизнеса — инструмент или продукт. Чью сторону ни прими, базовые вопросы всё равно остаются. Ответы на них пользователи привычно ищут в интернете (в среднем 28 704 запроса по тематике face recognition в месяц), но обнаруживают далеко не всегда. Исправляем ситуацию.

Что же такое распознавание лиц

Отделим мух от котлет. Пользователи чаще сталкиваются с распознаванием лиц в собственных смартфонах, где биометрическая идентификация применяется, чтобы разблокировать устройство и получить доступ к данным мог только его владелец. В процессе распознавания обязательно участвует 3D-камера, чтобы невозможно было обмануть гаджет фотографией.

Ещё существует идентификация лиц в реальном времени и реальных же условиях: в этом случае она неразрывно связана с системами видеонаблюдения, где лица буквально «выхватываются» из снимаемого камерами видеопотока.

Представим себе качественную современную камеру видеонаблюдения, размещённую чуть выше среднего человеческого роста в хорошо освещённом месте. Перед ней каждый день проходит примерно одинаковое количество примерно одних и тех же людей. Двигаются они не очень быстро.

Снятое видео может храниться в облачном архиве. К камере подключается аналитический модуль: сложное сочетание алгоритмов (искусственный интеллект, нейросети, вот это всё) плюс пользовательский интерфейс. Модуль «выхватывает» лица из видеопотока, определяет пол и возраст и заносит данные в базу.

Постепенно изображений становится больше. Система запоминает все распознанные лица автоматически и заносит их в архив, а пользователь с допуском указывает дополнительные данные: имя, должность, статус, прочие отметки («VIP-гость» или «вор»). Можно загрузить фото нужной персоны, а модуль найдёт в архиве все детекции этого лица.

Как только человек с отметкой вновь проходит перед камерой, система фиксирует это как важное событие и отправляет push-уведомление заинтересованным пользователям.

Детекция в контексте распознавания лиц — это ситуация, когда алгоритм в принципе понял, что перед ним лицо, а не яблоко или русалка с кружки Starbucks. Вычислительные мощности ему сначала требуются для этого, и только затем он может сопоставить лицо с базой или запомнить.

Иногда детекция может удивить

Если вы дочитали предыдущие несколько абзацев до конца, поздравляю, теперь вы знаете, как работает распознавание лиц в идеальной ситуации. Описание подходит к любой системе: от тех, которые используются в московском метро, до решений для малого бизнеса.

Главное, что нужно понимать: идеальную ситуацию в реальной жизни создать сложно, особенно если речь идёт о целом городе, а не офисе или магазине. Скажем, в метро людей много, все разные, ходят быстро. Камер нужно очень много, они стоят денег, размещать их должны грамотные специалисты.

Можно ли обмануть алгоритм распознавания лиц

Несмотря на случающиеся промахи, точность машинного распознавания уже нередко превосходит ту, с какой определяют лица люди. В Китае скоро система, способная найти конкретного человека среди 1,3 миллиарда других жителей за 3 секунды с точностью 90%.

И всё же однозначно на этот вопрос ответить сложно, потому что единственного идеального алгоритма распознавания лиц не существует. Большие очки, наклеенная борода, кепка, высокая скорость перемещения, специальный макияж (например, нарисованная на лице ) — всё это способно запутать алгоритм. Особенно в совокупности, потому что для распознавания бывает 70% открытого лица.  А теперь представьте, что использовать вышеперечисленные ухищрения необходимо в условиях реального города. Звучит не так уж просто, верно?

Возможно ли распознавание лиц онлайн

Интернет — место парадоксальное: люди здесь одновременно могут беспокоиться о том, не определяет ли каждая вторая камера на улице их личность, и искренне хотеть «распознавать лица других людей по фотографии онлайн». Рассмотрим это направление face recognition отдельно.

Программа распознавания лиц — это либо описанный выше аналитический модуль (камера видеонаблюдения + софт  + облачное хранилище), либо софт, аналогичный известному (слегка скандально) сервису FindFace. Сегодня скачать программу распознавания лиц «бесплатно и без регистрации» в подавляющем большинстве случаев, понятное дело, невозможно.

Веб-сервис FindFace.ru, помогающий найти людей в социальной сети «ВКонтакте» по их фотографии, был основан 18 февраля 2016 года. Помимо прочего, благодаря ему все желающие могли находить профили девушек, снимавшихся в порнофильмах. Очень скоро сервис стал использоваться для множества флешмобов по обнаружению лиц, которые имели полное право никогда и никем обнаруженными не быть. Разразился скандал, сработавший как вирусная реклама: технология, которая легла в основу сервиса, получила ряд престижных наград и вызвала интерес заказчиков со стороны государства и бизнеса. С 1 сентября 2018 года сервис более не услуги поиска людей по фотографии, так как он был преобразован компанией NtechLab в линейку решений для различных отраслей бизнеса.

Мечта пользователя, который вводит запрос, очевидно, выглядит так: заходишь на сайт, загружаешь фото человека, снятого украдкой в метро, программа распознаёт лицо и выдаёт ссылку на профиль в соцсети. Ага, попался! Или же так: загружаешь программу на компьютер, подключаешь к ней веб-камеру и распознаёшь мордочку своего кота. Успех — теперь тебе будет приходить уведомление каждый раз, когда кот ворует сосиски.

Реальность жестока. Первый же сайт, который предлагает вам подобное, отказывается работать, а второй — требует навыков программирования на Python. Более-менее похожее на мечту приложение называлось SearchFace, которое недавно под названием FindClone. Вы загружали фотографию, а алгоритм пытался распознать это же лицо в базе социальной сети «ВКонтакте». Ссылок на профиль приложение не выдавало, только сами снимки — причём неважно, кем они были загружены. Если пользователь давно активен в соцсети, выдача фото создавала жутковатый «биографический» эффект, если же нет, распознанные изображения могли рассмешить.

Иногда SearchFace работал вот так

Собственно, пример SearchFace наглядно отвечает на вопрос «Как социальные сети используют распознавание лиц?». Точнее было бы cформулировать его таким образом: «Как социальные сети используются для распознавания лиц?» Ответ прост: как база данных. Неисчислимое количество уникальных сочетаний цифр (а именно так для алгоритмов Facebook*, «ВКонтакте» и остальных выглядят лица на фото) формирует базу для обучения нейросетей, которые ложатся в основу того или иного решения face recognition.

Решения все разные, и нейросети разные тоже, а детали и технические особенности заказчики и поставщики сервисов, как правило, не разглашают. В частности, пол и возраст модуль распознавания умеет определять благодаря тому, что может учиться на информации, содержащейся в «Одноклассниках», «ВКонтакте», Instagram* и Facebook*.

Как программируется распознавание лиц

Никогда не надо отвечать на вопросы разработчиков и для разработчиков, если ты не разработчик. Поэтому за помощью мы обратились к специалисту.

Дмитрий Сошников
Член Российской ассоциации искусственного интеллекта и старший эксперт по разработке систем ИИ и машинного обучения Microsoft.

Распознавание лиц (а также другие связанные операции) — это достаточно типовая задача. Поэтому многие компании предоставляют готовые сервисы в виде облачных API (программных посредников между приложениями) для качественного решения этих задач. Кроме IT-гигантов вроде Microsoft и Google, распознаванием лиц занимаются также специализированные компании, в том числе российские. Их продукты стремительно развиваются и предоставляют ещё более интересные функции, такие как идентификация лиц и силуэтов в толпе.

Самому с нуля натренировать нейронную сеть намного сложнее. Нужен большой и качественный набор исходных данных, то есть десятки и сотни тысяч (а лучше ещё больше!) фотографий людей. Кроме того, понадобятся существенные вычислительные ресурсы и знания в области ИИ и машинного обучения. Крупные компании располагают всеми этими средствами, поэтому решают задачу намного лучше.

Также существует промежуточное решение — использовать уже натренированную нейросеть, например OpenFace. Такой вариант, скорее всего, будет работать чуть хуже, чем готовый облачный сервис, однако позволит иметь полный контроль над системой. При этом потребуется определённый уровень понимания работы нейросетей и нейросетевых фреймворков и, по всей видимости, некоторое знание языка Python, который завоевал популярность как основной язык программирования среди специалистов Data Science.

Действительно, на нём удобно проводить различные эксперименты, визуализировать данные и производить эффективные матричные вычисления благодаря прекрасному пакету NumPy. Это не самый лучший язык для промышленной разработки, поскольку он не содержит эффективных средств для создания больших безопасных программных систем, однако альтернатив ему в области обучения глубоких нейросетей пока нет.

Как работает распознавание лиц в бизнесе

Востребованность face recognition в финтехе, ретейле и других видах бизнеса напрямую связана с повышением доступности технологии. Механика проста: на всех предприятиях и во всех организациях стоят камеры видеонаблюдения, которые используются как инструменты для сбора данных и последующей аналитики. В мире системы наблюдения снимают за месяц терабайты видео в формате Full HD, то есть информации для обработки накапливается действительно много.

Необходимое ПО для анализа данных может «прошиваться» на устройство производителем. Камеры с видеоаналитикой «на борту» стоят обычно довольно дорого.

Альтернативный вариант — аналитика в облаке, то есть удалённом дата-центре, которая подключается к любой недорогой камере. Это на порядок дешевле плюс даёт гибкость — можно адаптировать решения под конкретный бизнес.

Популярность технологии распознавания лиц в разных сферах деятельности возрастает. К примеру, Сбербанк — один из лидеров в части анонсирования различных громких проектов face recognition, и с ним в этом плане может разве что «Тинькофф». В 2017 году Сбербанк 25,07% компании VisionLabs, создающей софт для распознавания лиц. За 2018 год финансовое учреждение успело протестировать face recognition в московском метро и даже 42 преступника, банкоматы с идентификацией лиц, чтобы злоумышленники не могли снимать деньги с чужих карт, а также объявить сбор биометрических данных (аудиозапись голоса, видеозапись лица) клиентов. В апреле этого года Сбербанк получил контроль над разработчиком систем распознавания голоса и лиц — «Центром речевых технологий» (ЦРТ).

Другое дело, что анонсировать, тестировать, пилотировать и покупать решения — не значит собственно внедрять. Что именно сейчас реально используется в Сбербанке (и используется ли), сказать с уверенностью на самом деле может только Герман Греф.

С розничной торговлей всё прозрачней. По сути, здесь есть три проблемы, которые распознавание лиц решает.

Во-первых, воровство. В магазинах орудуют мошенники, причём нередко одни и те же люди в одной и той же сети. Face recognition позволяет определять «дрейфующих воришек» и других людей, ранее нарушавших порядок. Как только однажды занесённый в базу нарушитель зайдёт в магазин, охрана получит уведомление в мессенджере или другим удобным способом.

Во-вторых, трудность работы с постоянными клиентами. Данных о покупках и днях рождения, чтобы персонализировать предложения для VIP-клиентов и фанатов бренда, попросту не хватает. Распознавание лиц можно интегрировать с CRM — то есть софтом, в который менеджеры заносят всю информацию по всем сделкам организации. В случаях с ворами и VIP распознавание лиц работает примерно одинаково: лицо заносится в чёрный или белый список, и при его повторном появлении система просигналит человеку с доступом. Пол и возраст определяются автоматически, а дополнительную информацию добавит ответственный сотрудник.

В-третьих, идентификация лиц в ретейле используется для таргетированной рекламы. К примеру, в некоторых магазинах X5 Retail Group камеры для распознавания выражения лица и возраста покупателей. Анализируя эти данные, система выводит на экран монитора в торговом зале товары, которые могут понравиться человеку. Ещё живая иллюстрация — кейс Lolli & Pops, большого кондитерского магазина в США. Система face recognition постоянных покупателей и посылает на их смартфоны уведомления с товарами, которые могут им понравиться (с учётом индивидуальных предпочтений и даже аллергии на продукты).

Ещё один яркий пример использования технологии в ретейле — магазины без продавцов и касс. Например, Alibaba Tao — это кафе и магазин самообслуживания, расположенный в Ханчжоу. Здесь продаются напитки, закуски, продукты, игрушки, рюкзаки и тому подобное. Tao Cafe открыт только для пользователей сайта Taobao.

Tao Cafe / syncedreview.com

При покупке напитков система камер с поддержкой распознавания лиц автоматически идентифицирует клиента, связывается с его аккаунтом в интернет-магазине и обрабатывает платёж. Покупатели выходят через помещение, оборудованное несколькими датчиками, которые идентифицируют как клиента, так и товары. Сканирование работает, даже если человек положил покупку в карман или сумку.

Как развивается технология распознавания лиц

Системы видеонаблюдения с идентификацией лиц действительно захватывают мир. В Москве количество камер в 2019 году 174 тысяч. Это вовсе не значит, что все эти устройства по умолчанию могут распознавать личность: чаще всего о 160 тысячах камер с этой функцией. Тем не менее в конце 2018-го московская мэрия заявляла о заменить все устройства видеонаблюдения и сформировать полностью инновационную систему в следующем году.

Парадокс в том, что 160 тысяч — это не так уж и много. Особенно если сравнивать с другим лидером запросов поисковиков по тематике распознавания лиц — Китаем. Там в конце 2017 года более 170 миллионов камер видеонаблюдения и за три ближайших года подключить к сети еще около 400 миллионов.

Грамотное и корректное использование face recognition работает в первую очередь на повышение безопасности и комфорта. Люди обычно быстро проникаются доверием к технологиям, которые избавляют их от очередей на футбольный матч (улыбнулся камере — прошёл), предотвращают воровство и хулиганство или помогают меньше тратить на покупки (программы лояльности). Всё это, понятное дело, требует определённого регулирования — именно для этого принимаются законы о защите персональных данных.

В будущем, вероятно, сфера распознавание лиц в системах видеонаблюдения будет регулироваться аналогично текущей практике работы с идентификацией лиц в интернете. Стремящиеся к конфиденциальности люди просто не загружают в Сеть лишнего — частичное фиаско сервиса SearchFace доказывает, что такая стратегия эффективна.

Конечно, нельзя бесконечно ограничивать себя в прогулках по улицам, где камеры установлены на каждом перекрестке, однако возможность сохранить анонимность сформируется, если будет соответствующий запрос от общества.

*Деятельность Meta Platforms Inc. и принадлежащих ей социальных сетей Facebook и Instagram запрещена на территории РФ.

Это упрощённая версия страницы.

Читать полную версию
Над текстом работали: Елена Глазкова
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Александр Филиппов
15.08.19 06:08
Зашел узнать как работает распознавание лиц, в итоге целая статья воды и ничего полезного(
Victor Garmashov
15.08.19 09:30
А что именно по этому вопросу вы хотели узнать? Именно принцип того, как распознается лицо? Пишутся специальные программы, которые распознают лица с помощью определенного алгоритма(их существует множество). Дальше уже тема программирования. Не думаю, что это вам интересно.
Александр Филиппов
15.08.19 10:56
| изменено
Это как в анекдоте Саня, ты же автомеханик. Помоги. У меня треск в двигателе после замены маслосъёмных колпачков. Помоги разобраться в причинах и какие могут быть последствия.– Причин может быть множество, а последствия могут быть разными.– Спасибо, Сань. Хотя бы простейшие принципы распознавания лиц, по каким ключевым точкам это происходит, как они строятся...
Andrei Tsarev
16.08.19 08:58
Однозначно! Где хоть одно слово о ТЕХНОЛОГИИ РАСПОЗНАВАНИЯ ЛИЦ?! Вода о том где и как это будут или уже применяют. Ух!!! Не люблю таких!