Телевизоры. Приставки. Проекторы и аксессуары. Технологии. Цифровое ТВ

Как работает технология распознавания лиц в смартфоне? Как будет выглядеть будущее с распознаванием лиц. Общественные организации США против распознавания лиц

Мировой рынок распознавания лиц вырастет с 4,05 млрд. долларов в 2017 году до 7,76 млрд. долларов США к 2022 году .




Как работает система распознавания лиц?

В принципе, система распознавания лиц может быть описана как процесс сопоставления лиц, попавших в объектив камеры с базой данных ранее сохраненных и идентифицированных изображений лиц эталонов.
По структурной реализации системы распознавания лиц можно выделить три распространенные схемы.

Анализ видеопотока на сервере

Наиболее распространенная схема реализации - IP-камера передает видеопоток на сервер, на сервере специализированное программное обеспечение для выполняет анализ видеопотока и сравнение полученных из видеопотока изображений лиц, с базой лиц эталонов.

Недостатками такой схемы будут, высокая нагрузка на сеть, высокая стоимость сервера, даже к самому мощному серверу можно подключить ограниченное количество IP-камер, т.е. чем больше система тем больше серверов.
Преимуществом является возможность использовать уже существующую систему видеонаблюдения.

Анализ видеопотока на IP-камере

В данном случае анализ изображения будет производится на самой камере, а на сервер будут передаваться обработанные метаданные.

Недостатки - нужны специальные камеры, выбор которых в данный момент крайне мал, стоимость камер выше чем обычных. Также в системах разных производителей будет по разному решаться вопрос хранения и размера базы данных распознанных лиц эталонов, а также вопросов взаимодействия софта на камере и софта на сервере.
Преимущества - подключение практически неограниченного количества камер к одному серверу

Анализ видеопотока на устройстве контроля доступа

В отличии от первых двух схем где используются IP-камеры, в данном случае камера встроена в устройство контроля доступа, которое кроме распознавания лица которое естественно происходит на устройстве, выполняет функции управления доступом как правило через турникет или электрозамок установленный на дверь. База данных лиц эталонов хранится на устройстве, и как правило уже не в виде фотоизображений.

Недостатки - как правило все такие устройства выпускаются для использования в помещениях.
Преимущества - низкая стоимость систем по сравнению с системами видеонаблюдения используемыми для распознавания лиц.

В любом случае успех реализации проектов по распознаванию лиц зависит от трех важных факторов:
Алгоритм распознавания
Базы данных распознанных лиц (эталонов)
Быстродействие алгоритма

Технология распознавания лиц

Как правило система состоит из камеры видеонаблюдения и программного обеспечения которое выполняет анализ изображений. Программное обеспечение для распознавания лиц основано на обработке изображений и вычислениях сложных математических алгоритмов, которые требуют более мощный сервер, чем обычно требуется для систем видеонаблюдения.

Нас будет в первую очередь интересовать качественные показатели программного обеспечения. Во вторую, какие серверные мощности понадобятся для анализа изображения и обработки базы данных с изображениями, ну и в третьи мы рассмотрим вопрос применимости IP-камер для целей распознавания лиц. Отдельного внимания заслуживают так называемые «stand alone» устройства, которые выполняют обработку изображений непосредственно на самом устройстве а не на сервере, также на таких устройствах может быть в память база данных лиц эталонов.


2D-распознавание лиц
В основе технологии 2D (двумерного) распознавания лиц, лежат плоские двухмерные изображения. Алгоритмы распознавания лиц используют: антропометрические параметры лица, графы - модели лиц или эластичные 2D-модели лиц, а также изображения с лицами представленные некоторым набором физических или математических признаков. Рейтинг популярности алгоритмов распознавания лиц мы рассмотрим ниже.

Распознавание 2D изображений одна из наиболее востребованных технологий на данный момент. Так как основные базы данных идентифицированных лиц накопленные в мире - именно двухмерные. И основное оборудование, уже установленное, по всему миру тоже 2D - по данным на 2016 год - 350 миллионов камер видеонаблюдения. Собственно поэтому основной спрос приходится именно на 2D системы распознавания лиц.

А спрос как известно стимулирует предложение, заставляя разработчиков максимизировать усилия на совершенствовании именно 2D технологии. Эти усилия приносят иногда неожиданно интересные результаты, например в виде создания трехмерной модели лица на основе 2D изображения. Исследователи из университетов Ноттингема и Кингстона представили проект по 3D-реконструкции лиц на основе одного одного единственного изображения. Нейросеть, через которую пропустили множество объёмных 3D-моделей людей и обычных портретов воссоздает объемные лица людей на основе всего одного двумерного изображения лица.




Преимущества
Огромным преимуществом 2D распознавания лиц является наличие готовых баз данных лиц эталонов, и готовой инфраструктуры. Максимальный спрос придется именно на этот сегмент, а спрос будет стимулировать разработчиков совершенствовать технологии.

Недостатки
Более высокие коэффициенты ошибок FAR и FRR по сравнению с 3D распознаванием лиц.

3D-распознавание лиц
3D распознавание (Three-dimensional face recognition - англ.) производится как правило по реконструированным трехмерным образам. Технология 3D распознавания лиц имеет более высокие качественные характеристики. Хотя конечно и она не является идеальной.

Существует несколько разнообразных технологиях 3D сканирования. Это могут быть лазерные сканеры с оценкой дальности от сканера до элементов поверхности объекта, специальные сканеры со структурированной подсветкой поверхности объекта и математической обработкой изгибов полос, либо это могут быть сканеры, обрабатывающие фотограмметрическим методом синхронные стереопары изображений лиц.

Одним из наиболее исследованных потребителями и экспертами 3D сканеров является знаменитый Face ID, от компании Apple. Опыт использования Face ID крайне интересен и показателен, потому что по сути это единственное устройство с технологией 3D распознавания лиц выпущенное на масс маркет, если конечно можно считать телефон за сотку устройством для масс маркета.

3D технология от Apple единственная в мире использует - вертикально-излучающие лазеры (VCSEL), по слухам суммарно потратив на разработку Face ID от 1,5 до 2 миллиардов долларов. Поставщиком VCSEL для Apple выступают две компании Finisar Corp (инвестиции Apple - 390 млн. долларов) и Lumentum Holdings . И судя по тому что другие 3D технологии, не показывают такой эффективности как Face ID, разблокировка по лицу на смартфонах на Android, появится не скоро.

Естественно с задачами идентификации близнецов Face ID не справляется, хотя этого никто и не ожидал, но даже с близкими родственниками случаются фейлы .
Ну и скорее комичный момент, но по началу Face ID не различал азиатов , но проблему настолько быстро пофиксили, что Apple даже не успели вчинить ни одного иска за расизм.

Преимущества 3D
Большая точность и меньшее количество ошибок пока недостижимое для 2D систем распознавания лиц.


Недостатки 3D
Достаточно легко подделать для профессионалов
Даже Face ID несмотря на всю крутость был взломан вьетнамской компанией Bkav сразу после поступления в продажу. Маска была создана с помощью 3D принтера. Себестоимость создания маски всего $150. Создание маски достаточно сложно для обычного человека, и ваша мама вряд ли сможет это повторить, но для профессионалов это как два пальца об асфальт.

Не используйте 3D распознавания лиц для защиты от несанкционированного доступа к ноутбукам, смартфонам, помещениям с особым уровнем секретности, все они могут быть с легкостью взломаны профессионалами.

3D распознавание требует специальных камер для сканирования, которые в несколько раз дороже обычных камер видеонаблюдения которые используется в 2D распознавании.
Отсутствие готовых баз данных идентифицированных лиц, по сравнению с 2D распознаванием
Распознавание близнецов, остается сложной задачей для алгоритмов распознавания лиц. В среднем в мире рождается 13.1 близнецов на 1000 новорожденных , и эта цифра сильно колеблется в зависимости от географического региона.

Распознавание лица по текстуре кожи лица
Изображения с высоким разрешением еще один фактор в совершенствовании технологии распознавания лиц, именно благодаря высокому разрешению стал возможен очень подробный анализ текстуры кожи.

При таком анализе определенная область кожи лица, может быть захвачена как изображение, а затем разбита на более мелкие блоки, которые превращаются в математические измеримые пространства, в которых записываются линии, поры и фактическая текстура кожи.

Технология может идентифицировать различия между близнецами, что пока невозможно использовать с помощью программного обеспечения для распознавания лиц». В случае объединения распознавание лица с анализом поверхностной текстуры, точность идентификация может сильно увеличиться.

Распознавание лица по тепловизионному изображению
Использование тепловизионных камер, для целей распознавания лиц на данный момент считается перспективным направлением для разработки, но готовых для внедрения коммерческих решений пока нет.


Технология достаточно перспективная так как позволяет нивелировать болевые точки 2D-распознавания.

Распознавания лиц в полной темноте и в условиях недостаточного освещения
Макияж, прическа, борода, шляпа, очки - не являются проблемой для тепловизионных камер
Позволяют распознавать близнецов


Можно выделить два направления, в которых ведется разработка:
Идентификация по заранее созданным термограммам идентифицированных лиц. Здесь проблемы те же что и с 3D-распознавание, готовых баз данных эталонов нет, оборудование дорогое.
Идентификация человека по изображениям полученным с тепловизионной камеры, а в качестве лиц эталонов используются база данных обычных двумерных изображений. Решается задача как вы наверное уже догадались использованием глубоких нейронных сетей.

Распознавание лиц по текстуре кожи и по тепловизионному изображению. работает, только в лаборатории, и то не идеально. Но мы внимательно наблюдаем, и если что сразу дадим вам знать.

Качество программного обеспечения

Существует несколько важных метрик для оценки качества программного обеспечения.

Наиболее важные из них FRR и FAR
False Reject Rate - FRR (Уровень ошибочных отказов) - вероятность того, что система не идентифицирует зарегистрированного пользователя или не подтверждает его подлинности.

Как рассчитывается FRR:
Пусть Nt - количество эталонов изображений в базе данных. FR - количество ложных нераспознаваний (False Reject - Иванов, не распознан как Иванов),

False Acceptance Rate - FAR (Уровень ошибочных подтверждений) - вероятность того, что система распознавания лиц ошибочно идентифицирует незарегистрированного пользователя или подтверждает его подлинность.

Как рассчитывается FAR:
Пусть Nt - количество эталонов изображений в базе данных. FA - количество ложных распознаваний (False Acceptation - Иванов распознан как Петров),

Первое и самое важное что вам нужно знать про эти два показателя, это то что они не абсолютные, а относительные, т.е. они могут меняться в зависимости от настроек алгоритма распознавания лиц.

Второе это то, что эти показатели взаимосвязаны - чем меньше FAR тем больше FRR.

Ориентировочные значения FRR и FAR для систем распознавания лиц и их взаимосвязь представлены в таблице:


Сравнение FAR и FRR различных методов биометрической идентификации:

Разработчики алгоритмов распознавания лиц

Алгоритм распознавания, это как правило не готовый программный продукт, а программный алгоритм который еще предстоит упаковать в программный продукт и в оборудование.

Производителей алгоритмов распознавания в мире достаточно много, благо есть независимые организации которые проводят тестирование эффективности алгоритмов. Самые известные: NIST - Национальный институт стандартов технологий США и MegaFace - Вашингтонский университет, Labeled Faces in the Wild , есть и другие. Результаты конкурсов постоянно обновляются. Любая компания в любой момент может обновить свой результат, заново пройдя тестирование. Еще недавно NtechLab заявила о себе как о победителе, а сегодня они лишь на 4 месте.

Мы опубликуем тестирование NIST с результатами на 13.05.2018. Так как NIST с моей точки зрения более интересен так как тестирование алгоритмов происходит на закрытой базе данных лиц, что исключает подготовку разработчика к тестированию.

  1. Алгоритм - megvii-000 от Megvii , Китай
    Китайская компания Megvii со своим основным продуктов Face++. По оценкам Коммерсанта оборот компании составил порядка $100 млн.
  2. Алгоритмы: 2 место - visionlabs-003, 7 место - visionlabs-002, VisionLabs , Россия
  3. Алгоритмы: 3 место - morpho-002, 17 место - morpho-000. OT-Morpho , Франция
    Первый тяжеловес, в рейтинге с оборотом почти 3 млрд. евро за 2017 год. Совместное предприятие Oberthur Technologies (OT) и Safran Identity & Security (Morpho)
  4. Алгоритмы: 4 место - ntechlab-003, 13 место - ntechlab-002 от NtechLab , Россия
    Московская компания, получившая известность как разработчик решения для поиска порно актеров .
    Получил инвестиции от «РТ – развитие бизнеса» («дочка» «Ростеха»), и фонда компании VB Partners. Сумма инвестиций не раскрывается. В результате «дочка» «Ростеха», получила 12,5% компании, фонд New Dimension Fund Variable Capital Investment, им управляет VB Partners, – 25% компании. NtechLab планирует выйти на рынок систем национальной безопасности и усилить развитие в коммерческом секторе.
  5. Алгоритм - cogent-000 от Gemalto Cogent , США
    Разрабатывает полный спектр биометрических решений с акцентом на правоохранительную деятельность, пограничный контроль и гражданскую идентификацию. Ежегодные глобальные продажи составляют около 205 миллионов долларов.
  6. Алгоритм - vocord-002 от Vocord , Россия
    Компания «Вокорд» основана в 1999 году выпускниками МФТИ Дмитрием Заварикиным и Алексеем Кадейшвили. По данным «СПАРК-Интерфакс», в 2014 году выручка компании составила 302 млн рублей, более свежих данных на момент написания статьи получить не удалось.
  7. Алгоритмы: - fdu-000, 9 место - fdu-001. Fudan University , Китай
  8. Алгоритм - neurotechnology-003. Neurotechnology , Литва
    С сайта компании можно скачать демо версию программного обеспечения для ПК и для смартфона на Android, демо версию SDK. У компании информативный канал на YouTube. Цены опубликованы на сайте. Так же компания предлагает собственный облачный сервис www.skybiometry.com
  9. Алгоритм - itmo-003. Университет ИТМО , Россия
  10. Алгоритм - 3divi-001. Тридиви (3DiVi Inc.) , Россия
  11. Алгоритм - yitu-000. Yitu Technologies , Китай
    Главный продукт Yitu - система распознавания лиц Dragonfly Eye, которую используют государственные системы безопасности в разных городах Китая. В первые три месяца использования системы в Шанхае с помощью Dragonfly Eye задержали 567 нарушителей закона. Система хранит 1,8 миллиарда фотографий, причём в базу попадают фото не только граждан Китая, но и всех туристов, пересекающих границу страны. Систему разворачивают и на массовых событиях: во время фестиваля пива в Циндао камеры помогли задержать 22 разыскиваемых. Власти на местах рапортуют об успехах : в одном городе система Yitu помогла сократить карманные кражи на 30%, в другом - за два года раскрыть 500 преступлений. Каким-то невероятным образом система даже помогла опознать жертву убийства по черепу спустя пять лет после преступления.
  12. Алгоритм - gorilla-000, Gorilla Technology , Тайвань
  13. Алгоритм - cyberextruder-002, CyberExtruder , США
  14. Алгоритм - tongyitrans-002, TongYi Transportation Technology , Китай
  15. Алгоритм - yisheng-001, Zhuhai Yisheng Electronics Technology , Китай

  16. Итого: 5 представителей из России, что не может не радовать, 5 от Китая, что даже не удивляет.

    На самом деле производителей алгоритмов распознавания гораздо больше, многих отсутствующих здесь вы можете найти в рейтинге MegaFace. Но если даже составить единый список, он все равно будет не полон. Почти все гиганты IT индустрии разрабатывают собственные алгоритмы распознавания лиц - Facebook, Google (считает свою систему распознавания самой точной), Baidu, Microsoft , Яндекс (тестирует авторизацию водителей по лицу и голосу), Вконтакте, Toshiba и многие другие.

    Существуют даже .

    Из всего это разнообразия, можно сделать несколько несложных выводов:

    Конкуренция на этом рынке будет усиливаться, ее следствием уже стало многократное снижение цен. Для примера - Macroscop еще в 2017 году снизил свои цены модуль распознавания в 18 раз, о чем радостно сообщают на своем же сайте, как бы передавая «большой привет» всем своим клиентам которым посчастливилось купить модуль распознавания до 2017 года.

    Очевидно что цены и дальше будут снижаться. Качественные показатели алгоритмов распознавания постоянно растут, и во многих случаях отличаются друг от друга незначительно, значительно же отличается цена, как вы сможете увидеть ниже, еще более значительно отличается быстродействие, естественно такой параметр как быстродействие нужно тестировать на базе данных максимального объема.

    Еще нетрудно заметить, что в рейтингах практически нет производителей оборудования для систем видеонаблюдения , а без видеокамер и устройств хранения, вся эта история с алгоритмами лишь игры на компьютере. Но то, что их нет, это не означает что они не видят этого рынка, и не понимают его значимость. Вот - распознавание лиц от Panasonic , от NEC , Amazon и многих других. В общем на этом рынке скоро станет очень жарко. Кроме софтверных решений (это когда непосредственно распознавание происходит на сервере), есть еще Stand Alone решения - это когда распознавание происходит на устройстве считывания.


    Программное обеспечение для распознавания лиц для систем видеонаблюдения

    Тестирование эффективности алгоритмов распознавания лиц это конечно интересно, как и любое соревнование, но больше похоже на выставку достижений народного хозяйства. Вроде впечатляет, но как конкретно начать использовать и сколько будет стоить непонятно. Результатом работы алгоритмов для распознавания лиц, будет совпадение или несовпадение с базой эталонов. А далее в зависимости от специфики вашей системы должно произойти заранее запрограммированное действие. Например при входе VIP клиента старший менеджер получает уведомление со всеми данными по клиенту из вашей базы данных.

    Или наоборот при входе человека из черного списка, уведомление получает охрана. Или при попытке прохода человека из черного списка через проходную, система контроля доступа блокирует проход - это уже интеграция системы распознавания лиц с системой контроля доступа.

    Работа системы распознавания лиц в реальных условиях это целый комплекс программно аппаратного взаимодействия. Для организации таких взаимодействий существует куча интегрированных платформ, позволяющей настраивать взаимодействия с системами контроля доступа, системами видеонаблюдения, охранными системами, системами пожарной безопасности, CRM системами, системами управления предприятием, и многими другими.

    Так если вам не шашечки, а везти, следующие пара разделов для вас просто «Must Have».
    Интеграционные платформы - громкое название, к перечисленным ниже разработчикам оно относится в разной степени, поэтому выбирая решения для распознавания лиц необходимо ознакомиться со всеми возможностями софта (платформы). Учитывая как текущие потребности предприятия, так и возможности развития, как качественные характеристики алгоритма распознавания лиц, так возможности интеграции.

    Разработчики программного обеспечения для системы распознавания лиц и цены на их модули

    ISS , Россия, Программное обеспечение «SecurOS® Face»


    Лицензия модуля захвата лиц - цена 41 275 рублей
    На канал. Устанавливается на сервере распознавания лиц или на сервере захвата лиц

    Лицензия модуля распознавания лиц (до 1000 чел. в базе) - цена 665 760 рублей.
    На сервер распознавания лиц.

    Сервера для программного обеспечения для целей распознавания лиц

    Распознавание лиц как и любая другая видеоаналитика задачи процессорно емкие, поэтому для развертывания даже небольшой системы распознавания лиц вам потребуется достаточно мощные и совсем не дешевые сервера. Характеристики сервера подбираются индивидуально и зависят от множества факторов - от количества каналов распознавания, до предполагаемого размера базы данных лиц эталонов, и длительности хранения видеоархива.

    Сервера для программного обеспечения систем распознавания лиц - цена от 101 567 рублей
    Выбор серверов не ограничивается представленными в этом каталоге, в большинстве случаев мы собираем сервер в зависимости от заявленных вами требований.


    Лучшие IP-камеры для распознавания лиц

    Программное обеспечение и сервера, мы рассмотрели выше, но чтобы система заработала, нужны IP-камеры. Именно от качественных характеристик камер будет сильно зависеть, то насколько качественно система будет работать система распознавания лиц.

    При выборе IP-камеры для распознавания лиц мы рекомендуем обращать внимание на следующие характеристики.

    WDR (Широкий динамический диапазон)
    Несмотря на то что последнее время появляются камеры с WDR за 5000 рублей, качество изображения таких камер сильно уступает камерам с из более высокого ценового сегмента. Камеры с лучшим WDR по нашему опыту не может стоить дешевле 80000 рублей.

    Частота кадров не менее 60 кадров с секунду
    Чем больше частота кадров в секунду тем больше вероятность того что вы получите снимок с наилучшей ориентацией лица человека относительно камеры, что напрямую будет влиять на качество распознавания лиц.

    Вариофокальный объектив
    Чем больше будет приходится пикселей на лицо человека, тем более будет изображение.

    Тесты показали, что для успешного распознавания лица требуется, чтобы лицо было представлено не менее 160 пикселями приходящимися на овал лица, и в идеале не менее 50 пикселей приходилось на расстояние между глазами. Как бы тщательно вы не выбирали месторасположение камеры, чтобы добиться этих значений ее придется подстраивать по месту в зависимости от множества факторов. Именно для этого вам и понадобится вариофокальный объектив.

    Камеры видеонаблюдения с установленными рекомендуемыми характеристиками для распознавания лиц - цена от 10 000 рублей

    Дальше как говорится, выбор за вами. Если вы строите систему распознавания с нуля, то стоит задуматься о выборе действительно лучших протестированных моделей IP-камер.


    Достаточно распространенный и недорогой функционал, как правило он всегда присутствует в основном программном обеспечении для распознавания лиц, но может и приобретаться отдельно. Если вы никогда в жизни не интересовались системами видеонаблюдения. Посмотрите видео там максимально коротко рассказано в чем суть.


    ITV , Россия, Программное обеспечение «Интеллект»
    Поиск лиц в архиве (за 1 видеоканал) - цена 6 200 рублей

    Trassir , Россия, Программное обеспечение «Trassir Face Search»
    Модуль поиска определенного лица в архиве Trassir Face Search - цена 36 990 рублей

    В том или ином виде данный функционал присутствует у большинства разработчиков, поэтому мы пожалуй не станем растягивать и без того ни короткую статью.


    Производители оборудования с интегрированными алгоритмами распознавания лиц

    Если раздел выше с разработчиками программного обеспечения это настоящее, т.е. именно там сосредоточены основные решения показывающее максимальную эффективность на данный момент. То этот раздел про будущее которое уже наступает.

    В первом случае видеопоток от камеры по сети передается на сервер с установленным софтом, и именно там происходит распознавание лиц, поток от одной IP-камер примерно равен 5 Мбит/с, и этот поток нужно передать по сети на сервер и там обработать. В случае с одной камерой все выглядит приемлемо, а если камер сотни - это проблема которую нужно отдельно решать. Решать ее можно в основном десятками серверов для обработки данных, любая видеоаналитика это процессорно емкая задача. Так что сервера будут немалой статьей расходов.

    Гораздо эффективнее произвести распознавание на борту устройства , а по сети передать уже обработанные результаты, что уменьшит нагрузку на сети и сервера на порядки.

    Кроме того что такие устройства уже есть, они уже показывают потрясающую эффективность и быстродействие. Все оборудование я бы поделил на две большие группы «Камеры видеонаблюдения со встроенным распознаванием лиц» и «Оборудование для систем контроля доступа со встроенным распознаванием лиц».

    Камеры видеонаблюдения со встроенным распознаванием лиц

    Умные камеры со встроенными алгоритмами распознавания лиц являются одним из самых передовых в отрасли. Они позволяют обрабатывать видеопоток на непосредственно на самой камере, а на сервер отправлять обработанные метаданные. 2Мп камера iDS-2CD8426G0/F-I c двумя объективами - цена 135 550 рублей

    HikVision , Китай, крупнейший китайский производитель систем видеонаблюдения.
    Матрица - 1/2.8’’ Progressive Scan CMOS
    Чувствительность - Цвет: 0.005 лк @ (F1.2, AGC ВКЛ), 0.0089 лк @ (F1.6, AGC ВКЛ), 0 лк с ИК
    Скорость электронного затвора - 1с ~ 1/100000с
    Разрешение 2МпАппаратный WDR 120дБ, частота кадров 25к/с@2Мп, слот для microSD до 128Гб, ИК-подсветка до 10м

    Камера для распознавания лица, с двумя объективами, представляет собой компактное устройство с алгоритмами глубокого обучения DeepinViewс системой распознавания лиц на борту.

    Камера поддерживает несколько кодеков сжатия видео (H.265, H.264, MPEG-4 и MJPEG) и может обрабатывать до пяти видеопотоков. Размер видеокамеры - 180,4 х 147 х 117,9 мм, вес устройства - 1500 грамм. Конструктивно представляет собой двухлинзовую камеру с бинокулярной стереофонической технологией, которая считывает большое количество характеристик лица для более точного распознавания.

    Она оснащена объективом с фиксированным фокусным расстоянием 4 мм, угол обзора равен 86°. Камера автоматически захватывает выбирает и выводит оптимальное изображение лица человека.

    Выполняет распознавание лиц, мгновенное сравнение захваченных лиц с библиотеками на борту, поддерживается настройка активации тревоги по идентифицированному лицу.

    HikVision заявляет о рабочих температурах в диапазоне от -10 °C до 40 °C и уровне влажности до 95 процентов.

    Камера автоматически переключается между режимами дневной и ночной съемки. Инфракрасная подсветка действует на расстояние до 10 метров.

    Видеорегистратор iDS-96128NXI-I16 с системой распознавания лиц - цена 3 299 990 рублей

    Запись видео с разрешением до 12Мп, Вывод видео с разрешением до 4K
    128 каналов, Синхронное воспроизведение 4 канала@4К
    16 SATA HDD до 10ТБ каждый
    1/2 аудио вход/выходов, 16/8 тревожных входов/выходов
    Сетевой интерфейс 4 RJ-45 10M/100M/1000M Ethernet

    Память видеорегистратора рассчитана на 16 библиотек снимков людей (всего до 100 000 фото)

    Видеорегистратор поддерживает Smart-функции по поиску похожих людей, анализу поведения, обнаружения лиц и автомобилей.
    Есть возможность работы с тепловизорами, обнаружение огня, морских судов, измерение температуры, ведение статистики камер тепловых карт и подсчета посетителей.
    iDS-96128NXI-I16 способен обнаруживать людей на 32 каналах, и моделировать лица со скоростью 64 фото в секунду.

    Регистратор имеет интерфейсы 1 RS-232, 1 RS-485, RS-485 для клавиатуры, и по два разъема USB 2.0 и USB 3.0, а так же 16 тревожных входов и 8 выходов.

    IDS-96128NXI-I16 поддерживает использование рейд-массивов RAID0, RAID1, RAID5, RAID6 и RAID10.

    Камера видеонаблюдения DH-IPC-HF8242F-FR с системой распознавания лиц на борту - цена 100 000 рублей
    Dahua Technology , Китай
    1/1.9", 2 Мп progressive scan CMOSSmart кодек 265+/H.264+, кодирование в 3х потоках
    Starlight, true WDR 120дБ, 3DNR, День/ночь (ICR), AWB, AGC, BLC
    Множественный мониторинг сети: веб-просмотрщик, CMS (DSS / PSS) & DMSS
    Автоматическая задняя фокусировка (ABF)

    Face capture - это программное приложение, которое автоматически захватывает лица из цифрового изображения или видеофрагмента из видеоисточника. Камеры Dahua используют усовершенствованные алгоритмы Deep Learning, что позволяет камере быстро и точно распознавать и сопоставлять лица.

    Видеокамера для распознавания лиц DH-IPC-HF8242FP-FR использует технологию Deep Learning, что позволяет эффективно распознавать и сопоставлять лица. Аналитические функции устройства позволяют определять возраст, пол, настроение, наличие или отсутствие маски/очков/бороды или усов.

    Видеокамера обладает функцией подсчета людей и генерирует тепловую карту.
    Память камеры вмещает до 10 000 лиц, которые могут быть разделены на 5 категорий, что позволяет обеспечить захват и сравнение лиц в реальном времени.

    Благодаря Starlight технологии от компании Dahua, камера идеально подходит для работы в сложных условиях c ограниченным освещением.
    Ее низкая светочувствительность обеспечивает производительность цветной картинки с минимальным окружающим освещением. Даже в экстремальных условиях низкой освещенности, практически в полной темноте, Starlight технология способна отобразить цветное изображение.

    Камера видеонаблюдения IPC2255-Gi4N с системой распознавания лиц на борту - цена 100 000 рублей

    Kedacom, Китай
    1/1.9" КМОП Starlight матрица, 0.001 лк при цветном изображении 1080@30 к/с в H.265 / H.264 / MJPEG
    Распознавание до 18 целей одновременно (образ, лицо)
    Аппартный WDR, Адаптированная ИК-подсветка до 100м
    2 тревожных входа / 1 выход, Класс защиты IP66, Диапазон температур -40°C +60°C

    Видеокамера Axis P1367 со встроенным алгоритмом Ayonix - цена 68 448 рублей

    Ayonix, Япония
    Матрица 1/2,9” с прогрессивной разверткой
    Переменное фокусное расстояние 2,8–8,5 мм
    Превосходное качество видеоизображения с разрешением 5 Мп
    Технологии Lightfinder и Forensic WDR, Технология Zipstream
    Расширенные возможности для анализа изображений

    Японский разработчик программного обеспечения для распознавания лиц Ayonix, разработала программное обеспечение для работы на борту камеры Axis P1367.

    Благодаря платформе ACAP, сторонние разработчики могут разрабатывать приложения для установки их непосредственно на камеры Axis.

    Терминалы для систем учета рабочего времени со встроенным распознаванием лиц

    Терминал учета рабочего времени FacePass Pro - цена 23 000 рублей

    Anviz , Китай
    Объем памяти на 400 пользователей
    Время идентификации < 0,1 сек
    Расстояние для идентификации пользователя: от 30 см. до 80 см
    Процент распознавания: > 99%
    Чувствительный 2,8” сенсорный TFT дисплей
    Встроенный Web Server для удобства настройки терминала

    Две сканирующие камеры обеспечивают максимально точную идентификацию, а высокоскоростной процессор Samsung ARM сводит к минимуму время распознавания лиц сотрудников

    На точность и скорость идентификации не влияют даже такие факторы, как: цвет кожи, выражение лица, пол, прическа, а так же наличие или отсутствие на лице растительности.

    Anviz FacePass Pro - система учета рабочего времени сотрудников с распознаванием по лицу, бесконтактным RFID картам или паролю.

    Сочетание нового алгоритма BioNANO с высокопроизводительной аппаратной частью, гарантирует идентификацию пользователей менее чем за 0,1 (!) секунды.

    Уникальная инфракрасная подсветка, обеспечивает стабильную работу устройства как в помещениях с меняющейся освещенностью, так и в полной темноте.
    На скорость и качество идентификации не влияют даже такие факторы, как: цвет кожи, выражение лица, пол, прическа, а так же наличие или отсутствие на лице бороды или усов.

    Динамическая цифровая клавиатура и чувствительный 2,8” сенсорный TFT дисплей гарантируют комфортную эксплуатацию.

    Мультибиометрический терминал учёта рабочего времени ZKTeco Pface202-ID - цена 26 500 рублей

    ZKTeco, Китай

    Память на 600 шаблонов вен ладони, 1200 лиц (до 3000 при верификации 1:1), 2000 пальцев и 10000 карт
    Емкость журнала 100000 на событий
    Сенсорный ЖК дисплей 4.3’’
    Встроенный считыватель карт Em-Marin

    Сетевой биометрический терминал для систем учета рабочего времени и контроля доступа с идентификацией по лицам, венам ладони, отпечаткам пальцев, считывателем RFID-карт и подключением по ethernet.

    Мультибиометрический терминал учёта рабочего времени ZKTeco uFace302-ID - цена 27 405 рублей

    Память рассчитана на 1 200 шаблонов лиц, 2 000 отпечатков пальцев и 10 000 карт
    Журнал событий на 100 000 записей
    Высокая скорость распознавания
    Интерфейсы TCP/IP, RS232/485, USB Host, Wiegand выход
    Выходы для подключения элеткрозамка, датчика состояния двери, кнопки выхода, тревожный выход
    Использование аппаратного шифрования для защиты прошивки

    Биометрический терминал для учёта рабочего времени и контроля доступа UFace302-ID осуществляет идентификацию по лицу, отпечатку пальца, карте и коду. Face302-ID способен отличить лицо реального человека от фотоизображения. Продвинутый и дружелюбный пользовательский интерфейс обеспечивает 4-дюймовый сенсорный дисплей (Touch Screen).

    Биометрический терминал учёта рабочего времени ZKTeco uFace800 - цена 27 405 рублей

    Встроенная двойная камера высокого разрешения для сканирования лиц с инфракрасной подсветкой
    Память до 3000 лиц, 5000 пальцев, 10000 карт и 100000 событий
    Платформа ZMM220_TFT, алгоритмы ZK Face 7.0, ZK Finger 10.0
    6 статусов событий при регистрации
    Сканер отпечатков пальцев, Встроенный считыватель карт
    Интерфейсы TCP/IP, USB Host, WiFi (optional), Wiegand выход

    Сетевой биометрический терминал для систем учета рабочего времени и контроля доступа с идентификацией по лицам, сканером отпечатков пальцев, считывателем RFID-карт и подключением по ethernet.
    uFace800 поддерживает управление замком, контроль датчика двери, звонок, датчик взлома, подключение кнопки выхода.

    Оборудование для систем контроля доступа со встроенным распознаванием лиц

    Терминал распознавания лиц FaceStation 2 - цена 80 856 рублей

    Suprema , Корея. Крупнейший мировой производитель биометрии, входит в топ 50 крупнейших мировых производителей систем безопасности.
    Микропроцессорная система: 1.4 GHz Quard Core, Память: 8 GB Flash + 1 GB RAM
    Автономная память на 30 000 пользователей, 5 000 000 событий, 50 000 фото
    Быстрая идентификация – сравнение 1:3 000 шаблонов в секунду
    Сенсорный дисплей 4" LCD Touchscreen, Подсветка до 25000 лк
    Стабильная работа при любом освещении благодаря подсветке 25 000 лк

    FaceStation 2 - высокопроизводительная платформа для распознавания лиц. Распознавание лиц может быть использовано как в режиме идентификации так и в режиме верификации. Кроме идентификации по лицу, поддерживается идентификация по смартфону и бесконтактным картам.

    Для решения конкретных задач СКУД на реальном объекте пользователь может подобрать различные режимы идентификации (1:N) или верификации (1:1) из широкого перечня, предлагаемого FaceStation 2.
    Таким образом, появляется возможность выбрать оптимальное соотношение уровня безопасности и скорости работы в каждом конкретном случае.

    В зависимости от выбранного режима в работе будут задействованы различные сочетания биометрических сенсоров, встроенного считывателя Smart карт и сенсорной клавиатуры для ввода PIN кода.
    Бесконтактная идентификация по лицу и возможность использования смартфона вместо карты доступа делает FaceStation 2 исключительно удобным для пользователей.

    Терминал распознавания лиц высокой производительности, со встроенным мультичастотным считывателем карт (125kHz EM & 13.56Mhz MIFARE, DESFire/EV1, FeliCa, NFC, ISO14443A/B, ISO15693).

    Благодаря расширенной области распознавания, установленное согласно инструкции устройство «видит» лица людей ростом от 145 см до 210 см.
    Терминал оснащен расширенным функциями безопасности, такими как инфракрасная технология блокировки поддельных лиц и многополосная технология RF-считывания, поддерживающая новейшие стандарты RFID.

    Так же имеется модификация терминала FaceStation 2 (модель FS2-AWB) - цена 93 850 рублей , отличающаяся встроенным считывателем MultiCLASS SE (125kHz EM, HID Prox & 13.56Mhz MIFARE, DESFire/EV1, FeliCa, iCLASS SE/SR, NFC, ISO14443A/B, ISO15693).

    Ну и конечно решения от наших китайских партнеров, которые не были бы китайскими партнерами, если бы не предлагали современные технологии в 3-4 раза дешевле. Дешевизна безусловно не достигается без последствий, одно из основных отличий это размер базы данных, который у китайцев меньше раз в 5 минимум, ну и скорость и точность тоже немного страдают. Но в принципе это вполне рабочие, локальные решения для малых предприятий.

    Устройство мультифакторной биометрической идентификации ZKTeco VF680 - цена 13 410 рублей

    ZKTeco® , Китай, крупнейший китайский производитель биометрических, самостоятельно разрабатывает алгоритмы распознавания.
    Платформа ZEM810, алгоритм ZK Face 7.0
    Встроенная двойная камера высокого разрешения для сканирования лиц с инфракрасной подсветкой
    Память на 800 лиц, до 10 000 и 100 000 событий
    Скорость верификации не более 1 секунды
    Подключение по TCP/IP

    VF680 может работать автономно или подключаться к сетевым системам контроля доступа. Терминал оснащен платформой ZEM810, сенсорным экраном 3.0 дюймов и алгоритмом ZK Face 7.0, поддерживающим 800 лиц.
    Считыватель может программироваться с встроенной клавиатуры или с помощью программного обеспечения.

    Устройство мультифакторной биометрической идентификации ZKTeco MultiBio700id - цена 28 530 рублей

    Версия алгоритма: ZK Face v7.0 и ZK Finger v10.0


    100 000 событий в журнале
    Распознавание не более 1 секунды

    Мульти биометрический терминал ZKTeco Multibio700 осуществляет доступ по лицу, отпечатку пальца, бесконтактной карте и коду.
    Устройство захватывает относительную позицию, размер, и форму глаз, носа, скул, челюстей и формирует из этих данных биометрический шаблон для последующего сравнения.
    Распознавание пользователя проходит точно и быстро в пределах 1 секунды. Инфракрасная подсветка помогает удачно проводить идентификацию в условиях недостаточной освещенности.

    Для прямого управления замком терминал может использоваться автономно, или подключаться в роли считывателя в сетевые системы доступа с использованием Wiegand интерфейса.

    Биометрический считыватель ZKTeco SpeedFace V5

    Процессор Quad-Core A17 1.8Ghz, Память 2G RAM / 16G ROM
    Двойная камера: IR камера + Visible Light камера
    Работа при освещении 0~40,000Lux
    5 дюймовый сенсорный экран
    Память на 6 000 ~ 10 000 (1:N) лиц
    Скорость верификации менее 1 секунды
    Считыватель поддерживает распознавание по лицу, отпечатку пальца и RFID картам EM-Marine или Mifare.

    Распознавание лиц Visible light в разы превосходит распознавание лиц IR и дистанция распознавания увеличена до 2 метров, что значительно упрощает ситуацию в час-пик. Нет необходимости долго стоять перед камерой устройства. Пользователь может быстро пройти в нужном направлении рядом с устройством, чтобы лицо попало в поле видимости камеры.

    Благодаря использованию CNN и созданию 3D модели лица стало возможным распознавания с разных углов обзора. С применением интеллектуального алгоритма CNN, функция анти-спуффинга эффективно предотвращает проход по маскам, фото и видео.

    Биометрический терминал доступа HikVision DS-K1T606M - цена 49 990 рублей

    HikVision , Китай
    Память на 3 000 шаблонов лиц, 5 000 карт формата Mifare и 100 000 событий в журнале
    2 тревожных входа и 1 выход
    Интерфейсы связи TCP/IP; Wi-Fi; EHome протокол; RS-485; Wiegand 26/34
    Рабочие условия от -20 °C до +50 °C , влажность 10% - 90%
    Подходит для уличной установки

    Считыватель со встроенным контроллером и алгоритмом распознавания лиц ST-FR040EM - цена 26 824 рублей
    Smartec , Россия, зонтичный российский бренд, размещает заказы на куче китайских фабриках и продает в России под единым брендом Smartec.
    Версия алгоритма: ZK Face v7.0 и ZK Finger v10.0
    Инфракрасная камера высокого разрешения, Сенсорный дисплей 3 дюйма
    Объем памяти на 400 шаблонов лиц, 2000 отпечатков пальцев и 1000 бесконтактных карт
    Распознавание не более 1 секунды
    Встроенный RFID ридер Em-Marine 125kHz

    Если вам показалось что он похож на ZKTeco MultiBio700ID , то вы правы для Smartec этот считыватель производит ZKTeco, и это полная копия MultiBio700ID.

    Домофон со встроенной системой распознавания лиц DS06M - цена 14 300 рублей

    Бевард , Россия
    1,3 Мп сенсор SONY Exmor, с чувствительностью 0.01Лк
    Эксплуатация в диапазоне температур от -40 до +50°С, класс защиты IP54
    Установленная карта microSDHC на 4 ГБ, запись на карту памяти
    Двухсторонняя аудиосвязь
    Поддержка облачного сервиса Camdrive

    Не спешите радоваться низкой цене, база данных максимум на 30 лиц. Но если у вас небольшое предприятие и вы хотите произвести ВАУ эффект на ваших посетителей - это то, что может подойти.

    К слову, системой распознавания лиц, может быть оборудован любой IP домофон , желательно с нормальной IP камерой.
    И даже больше, IP домофон устанавливается именно на уровне лица или чуть ниже, что идеально подходит для качественного распознавания лиц.

    Тот же домофон Бевард, но подключенный к системе распознавания лиц Макроскоп, в данном случае программное обеспечение Макроскоп устанавливается на сервер . В такой конфигурации размер базы данных ограничен только, простите, вашими финансовыми возможностями.

    Очки с системой распознавания лиц уже использует полиция города Чжэнчжоу

    LLVision Technology , Китай

    Подключенные к базе данных полиции, очки выдают имя и адрес человека за 2-3 минуты. За полторы недели с помощью очков на железнодорожном вокзале в Чжэнчжоу было задержано семь человек числящихся в розыске, и 26 с поддельными ID-картами .

    Кроме хакеров, есть еще вездесущий товарищ майор, который к биометрическим данным проявляет не меньший интерес. WikiLeaks опубликовала сообщение (url предусмотрительно заблокирована РосКомНадзором) о возможной краже базы данных Aadhaar ЦРУ, с помощью оборудования которое используется для сканирования отпечатков пальцев и радужной оболочки глаза от компании Cross Match (Запомните эту американскую компанию она до сих пор активно продвигает свое оборудование, в том числе на международных рынках)

    Естественно Aadhaar сам предоставляет доступ коммерческим компаниям, например компания Microsoft использует Aadhaar для подтверждения личности пользователей специальной версии Skype для Индии.

    В предоставлении доступа коммерческим компаниям к государственным базам биометрических данных есть большой смысл. Как правило сами биометрические данные не передаются, передаются лишь результат идентификации. Кроме того что эти услуги платные, именно на эти поступления создаются и обслуживаются государственные биметрические базы данных.

    Свой Aadhaar появился и в России, очевидно что российская базе данных вряд ли удастся избежать, всех тех проблем через которые прошла Aadhaar.

    Доступ к российской базе данных планируется предоставлять банкам.

    Есть и примеры другого подхода, Бельгия первая страна запретившая использование систем распознавания лиц коммерческими организациями.

    Базы данных при надлежащие коммерческим компаниям
    Государство даже обладая монополией на принудительный сбор данных, как правило не является самым эффективным их собирателем.

    Поэтому мы имеем гигантское количество коммерческих баз данных биометрической информации. Крупнейшие - База данных Вконтакте (более 97 000 000 человек ежемесячно пользуются ВКонтакте), именно ей например пользуется NtechLab для своего сайта FindFace , также большой базой данных обладает Facebook и другие социальные сети и сайты знакомств.

    Коммерческие базы данных для того и создаются что за скромные деньги их могли использовать другие коммерческие компании.

    Например Битрикс24 в своих продуктах Face-трекер, Face-карт для 1С, Bitrix24.Time и визит-трекер использует базу данных вконтакте.

    Лучшая база данных
    У всех выше перечисленных баз данных, есть один существенный недостаток, они не имеют никакого отношения к вашему бизнесу. И содержат лишь определенные наборы данных, зачастую крайне полезные наборы, но без учета специфики вашего бизнеса, применение их сильно ограничено.

    Одним из самых важных показателей качества вашей базы данных - будет качество изображений лица, эталонов.
    Самые важные показатели качества базы данных эталонных изображений:
    Количество пикселей
    Контраст и прорисовка деталей лица
    Фон, на котором находится основная часть лица
    Отсутствие мешающих деталей на области лица и т. д.

    Важно при этом еще и соблюдать более или менее одинаковые условия получения образов лиц (освещенность, размер самого лица на фоне всего образа).

    Эти показатели важно учесть еще на этапе проектирования системы в целом, отдельно уделяя большое внимание системе получения распознанных лиц эталонов.
    Начните создавать вашу базу данных уже сегодня!

    Использование биометрических баз данных
    Многие проявляют разумные опасения как по использованию биометрических данных государством так и еще большие опасения по поводу использования этих данных коммерческими структурами.

    И действительно эти опасения не лишены смысла, но они не должны останавливать внедрение технологии. В нашем недалеком будущем именно наша биологическая идентичность позволит отличить человека от искусственного интеллекта .

    Скрин с данными о количестве ботов и реальных людей посещающих веб сайты, исследование проведено компанией Imperva Incapsula


    Даже на данный момент количество ботов и реальных людей посещающих сайты примерно одинаково. С развитием интернета вещей и искусственного интеллекта количество ботов будет расти в математической прогрессии как и их возможности, уже существуют решения способные позвонить от вашего имени например в парикмахерскую или пиццерию.

    Области применения систем распознавания лиц

    Специфика применения технологии распознавания лиц отличается разной критичностью к ошибкам в зависимости от сферы применения.

    Системы контроля доступа

    Одно из наилучших применений систем распознавания лиц на данный момент именно в системах контроля доступа. Во первых сотрудник сам заинтересован в предоставлении ему доступа и не будет сознательно саботировать работу системы распознавания лиц. Во вторых вы контролируете, все внешние факторы влияющие на качество распознавания - освещение, фон, схема движения сотрудников. Использую все это вы можете создать идеальные условия.


    Системы распознавания лиц могут использоваться в системах контроля доступа в двух режимах:

    Режим идентификации - решение о допуске принимается на основе только данных от системы распознавания лиц. То есть, например база данных из ваших сотрудников 100 человек, и задача системы распознавания сравнить лицо текущего человека с базой данных в 100 человек. То есть сравнение происходит 100:1. Если человек будет идентифицирован как сотрудник, то ему будет предоставлен доступ.

    Терминалы распознавания лиц от HikVision

    Данный режим, эффективнее всего использовать в задачах обнаружения посторонних на контролируемой территории. Как правило есть смысл использовать в особо охраняемых зонах предприятия, куда доступ разрешен ограниченному кругу лиц. К системе распознавания подключаются все камеры установленные на данной территории в случае обнаружения любого лица, которое не содержится в базе данных происходит информирование службы безопасности.

    Режим верификации - идентификация в данном случае проводится с помощью другой технологии, например RFID (если вы консерватор), или может использоваться мобильные идентификаторы, или отпечатки пальца или венозный рисунок руки или пальца , если вы сечете куда ветер дует в современных тенденциях СКУД, и не хотите выкидывать деньги на ветер.
    Человек подносит карту к считывателю система его идентифицирует, то есть устанавливает что это Иванов, и Иванову разрешен доступ в данное время. Система распознавания лиц в данном случае уже знает, что это Иванов, и используя только фото Иванова из базы данных сравнивает, предъявителя RFID карты с фотографией Иванова в базе данных. То есть сравнение происходит 1:1.

    В режиме верификации работает вообще идеально, так как задача верификации очень простая даже для средних по качеству систем распознавания лиц.

    Данный режим целесообразно использовать на любых проходных - бизнес центры, производственные предприятия, институты, школы.

    Задача системы распознавания лиц - верифицировать держателя карты. Обычно эту задачу выполняет охранник или вахтер . И это не лучшая идея, если только вы не фольклорист, и не преследуете цели составить «энциклопедию современной культуры»


    У охранника на мониторе отображается фото человека при поднесении бесконтактной карты к считывателю, задача охранника сравнить фото и предъявителя карты (по науке это называется верификация). Охранником выполняется эта работа плохо - как и любая другая однообразная, рутинная, повторяющаяся работа.

    Система распознавания лиц не только гораздо эффективней выполнит эту работу, но и еще предотвратить злоупотребления со стороны охраны.

    Распознавание лиц в транспорте

    В транспорте распознавание лиц может применяться для нескольких целей:

    Поиск пропавших людей
    Поиск преступников находящихся в розыске
    Извлечение демографической информации людей для лучшего обслуживания
    Измерение удовлетворенности людей от их лиц
    Подсчет количества пассажиров, использующих общественный транспорт

    Данные о количестве пассажиров поступающие в режиме онлайн помогут быстрее, более гибко и эффективно управлять сетями общественного городского транспорта.

    Также подсчет количества пассажиров при сопоставлении этих данных с количеством оплат, позволит устанавливать нарушения правил оплаты проезда.

    Идентификация по лицу для целей оплаты проезда

    Распознавание лица для целей оплаты проезда может на данный момент вестись в режиме верификации, и позволит избегать несанкционированного использования многоразовых проездных билетов, например использованию одного проездного абонемента несколькими лицами.

    Использование распознанного лица как единственного идентификатора пассажира для автоматизированной оплаты проезда, на данном уровне развития технологий представляется возможным только в небольших корпоративных транспортных сетях, и никак не подойдет для массового общественного городского транспорта.

    Учет рабочего времени

    Еще недавно учет рабочего времени без использования преграждающих устройств, было недостижимой мечтой. Сегодня это реальность.
    Учет рабочего времени это конечно одна из функций системы контроля доступа, но учет рабочего времени может вестись и отдельно, только с помощью систем распознавания лиц.

    Одно из основных преимуществ, использования систем распознавания лиц для учета отработанного времени - это отсутствие требований к чистоте лица. В пределах разумного конечно - смотрите раздел «Саботаж».

    Также преимуществами учета рабочего времени с помощью системы распознавания лиц будут:

    Отсутствие преграждающих устройств, что конечно повышает комфортность
    Возможность использовать учет рабочего времени скрытно, без информирования сотрудников

    Учет рабочего времени всего лишь одна из метрик, и вообщем то сама по себе в отрыве от других данных по работе предприятия, мало, что говорящая. Но обладая всем объемом знаний она отлично встраивается в анализ эффективности работы компании.

    Особенно внимательно стоит следить за посещаемости в кризис, на это нам сам PricewaterhouseCoopers прямо указывает . Не будете следить за посещаемостью получите 2 дополнительных дня отсутствия на работе, о которых вы не узнаете, но которые вы оплатите. Что в 1,3 раза увеличит ваши финансовые потери от отсутствия сотрудников на рабочем месте.

    Распознавание лиц для целей учета рабочего может быть реализовано в двух видах.

    Сервер + софт + хорошие IP-камеры и все это за много денег. Царский вариант - когда учет рабочего времени может вестись без информирования сотрудников.

    Специализированные терминалы - это тот вариант когда сотруднику нужно подойти к терминалу, тем самым пройдя процедуру идентификации. Это работает только если вы объявили о том, что любому, кто не отметится в устройстве распознавания лиц - рабочий день оплачен не будет. Это простая административная мера как по волшебству сокращает количество ошибок FAR и FRR до абсолютного нуля.

    Распознавание лиц в толпе

    Говоря о системе распознавания лиц, как правило наше воображение рисует именно сценарии идентификации преступников на улицах города. Эта самая желанная самая востребованная, и самая сложная на данный момент задача.

    Поиск пропавших людей в Китае с помощью системы распознавания лиц

    Сложности
    Неравномерное освещение (день, ночь, светящее солнце, все это разные условия которые будут сильно влиять на процент распознавания лиц)
    Большое количество людей в кадре

    Плюсы
    Эффект неожиданности
    Распознавание лиц хоть и перспективная технология о которой очень много пишут, но пишут в специализированных «гиковских» изданиях. Следовательно количество людей которые вкурсе - микроскопическое, в масштабе общего количество населения. Большинство преступников просто не будут совершать действия препятствующие идентификации.

    Сеть покрытия
    Камер видеонаблюдения в большинстве больших городов очень много. Именно этот аспект будет вносить свою коррективу в работу системы распознавания лиц. Например в Великобритании человек за день попадает в объектив видеокамеры около 300 раз. И это не рекорд, и не предел при текущей низкой стоимости IP-камер.

    Определение возраста

    От задач безопасности переходим к задачам маркетинга. Когда говорят об присоединении отрасли «Систем безопасности» к большой отрасли IT имеют ввиду именно это - с помощью оборудования которое раньше считалось способным решать только проблемы безопасности. Сегодня решаю гигантский спектр разных задач, не имеющих отношения к «Системам безопасности» как таковым.

    Возрастной состав посетителей бесценная информация для любого маркетолога, и если верить нашему министру здравоохранения, которая заявила , что средняя продолжительность жизни может вырасти до 120 лет, правда госпожа Скворцова не уточнила в какой стране это произойдет, что очевидно выдает в ней умного человека. (я лично верю, что в России), так или иначе актуальность задачи определения возраста точно будет возрастать.

    Онлайн сервисы для определения возраста
    Насколько точным будет определение возраста, вы можете протестировать на нескольких онлайн сервисах. Загружайте свои фото и тестируйте.

    Для целей определения возраста вам подойдет:

    Программное обеспечение для распознавания лиц www.axis.com/products/axis-demographic-identifier/

    Определение пола

    Если вы не собираетесь анализировать пол участников Евровидения, для современных систем распознавания лиц это достаточно простая задача.

    Не нужно быть великим маркетологом, чтобы понимать, что разный гендерный состав ваших покупателей требует разной маркетинговой, рекламной, PR и любых других стратегий связанных с взаимодействием с клиентами.

    Сети кинотеатров «Синема парк» и «Формула кино» уже запустили сбор возраста и пола своих посетителей.

    Насколько точным будет определение пола вы можете протестировать по уже знакомым вам онлайн сервисам. Загружайте свои фото и тестируйте.

    www.skybiometry.com/demo/face-detect/
    www.how-old.net

    Для целей определения возраста вы можете использовать:
    Программное обеспечение для распознавания лиц, во многих случаях это одна из его функций.

    Готовые решения от Axis, HikVision - Смарт видеорегистратор + IP-камеры

    Швеция
    AXIS Demographic Identifier
    https://www.axis.com/products/axis-demographic-identifier/


    Подсчет уникальных посетителей

    Классическую задачу подсчета количества посетителей, всегда решали инфракрасными или лазерными датчиками, которые просто показывают количество пересечений виртуальной линии. Например тележка будет давать отдельное пересечение, пользы от них, как от показателя средней температуры по больнице .

    Есть современные комплексы видеоаналитики, как правило совмещенные с дополнительными датчиками. Они уже умеют считать конкретно людей, но вас же охранник, или местный городской сумасшедший, 50 раз прошедший туда - обратно, может свести данные практически к полной бесполезности.

    Впервые, благодаря современным системам распознавания лиц маркетологи могут получать по настоящему полезные данные - количество уникальных посетителей . А в купе с показателями пола и возраста - это Яндекс метрика для вашего магазина.

    Trassir Face Analytics модуль анализа лиц - цена 36 990 рублей
    Интеллектуальный модуль анализа лиц. Функционал:
    1. подсчёт уникальных лиц
    2. демографический анализ лиц (пол, возраст)
    3. идентификация расы
    4. распознавание атрибутов лица (очки, головной убор, усы, цвет волос). Стоимость за обработку 1 видеоканала.

    Скоро в нашем блоге выйдет статья с обзором современный систем видеаналитики для магазинов, это будет бомба, подписывайтесь чтобы не пропустить - мы доступны на всех платформах -

Одним из залогов качества жизни в современном социуме является правильный подход к обеспечению личной безопасности и сохранности имущества. Требования предъявляемые к системам видео-регистрации постоянно возрастают. Хорошая система наблюдения в наши дни должна не только уметь записывать происходящее на съемные носители, но и распознавать, и идентифицировать людей в кадре.

Места применения

Функция «распознавание лиц» нашла свое применение во многих аспектах человеческой жизни. С помощью систем видеонаблюдения данного типа можно:

  • организовать проходную на предприятии или других закрытых от посторонних объектов. Видеонаблюдение можно связать с турникетами и организовать автоматический пункт пропуска по принципу «свои-чужие»;
  • организовать систему противодействия хищениям в торговых точках и других частных владениях. Любые магазины, особенно большие, сталкиваются с проблемой пристрастия некоторых посетителей к воровству. Зачастую одни и те же люди, склонны осуществлять кражи в одних и тех же торговых точках. Установив камеры с системой распознавания лиц, можно более тщательно приглядываться к действиям уже попавшегося на воровстве человека. Сканер сообщит на пульт охраны как только он зайдет в магазин;
  • организовать систему противодействия проникновению на территорию домовладений и другие закрытые объекты. Порой человеку сложно на мониторе отличить затаившегося злоумышленника от куста, или другого предмета, тем более если камеры установлены на слабоосвещенном участке местности. Но ведь то что недоступно человеку, вполне может сделать компьютерный модуль;
  • фейс-контроль в ночных клубах — 100% защита от непрошеных гостей.

Принцип работы

Система видеонаблюдения с функцией «распознавание лиц» работает по принципу сравнения полученного изображения с имеющимся в базе. Среднестатистический комплекс умеет идентифицировать человеческое лицо на расстоянии не превышающем десяти метров от камеры. При этом посетитель будет узнан даже с учетом наличия изменений физических параметров лица: смена прически, борода, наличие очков и т. д. Анализ основывается на сравнении биометрических параметров строения головы, индивидуальных для каждого человека. При этом сканирование происходит на ходу, посетителю достаточно повернуть лицо к сканеру во время движения. Система видеонаблюдения может быть связана с турникетами и другими устройствами авторизированного входа и работать автоматически. Неопознанные посетители не получат доступа на охраняемую территорию, а их фото будет сохранено в базе для обработки службой охраны.

Обычно такие системы устанавливаются в больших корпорациях, где от безопасности зависит будущий успех компании, например, компании по разработке новых типов вооружения или микросхем, биологическая лаборатория. Система автоматически распознает всех сотрудников и сравнивает с базой данных. В случае несоответствия или отсутствия человека в системе, она активизирует протоколы безопасности, в комнате охраны загорается тревожный сигнал и красная световая индикация. Место обнаружения нарушителя точно указывается на электронной карте объекта и охрана за считаные секунды находит нарушителя.

Методы работы

Камеры систем распознавания лиц работают в двух режимах двухмерном и трехмерном. В случае с 2D системами, распознавание происходит на основе плоского изображения. Двухмерные камеры весьма чувствительны к уровню освещенности помещения, от этого параметра в значимой мере зависит качество конечной картинки. При плохом свете изображение будет трудноразличимым. 3D камеры для индикации воссоздают трехмерный образ на основе полученного изображения. Плохая освещённость для них особой помехой не является, обычно это может лишь незначительно исказить текстуру лица.

Виды

В зависимости от целей и задач, поставленных перед системой видеонаблюдения с функцией распознавания лиц, они делятся на:

  • обнаружения (Камера от 1 Мп, фокусное расстояние от 1 мм). Действие этой охранной системы направлены на фиксирование проникновений на подконтрольные объекты. Сканер в состоянии отличить человека от кошки или белки, но не сможет идентифицировать его;
  • распознавания (Камера от 2 Мп, фокусное расстояние от 6 мм). В данном случае основной функцией сканера является распознавание лиц посетителей по принципу «свои-чужие». При просмотре видеоряда изображение будет достаточно смазанным, Вы узнаете на нем знакомые лица, но в случае если на объект проник вор, найти его по данным кадрам будет весьма затруднительно;
  • идентификации (Камера более 2 Мп, фокусное расстояние от 8 мм) Данные системы могут выполнять все функции предыдущих типов, при этом качества получаемого изображения будет вполне достаточно чтобы опознать злоумышленника. Такое фото вполне можно передать в судебные органы и органы правопорядка.

В скобках к описанию каждого типа систем видеонаблюдения мы обозначили минимальные требования к разрешению камеры и фокусному расстоянию объектива. При заказе оборудования необходимо учитывать, что этих характеристик достаточно при идеальных условиях для съемки. Естественно на практике такое встречается редко, поэтому выбирая сканеры лучше приобрести устройства с запасом, к примеру, для систем распознавания — разрешение в 2 Мп и фокусное расстояние в 8 мм, для систем индикации — разрешение в 5 МП и фокусное расстояние в 12 мм.

Естественно, конечный результат зависит не только от этих характеристик. Фокусное расстояние и разрешение весьма важны, но при монтаже камеры необходимо учесть освещенность, углы обзора и множество других параметров. Поэтому подбор и установку лучше доверить профессионалам.

Взять кредит, оформить визу, да и просто запустить смартфон последней модели — сделать все это сегодня невозможно без участия алгоритмов распознавания лиц. Они помогают полицейским в расследованиях, музыкантам — на сцене, но понемногу превращаются во всевидящее око, следящее за всеми нашими действиями онлайн и офлайн.

Алгоритмы (технологии)

Определить человека по фото с точки зрения компьютера означает две очень разные задачи: во‑первых, найти лицо на снимке (если оно там есть), во‑вторых, вычленить из изображения те особенности, которые отличают этого человека от других людей из базы данных.

1. Найти

Попытки научить компьютер находить лицо на фотографиях проводились еще с начала 1970-х годов. Было испробовано множество подходов, но важнейший прорыв произошел существенно позднее — с созданием в 2001 году Полом Виолой и Майклом Джонсом метода каскадного бустинга, то есть цепочки слабых классификаторов. Хотя сейчас есть и более хитрые алгоритмы, можно поспорить, что и в вашем сотовом телефоне, и в фотоаппарате работает именно старый добрый Виола — Джонс. Все дело в замечательной быстроте и надежности: даже в далеком 2001 году средний компьютер с помощью этого метода мог обрабатывать по 15 снимков в секунду. Сегодня эффективность алгоритма удовлетворяет всем разумным требованиям. Главное, что нужно знать об этом методе, — он устроен удивительно просто. Вы даже не поверите насколько.

  1. Шаг1. Убираем цвет и превращаем изображение в матрицу яркости.
  2. Шаг 2. Накладываем на нее одну из квадратных масок — они называются признаками Хаара. Проходимся с ней по всему изображению, меняя положение и размер.
  3. Шаг 3. Складываем цифровые значения яркости из тех ячеек матрицы, которые попали под белую часть маски, и вычитаем из них те значения, что попали под черную часть. Если хотя бы в одном из случаев разность белых и черных областей оказалась выше определенного порога, берем эту область изображения в дальнейшую работу. Если нет — забываем про нее, здесь лица нет.
  4. Шаг 4. Повторяем с шага 2 уже с новой маской — но только в той области изображения, которая прошла первое испытание.

Почему это работает? Посмотрите на признак . Почти на всех фотографиях область глаз всегда немного темнее области непосредственно ниже. Посмотрите на признак : светлая область посередине соответствует переносице, расположенной между темными глазами. На первый взгляд черно-белые маски совсем не похожи на лица, но при всей своей примитивности они имеют высокую обобщающую силу.

Почему так быстро? В описанном алгоритме не отмечен один важный момент. Чтобы вычесть яркость одной части изображения из другой, понадобилось бы складывать яркость каждого пикселя, а их может быть много. Поэтому на самом деле перед наложением маски матрица переводится в интегральное представление: значения в матрице яркости заранее складываются таким образом, чтобы интегральную яркость прямоугольника можно было получить сложением всего четырех чисел.

Как собрать каскад? Хотя каждый этап наложения маски дает очень большую ошибку (реальная точность ненамного превышает 50%), сила алгоритма — в каскадной организации процесса. Это позволяет быстро выкидывать из анализа области, где лица точно нет, и тратить усилия только на те области, которые могут дать результат. Такой принцип сборки слабых классификаторов в последовательности называется бустингом (подробнее о нем можно прочитать в октябрьском номере «ПМ» или ). Общий принцип такой: даже большие ошибки, будучи перемножены друг на друга, станут невелики.

2. Упростить

Найти особенности лица, которые позволили бы идентифицировать его владельца, означает свести реальность к формуле. Речь идет об упрощении, причем весьма радикальном. Например, различных комбинаций пикселей даже на миниатюрном фото 64 x 64 пикселя может быть огромное количество — (2 8) 64 x 64 = 2 32768 штук. При этом для того, чтобы пронумеровать каждого из 7,6 млрд людей на Земле, хватило бы всего 33 бита. Переходя от одной цифры к другой, нужно выкинуть весь посторонний шум, но сохранить важнейшие индивидуальные особенности. Специалисты по статистике, хорошо знакомые с такими задачами, разработали множество инструментов упрощения данных. Например, метод главных компонент, который и заложил основу идентификации лиц. Впрочем, в последнее время сверточные нейросети оставили старые методы далеко позади. Их строение довольно своеобразно, но, по сути, это тоже метод упрощения: его задача — свести конкретное изображение к набору особенностей.


Накладываем на изображение маску фиксированного размера (правильно она называется ядром свертки), перемножаем яркость каждого пикселя изображения на значения яркости в маске. Находим среднее значение для всех пикселей в «окошке» и записываем его в одну ячейку следующего уровня.


Сдвигаем маску на фиксированный шаг, снова перемножаем и снова записываем среднее в карту признаков.


Пройдясь по всему изображению с одной маской, повторяем с другой — получаем новую карту признаков.


Уменьшаем размер наших карт: берем несколько соседних пикселей (например, квадрат 2x2 или 3x3) и переносим на следующий уровень только одно максимальное значение. То же самое проводим для карт, полученных со всеми другими масками.


В целях математической гигиены заменяем все отрицательные значения нулями. Повторяем с шага 2 столько раз, сколько мы хотим получить слоев в нейросети.


Из последней карты признаков собираем не сверточную, а полносвязную нейросеть: превращаем все ячейки последнего уровня в нейроны, которые с определенным весом влияют на нейроны следующего слоя. Последний шаг. В сетях, обученных классифицировать объекты (отличать на фото кошек от собак и пр.), здесь находится выходной слой, то есть список вероятностей обнаружения того или иного ответа. В случае с лицами вместо конкретного ответа мы получаем короткий набор самых важных особенностей лица. Например, в Google FaceNet это 128 абстрактных числовых параметров.

3. Опознать

Самый последний этап, собственно идентификация, — самый простой и даже тривиальный шаг. Он сводится к тому, чтобы оценить похожесть полученного списка признаков на те, что уже есть в базе данных. На математическом жаргоне это означает найти в пространстве признаков расстояние от данного вектора до ближайшей области известных лиц. Точно так же можно решить и другую задачу — найти похожих друг на друга людей.

Почему это работает? Сверточная нейросеть «заточена» на то, чтобы вытаскивать из изображения самые характерные черты, причем делать это автоматически и на разных уровнях абстракции. Если первые уровни обычно реагируют на простые паттерны вроде штриховки, градиента, четких границ и т. д. , то с каждым новым уровнем сложность признаков возрастает. Маски, которые нейросеть примеряет на высоких уровнях, часто действительно напоминают человеческие лица или их фрагменты. Кроме того, в отличие от метода главных компонент, нейросети комбинируют признаки нелинейным (и неожиданным) образом.

Откуда берутся маски? В отличие от тех масок, что используются в алгоритме Виолы — Джонса, нейросети обходятся без помощи человека и находят маски в процессе обучения. Для этого нужно иметь большую обучающую выборку, в которой имелись бы снимки самых разных лиц на самом разном фоне. Что касается того результирующего набора особенностей, которые выдает нейросеть, то он формируется по методу троек. Тройки — это наборы изображений, в которых первые два представляют собой фотографию одного и того же человека, а третье — снимок другого. Нейросеть учится находить такие признаки, которые максимально сближают первые изображения между собой и при этом исключают третье.

Чья нейросеть лучше? Идентификация лиц давно уже вышла из академии в большой бизнес. И здесь, как и в любом бизнесе, производители стремятся доказать, что именно их алгоритмы лучше, хотя не всегда приводят данные открытого тестирования. Например, по информации конкурса MegaFace, в настоящее время лучшую точность показывает российский алгоритм deepVo V3 компании «Вокорд» с результатом в 92%. Гугловский FaceNet v8 в этом же конкурсе показывает всего 70%, а DeepFace от Facebook с заявленной точностью в 97% в конкурсе вовсе не участвовал. Интерпретировать такие цифры нужно с осторожностью, но уже сейчас понятно, что лучшие алгоритмы почти достигли человеческой точности распознавания лиц.

Живой грим (искусство)

Зимой 2016 года на 58-й ежегодной церемонии вручения наград «Грэмми» Леди Гага исполнила трибьют умершему незадолго до того Дэвиду Боуи. Во время выступления по ее лицу растеклась живая лава, оставив на лбу и щеке узнаваемый всеми поклонниками Боуи знак — оранжевую молнию. Эффект движущегося грима создавала видеопроекция: компьютер отслеживал движения певицы в режиме реального времени и проецировал на лицо картины, учитывая его форму и положение. В Сети легко найти видеоролик, на котором заметно, что проекция еще несовершенна и при резких движениях слегка запаздывает.


Технологию видеомаппинга лиц Omote Нобумичи Асаи развивает с 2014 года и уже с 2015-го активно демонстрирует по всему миру, собрав приличный список наград. Основанная им компания WOW Inc. стала партнером Intel и получила хороший стимул для развития, а сотрудничество с Ишикавой Ватанабе из Токийского университета позволило ускорить проекцию. Впрочем, основное происходит в компьютере, и похожие решения используют многие разработчики приложений, позволяющих накладывать на лицо маски, будь то шлем солдата Империи или грим «под Дэвида Боуи».

Александр Ханин, основатель и генеральный директор VisionLabs

«Подобной системе не нужен мощный компьютер, наложение масок может производиться даже на мобильных устройствах. Система способна работать прямо на смартфоне, без отправки данных в облако или на сервер».

«Эта задача называется трекингом точек на лице. Есть много подобных решений и в открытом доступе, но профессиональные проекты отличаются скоростью и фотореалистичностью, — рассказал нам глава компании VisionLabs Александр Ханин. — Самое сложное при этом состоит в определении положения точек с учетом мимики и индивидуальной формы лица или в экстремальных условиях: при сильных поворотах головы, недостаточной освещенности и большой засветке». Чтобы научить систему находить точки, нейронную сеть обучают — сначала вручную, скрупулезно размечая фотографию за фотографией. «На входе это картинка, а на выходе — размеченный набор точек, — поясняет Александр. — Дальше уже запускается детектор, определяется лицо, строится его трехмерная модель, на которую накладывается маска. Нанесение маркеров осуществляется на каждый кадр потока в режиме реального времени».


Примерно так и работает изобретение Нобумичи Асаи. Предварительно японский инженер сканирует головы своих моделей, получая точные трехмерные прототипы и готовя видеоряд с учетом формы лица. Задачу облегчают и небольшие маркеры-отражатели, которые клеят на исполнителя перед выходом на сцену. Пять инфракрасных камер следят за их движениями, передавая данные трекинга на компьютер. Дальше все происходит так, как нам рассказали в VisionLabs: лицо детектируется, строится трехмерная модель, и в дело вступает проектор Ишикавы Ватанабе.

Устройство DynaFlash было представлено им в 2015 году: это высокоскоростной проектор, способный отслеживать и компенсировать движения плоскости, на которой отображается картинка. Экран можно наклонить, но изображение не исказится и будет транслироваться с частотой до тысячи 8-битных кадров в секунду: запаздывание не превышает незаметных глазу трех миллисекунд. Для Асаи такой проектор оказался находкой, живой грим стал работать действительно в режиме реального времени. На ролике, записанном в 2017 году для популярного в Японии дуэта Inori, отставания уже совсем не видно. Лица танцовщиц превращаются то в живые черепа, то в плачущие маски. Это смотрится свежо и привлекает внимание — но технология уже быстро входит в моду. Скоро бабочка, севшая на щеку ведущей прогноза погоды, или исполнители, каждый раз на сцене меняющие внешность, наверняка станут самым обычным делом.


Фейс-хакинг (активизм)

Механика учит, что каждое действие создает противодействие, и быстрое развитие систем наблюдения и идентификации личности не исключение. Сегодня нейросети позволяют сопоставить случайную смазанную фотографию с улицы со снимками, загруженными в аккаунты социальных сетей и за секунды выяснить личность прохожего. В то же время художники, активисты и специалисты по машинному зрению создают средства, способные вернуть людям приватность, личное пространство, которое сокращается с такой головокружительной скоростью.

Помешать идентификации можно на разных этапах работы алгоритмов. Как правило, атакам подвергаются первые шаги процесса распознавания — обнаружение фигур и лиц на изображении. Как военный камуфляж обманывает наше зрение, скрывая объект, нарушая его геометрические пропорции и силуэт, так и машинное зрение стараются запутать цветными контрастными пятнами, которые искажают важные для него параметры: овал лица, расположение глаз, рта и т. д. По счастью, компьютерное зрение пока не столь совершенно, как наше, что оставляет большую свободу в выборе расцветок и форм такого «камуфляжа».


Розовые и фиолетовые, желтые и синие тона доминируют в линейке одежды HyperFace, первые образцы которой дизайнер Адам Харви и стартап Hyphen Labs представили в январе 2017 года. Пиксельные паттерны предоставляют машинному зрению идеальную — с ее точки зрения — картинку человеческого лица, на которую компьютер ловится, как на ложную цель. Несколько месяцев спустя московский программист Григорий Бакунов и его коллеги даже разработали специальное приложение, которое генерирует варианты макияжа, мешающего работе систем идентификации. И хотя авторы, подумав, решили не выкладывать программу в открытый доступ, тот же Адам Харви предлагает несколько готовых вариантов.


Человек в маске или со странным гримом на лице, может, и будет незаметен для компьютерных систем, но другие люди наверняка обратят на него внимание. Однако появляются способы сделать и наоборот. Ведь с точки зрения нейросети изображение не содержит образов в обычном для нас понимании; для нее картинка — это набор чисел и коэффициентов. Поэтому совершенно различные предметы могут выглядеть для нее чем-то вполне сходным. Зная эти нюансы работы ИИ, можно вести более тонкую атаку и подправлять изображение лишь слегка — так, что человеку перемены будут почти незаметны, зато машинное зрение обманется полностью. В ноябре 2017 года исследователи показали, как небольшие изменения в окраске черепахи или бейсбольного мяча заставляют систему Google InceptionV3 уверенно видеть вместо них ружье или чашку эспрессо. А Махмуд Шариф и его коллеги из Университета Карнеги — Меллон спроектировали пятнистый узор для оправы очков: на восприятие лица окружающими он почти не влияет, а вот компьютерная идентификация средствами Face++ уверенно путает его с лицом человека, «под которого» спроектирован паттерн на оправе.

Вы поднимаетесь по лестнице и заходите в лифт. Он знает, на какой этаж вам нужно. Двери в квартиру сами открываются перед вами. Компьютер и телефон «узнают» вас и не требуют ввода пароля. Автомобили, социальные сети, магазины - все приветствуют вас, едва завидев, обращаются к вам по имени и предугадывают каждый ваш шаг. Так работает распознавание лиц. Нравится? Пугает?

На первый взгляд может показаться, что любая организация, которая может себе такое позволить, следит за каждым вашим шагом, собирает на вас досье. Но вы даже не представляете, как широко технологии распознавания лиц распространились по миру и какие мощные перспективы обещают. Помимо выше приведенных примеров, системы распознавания лиц позволяют делать и такие простые и сложные вещи:

  • подтверждение личности студента во время онлайн-экзаменов;
  • определение людей из «черного списка» на входе на стадионы и ночные клубы;
  • оплата товаров;
  • сохранение вашего места в очереди при посещении парка аттракционов;
  • разблокировка телефона или компьютера.

Что говорить, если в одной только Москве уже работает сеть из более 150 000 камер наружного видеонаблюдения. От них никуда не скрыться, и это заставляет людей задумываться, но масштабы «слежки» не настолько велики. Сеть использует мощную систему распознавания лиц, но для ее работы необходимо много энергии, поэтому в режиме реального времени работают всего 2-4 тысячи камер. Массовым слежением за населением пока только пугают, поэтому стоит сосредоточиться на реальных плюсах работы данной технологии. Но обо всем по порядку.

Как работает система распознавания лиц?

Никогда не задумывались о том, как вы сами узнаете лицо, распознаете его? А как это делает компьютер? Конечно, у человеческих лиц есть определенные свойства, которые легко описать. Расстояние между глазами, положение и ширина носа, форма надбровных дуг и подбородка - все эти детали вы подмечаете бессознательно, когда смотрите на другого человека. Компьютер же делает все это с определенной эффективностью и точностью, потому что, совмещая все эти метрики, получает математическую формулу человеческого лица.

Итак, насколько хорошо работает система распознавания лиц в настоящее время? Вполне неплохо, но иногда ошибается. Если вы когда-нибудь сталкивались с ПО, распознающим лица на Facebook или на другой платформе, вы наверняка замечали, что забавных результатов бывает столько же, сколько и точных. И все же, хотя технология работает не со 100-процентной точностью, она достаточно хороша, чтобы найти широкое применение. И даже заставить понервничать.

Пол Хоуи из NEC говорит, что их система распознавания лиц сканирует лица на предмет индивидуальных идентификаторов:

«К примеру, многие считают расстояние между глазами уникальной характеристикой. Или же это может быть расстояние от подбородка до лба и другие компоненты. Мы, в частности, учитываем 15-20 факторов, которые считаются важными, а также другие факторы, уже не настолько значимые. Создается трехмерное изображение головы человека, поэтому даже если она частично будет закрыта, мы все равно сможем получить точное соответствие. Затем система берет сигнатуру лица и пропускает ее через базу данных».

Стоит ли переживать о программах, распознающих лица?

Прежде всего, распознавание лиц - это данные. Данные можно собирать и хранить, зачастую без разрешения. Как только информация собрана и сохранена, она открыта и для взлома. Платформы с ПО, распознающим лица, пока не подвергались серьезным взломам, но по мере распространения технологий ваши биометрические данные оказываются в руках все большего числа людей.

Существуют также вопросы владения. Большинство людей не знают, что когда они регистрируются в социальных медиаплатформах вроде Facebook, их данные с этого момента принадлежат этой самой Facebook. Поскольку число компаний, использующих распознавание лиц, постоянно растет, очень скоро даже не придется загружать собственные фотографии в Интернет, чтобы оказаться скомпрометированным. Они уже там хранятся, и хранятся давно.

Говоря о программном обеспечении, все они работают по-разному, но в основе своей используют похожие методы и нейросети. У каждого лица есть множество отличительных признаков (в мире невозможно найти два идентичных лица, а ведь сколько их было за всю историю человечества!). К примеру, программное обеспечение FaceIt определяет эти признаки как узловые точки. Каждое лицо содержит примерно 80 узловых точек, схожих с теми, что мы упоминали прежде: расстояние между глазами, ширина носа, глубина глазных впадин, форма подбородка, длина челюсти. Эти точки измеряются и создают числовой код - «отпечаток лица» - который затем попадает в базу данных.

В прошлом распознавание лиц опиралось на двумерные снимки для сравнения или идентификации других двумерных снимков из базы данных. Для пущей эффективности и точности изображение должно было быть лицом, прямо смотрящим в камеру, с небольшой дисперсией света и без особого выражения лица. Конечно, работало это чертовски плохо.

В большинстве случаев снимки не создавались в подходящей среде. Даже небольшая игра света могла снизить эффективность системы, что приводило к высоким показателям отказа.

На смену 2D пришло 3D-распознавание. Эта недавно появившаяся тенденция в программном обеспечении использует 3D-модель, обеспечивающую высокую точность распознавания лица. Запечатлевая трехмерное изображение поверхности лица человека в реальном времени, ПО выделяет отличительные черты - где больше всего выдаются жесткие ткани и кость, например, кривые глазного гнезда, носа и подбородка - для идентификации субъекта. Эти области уникальны и не меняются со временем.

Используя глубину и ось измерения, на которые не влияет освещение, система трехмерного распознавания лиц может даже использоваться в темноте и распознавать объекты под разными углами (даже в профиль). Подобное программное обеспечение проходит через несколько этапов, идентифицируя человека:

  • Обнаружение : получение снимка при помощи цифрового сканирования существующей фотографии (2D) или видео для получения живой картинки субъекта (3D).
  • Центровка : определив лицо, система отмечает положение головы, размер и позу.
  • Измерение : система измеряет кривые на лице с точностью до миллиметра и создает шаблон.
  • Репрезентация : система переводит шаблон в уникальный код. Этот код задает каждому шаблону набор чисел, представляющих особенности и черты лица.
  • Сопоставление : если снимок в 3D и база данных содержит трехмерные изображения, сопоставление пройдет без изменений снимка. Но если же база данных состоит из двумерных снимков, трехмерное изображение раскладывается на разные составляющие (словно сделанные под разными углами двумерные снимки одних и тех же черт лица), и они конвертируются в 2D-изображения. И затем находится соответствие в базе данных.
  • Верификация или идентификация : в процессе верификации снимок сравнивается только с одним снимков в базе данных (1:1). Если целью же стоит идентификация, снимок сравнивается со всеми снимками в базе данных, что приводит к ряду возможных совпадений (1:N). Применяется тот или иной другой метод по необходимости.

Где используются системы распознавания лиц?

В прошлом системы распознавания лиц находили применение в основном в сфере правоохранения, поскольку органы использовали их для поиска случайных лиц в толпе. Некоторые правительственные учреждения также использовали подобные системы для безопасности и для устранения мошенничества на выборах.

Однако есть много других ситуаций, в которых такое программное обеспечение становится популярным. Системы становятся дешевле, их распространение растет. Теперь они совместимы с камерами и компьютерами, которые используются банками и аэропортами. Туристические агентства работают над программой «бывалого путешественника»: с ее помощью они проводят быстрый скрининг безопасности для пассажиров, которые добровольно предоставляют информацию. Очереди в аэропортах будут продвигаться быстрее, если люди будут проходить через систему распознавания лиц, сопоставляющую лица с внутренней базой данных.

Другие потенциальные применения включают банкоматы и терминалы выдачи наличных денег. Программное обеспечение может быстро проверить лицо клиента. После разрешения клиента банкомат или терминал делает снимок лица. Программное обеспечение создает отпечаток лица, защищающий клиента от кражи личных данных и мошеннических транзакций, - банкомат просто не выдаст деньги человеку с другим лицом. Даже ПИН-код не потребуется.

Сен 6, 2018 Геннадий

Открыл новую эпоху. Технология распознавания лиц - основная его «фишка». И никто не сомневается в том, что такой способ разблокировки будет внедряться и во многие другие смартфоны.

Ещё в 1960-ых годах проводились специальные опыты, в ходе которых компьютер должен был научиться распознавать лицо человека. Тогда это ни к чему не привело, так как любая эмоция приводила к сбою. Также изобретенная система боялась изменения условий освещения.

Лишь в самом конце XX века появились системы, которые научились определять лица людей по фотографиям, запоминая их. При этом они перестали сбоить при появлении усов, бороды, очков и прочих «помех». Активнее всего подобные системы начали внедряться в цифровые фотоаппараты. Также они нашли себе место в охранном секторе.

У систем распознавания лиц долгое время был один существенный недостаток. Они сильно зависели от освещения и ракурса. Впрочем, в охранных сканерах эта проблема не была заметна. К ним лицо прикладывалось почти вплотную, освещаясь затем лампами. Избавиться же от вышеупомянутого недостатка помогло внедрение стереосъемки. Две камеры понимают глубину сцены, в связи с чем точность показаний вырастает в несколько раз.

Как работает технология распознавания лиц?

Постепенно новая функция начала появляться в смартфонах. Здесь биометрическая идентификация пользователя внедряется для того, чтобы разблокировать устройство не мог посторонний человек. В идеале получить доступ к персональной информации может только близнец. Переживать по этому поводу не стоит. Вряд ли кто-то будет всерьез скрывать что-то от родного брата или сестры. Да и никто не мешает установить для чтения каких-то особо секретных данных дополнительный пароль.

Работу системы распознавания лиц в смартфонах можно условно разделить на четыре этапа:

  1. Сканирование лица. Оно осуществляется при помощи фронтальной камеры или, как в случае с iPhone X, специального сенсора. Сканирование является трехмерным, поэтому фокус с показом фотографии срабатывать не будет.
  2. Извлечение уникальных данных. Система ориентируется на набор особенностей сканируемого лица. Чаще всего это контуры глазниц, форма скул и ширина носа. В продвинутых системах также могут «замечаться» шрамы.
  3. Извлечение из памяти шаблона с ранее полученными данными.
  4. Поиск соответствий. Финальный этап, на котором система решает, разблокировать ли дисплей. Мощности современных процессоров позволяют тратить на «размышление» всего доли секунды.

Функция распознавания лиц может быть реализована даже при помощи фронтальной камеры - лишь бы она имела два объектива. Однако в таком случае работа данной функции окажется нестабильной. Дело в том, что лишь специальные датчики обеспечат сканирование лица даже в темноте, тогда как «фронталке» требуется яркое освещение. Также особые датчики виртуально выводят на лицо большее количество точек, поэтому они срабатывают даже при появлении бороды, очков и других помех. Словом, в каком-нибудь DOOGEE Mix 2 система точно будет работать заметно хуже, чем в iPhone X. Другое дело - юбилейный продукт Apple стоит гораздо дороже, чем все остальные смартфоны с функцией распознавания лица.

За технологией будущее?

Нужные для сканирования лица датчики требуют идеальной установки. Сдвиг на сотые доли миллиметра приведет к тому, что работа функции перестанет быть идеальной - поэтому при производстве смартфона может наблюдаться повышенный выход брака, а это приводит к росту его стоимости. Да и сами датчики стоят весьма дорого, неспроста их использует только компания Apple, хотя никаких патентов на них у неё нет.

Одним словом, пока функцию распознавания лиц производители «андроидов» будут реализовывать посредством фронтальной камеры. Уже сейчас её можно встретить в Samsung Galaxy S8 и Note 8. Но владельцы этих устройств подтвердят вам, что работает она не лучшим образом - легче использовать сканер отпечатков пальцев . Поэтому пока о будущем функции ничего сказать нельзя. Нужно ждать, будет ли Apple внедрять соответствующие датчики в более доступные смартфоны, а также появятся ли они в устройствах на базе Android.

Заключение

Переживать по поводу сохранения ваших идентификационных данных не стоит. Созданный при сканировании лица шаблон находится в отдельном разделе памяти - чтение этого сектора компьютером или сторонними программами невозможно. Впрочем, это касается и отпечатков пальцев. А каким видом идентификации пользоваться удобнее - это выбирать только вам.

Держали ли вы когда-нибудь в руках смартфон, умеющий распознавать лицо? И ждете ли вы массового внедрения данной функции? Поделитесь своим мнением в комментариях, мы будем этому рады!



Похожие публикации