Нейросеть распознает лица с любых ракурсов Благодаря измерению глубины изображения
Как сообщает ТАСС, сотрудники ЮУрГУ обучили нейросеть VGGface распознавать так называемые 2,5-мерные изображения. Обычные системы распознавания лиц работают с плоскими — двумерными — изображениями. Компьютер видит матрицу из пикселей и выделяет в ней черты лица, но если лицо находится далеко от камеры или слишком близко к ней, нейросеть может выдать ложный результат.
То же самое будет, если лицо повернуто к камере под большим углом или освещение падает на него особым образом. Чтобы решить эту проблему, двумерную картинку заменили 2,5-мерной путем добавления глубины изображения. Для измерения глубины использована оценка искривления инфракрасной сетки.
«И уже от такого искусственного интеллекта людям, которые пытаются воспользоваться неудобными ракурсами, уйти не получается», — утверждает старший научный сотрудник Южно-Уральского государственного университета Алексей Ручай. Нейросеть распознает лица, расположенные даже под большим углом к камере.
Здесь мы рассказываем, как работает распознавание лиц в московском метро:
Использованные источники: Unsplash