一文看懂人脸识别(4个特点+4个实现步骤+5个难点+算法发展轨迹)
人脸识别是身份识别的一种方式,目的就是要判断图片和视频中人脸的身份时什么。本文将详细介绍人脸识别的4个特点、4个步骤、5个难点及算法的发展轨迹。
什么是人脸识别?
人脸识别是 计算机视觉- computer Vision 领域里很典型的应用。
人脸识别的目的就是要判断图片和视频(视频是由图片构成的)中人脸的身份是什么。
人脸识别是身份识别的一种,它跟身份证识别、指纹识别、虹膜识别都是相似的。可以将人脸识别和大家熟悉的身份证做对比:
- 录入信息(开通身份证 – 录入人脸信息)
- 将信息存入数据库(身份证信息 – 人脸信息)
- 当需要验证身份时,将新采集信息和数据库信息作比对(扫身份证 – 刷脸)
人脸识别有4个特点
人脸识别和其他身份识别相比,有4个特点:
- 便捷性。人脸是生物特征,不需要携带类似身份证的东西
- 非强制性。识别的过程甚至不需要对象的配合,只要拍摄到人脸就可以进行识别,例如安防领域就是如此。
- 非接触性。不需要跟设备进行接触,相比指纹更加安全一些。
- 并行处理。一张照片里有多个人脸时可以一起处理,不像指纹和虹膜,需要一个一个来。
基于以上特点,人脸识别正在被广泛的应用在各个领域。大家在生活中随处都可以看到人脸识别的应用。
人脸识别的 4 个步骤
人脸识别的过程中有4个关键的步骤:
- 人脸检测
- 人脸对齐
- 人脸编码
- 人脸匹配
下面详细说明一下这4个步骤。
人脸检测
人脸检测的目的是寻找图片中人脸的位置。当发现有人脸出现在图片中时,不管这个脸是谁,都会标记出人脸的坐标信息,或者将人脸切割出来。
可以使用方向梯度直方图(HOG)来检测人脸位置。先将图片灰度化,接着计算图像中像素的梯度。通过将图像转变成HOG形式,就可以获得人脸位置。
人脸对齐
人脸对齐是将不同角度的人脸图像对齐成同一种标准的形状。
先定位人脸上的特征点,然后通过几何变换(仿射、旋转、缩放),使各个特征点对齐(将眼睛、嘴等部位移到相同位置)。
人脸编码
人脸图像的像素值会被转换成紧凑且可判别的特征向量,这也被称为模板(template)。理想情况下,同一个主体的所有人脸都应该映射到相似的特征向量。
人脸匹配
在人脸匹配构建模块中,两个模板会进行比较,从而得到一个相似度分数,该分数给出了两者属于同一个主体的可能性。
人脸识别的 5 个难点
人脸图像在现实世界中的呈现具有高度的可变性。所以人脸识别也是最有挑战性的生物识别方法之一。人脸图像可变的地方包括:
- 头部姿势
- 年龄
- 遮挡
- 光照条件
- 人脸表情
人脸识别算法的发展轨迹
人脸识别领域,也是从传统机器学习算法过度到深度学习算法的。
传统机器学习算法
在机器学习阶段,人脸识别也经历了3个重要的阶段:
- 几何特征阶段
- 表象特征阶段
- 纹理特征阶段
深度学习算法
在深度学习阶段,算法的发展也同样经历了3个阶段:
- 从最开始的 VGG 网络到 Inception 网络再到 Resnet 网络,网络模型总体上呈现出更深,更宽的趋势。
- 旷视、商汤为代表的在学术公开竞赛中取得好成绩的这些厂商,开始发展实际业务为起点,通过不断扩大他们的实际数据集合,算法性能也在逐渐的提升。
- 进一步增加数据量以提升算法性能以外,与第一阶段相反,大家开始在不降低识别性能的基础上,研究网络的轻量化。轻量化的主要目的有两个,一个是提升算法的速度,甚至能够部署到移动端;另外一个就是便于硬件实现,从而将人脸识别算法直接做成一个硬件模块。
想要详细了解不同阶段的技术细节,可以看这篇文章《 一文看懂人脸识别技术发展脉络 》
人脸识别的典型应用
人脸识别的应用变得越来越广泛,只要跟身份识别相关的未来都有可能使用人脸识别。下面列几个典型的应用场景。
- 门禁系统
- 安防系统
- 无人超市
- 电子护照及身份证
- 自主服务系统(如ATM)
- 信息安全系统,如刷脸支付
- 娱乐型应用,如抖音里的部分道具
本文首发自easyAI,原位地址:《 一文看懂人脸识别(4个特点+4个实现步骤+5个难点+算法发展轨迹)》