您的位置: 主页 > 人工智能机器人 > 保福寺法拉利:一种基于PCA和HOG有遮挡的人脸识别方法

保福寺法拉利:一种基于PCA和HOG有遮挡的人脸识别方法

时间: 2019-08-09阅读:

摘要:随着对深度学习的继续深入研究应用,在受控环境下的人脸识别取得了比较理想的结果。但在真实环境下如有遮挡条件下的人脸识别仍存在识别效率低、识别时间长等问题,准确度也有待提高。本文提出一种在有遮挡条件下工作的新型人脸识别方法。该方法使用基于多尺度的梯度直方图进行特征提取,并使用PCA白化空间进行分类。为了显示算法的效率,除了收集的数据库外,还在FERET数据库上进行了测试。

关键词:人脸识别;遮挡;主成分分析;梯度直方图

中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2019)04-0171-03

Abstract:With the deep research and application of deep learning, face recognition in controlled environment has achieved ideal results. However, in the real environment, if there is a problem of low recognition efficiency and long recognition time for face recognition throwing under occlusion conditions, the accuracy needs to be improved. This paper proposes a new face recognition algorithm that works under occlusion conditions. The algorithm uses feature gradients based on multi-scale landmarks for feature extraction and classification using PCA whitening space. In order to show the efficiency of algorithm, in addition to the database collected, it was also tested on the FERET database.

Key words:Face Recognition;Occlusion;PCA;HOG

1 引言

人臉识别是计算机视觉领域一个重要的研究方向,并且有很多应用,如身份确认、执法、视频监控、安全系统等。虽然围绕这一领域有许多研究,其准确性、效率、稳定性等都在不断提高,但仍面临很多困难。在受控环境下,多为正面姿态,并且背景比较单一。即使目前一些方法在一些标准数据库中取得了较为理想的结果,但在实际应用中,其结果仍未达到我们的期望要求。在真实和不受控制的环境下,人脸识别必须涵盖所有场景,如姿势变化,低分辨率,面部表情,光照变化,模糊和遮挡等[1-2]。此外,面部识别系统必须具有可接受的运行时间才能实现,但受控环境下运行良好的人脸识别算法,由于训练图像和要识别图像间的数据偏移,在真实环境下往往效果不佳。我们无法解决所有场景下的挑战,本文将重点解决有限遮挡人脸识别。

本文提出一种具有高精度和最小运行时间的实用人脸识别方法。该方法使用基于多尺度梯度直方图和PCA白化空间,为了显示方法的最终性能,我们收集了一些相关数据库进行测试。

2 方法步骤

为了描述我们的方法,该方法分为5个步骤:面部检测,面部对齐,面部预处理,特征提取和分类。

2.1 面部检测

人脸识别系统的第一步是面部检测。与检测相关的两个最重要的因素是人脸区域提取和人脸区域外冗余和干扰信息的去除。我们使用DLIB库检测器作为人脸区域识别的检测器。

2.2 面部对齐

由于人脸识别中的高类内差异,人脸对齐可以有效地提高人脸识别系统的准确性。在这一部分中,首先,使用文献[3][4]对面部标志进行了特征点定位。然后,每个面部基于眼睛角落对齐,眼睛的位置是固定的。最后为了使每个面都对称,我们使用[5]中的描述算法对图片进行拉伸。该算法在姿势变换有限时,效果比较明显。

2.3 脸部预处理

在实际系统中,噪声和阴影都会让成像效果变差或者姿势或遮挡区域等的变化,从而使图像失真。为了克服这些失真,我们使用高斯差分(DoG)作为带通滤波器。通常,噪声会在图像中添加一些高频因子,而阴影会增加一些低频因子。尤其是当图像被这两个因素扭曲时,作为带通滤波器的DoG滤波器效果明显。

2.4 特征提取:基于多尺度的梯度直方图

在每个面部图像中,主要信息都在强度变化的地方。因此,面部梯度可以在移除偏移的同时保留必要的信息。梯度直方图在不保留局部信息的情况下很有效,然而为了使在面部变化下更具鲁棒性,可将面部图像划分为一些块,每个块的直方图都被计算为特征。定向梯度直方图(HOG)可以完成类似的任务[7]。虽然这种特征提取方式在图像特征点定位和变化方面是具有鲁棒性的,但是每个块的大小选择仍然是一个问题。较大的块会使面部变化更有鲁棒性以及可以减少特征点的丢失。因此,在本文中,我们使用多尺度梯度直方图来保持两个细节,如图1所示。

另一方面,在面部识别中,描述诸如眼睛或眉毛角的特征点是非常重要的,通常,这些点被称为面部标志,其中它们的位置由于诸如姿势变化和表情及遮挡位置变化而改变。因此,为了对这些变化具有鲁棒性,我们可以在地标位置上找到所有梯度直方图块。图块位置位于基于新的表达条件而改变的界标上。以这种方式,可以将所有界标描述为在表达的每个条件中具有关键识别信息的点,如图1所示。

换句话说,在本文中,我们在面部标志上使用多尺度块中的梯度直方图来提取面部特征。 这种特征提取有三个主要优点:1)能多尺度的描述关键特征点;2)能够应对多种变化;3)计算简单并且速度快。

2.5 面部分类:PCA白化空间

3 实验结果

为了显示我们提出的方法的性能,我们应用了两个数据库:FERET数据库和本文收集的数据库。我们的系统与四个众所周知的Eigen faces[8],Fisher faces[9],基于稀疏的方法(SRC)[10]和叠加线性表示分类器(SLRC)[11]进行了比较。

为了学习矩阵[U]和[D],使用其他数据库,其中图像总数为3304,梯度直方图提供8个区间和3个尺度,计算每个面内51个标记。因此特征尺寸为51×3×8 = 1224。

来自FERET数据库的所提供的数据库包括497个图库图像(每个主题的单个图像)和1329个探测图像,其中所有探测图像姿势在-20到+20度之间并且它们处于诸如表达变化的一些变化之下。

本文收集的另一个数据库包含15个图库图像(每个主题单个图像)和2300个探测图像,其中所有探测图像姿势在-20到+20度之间,并且它们处于有限遮挡条件下,这提供了真实和有挑战的数据库。

如表1和表2所示,当有限遮挡的情况下,本文所述的方法具有更好的准确性。另外如图所示,SRC的准确性不是很高,因为字典的大小不大(每个主题的单个图像)。换句话说,在实际条件下,图库中每个主体大多有单个图像,在这种情况下,SRC无法提供正确的结果。

此外,在表3中,比较了所有五个系统的运行时间。值得注意的是,因为前三个步骤(检测,对齐和预处理)彼此相同,所以在运行时不考虑这三个步骤。此外,运行时是在同一运行系统上实现的。平均运行时间是指在FERET数据库中查找图库图像并进行探测图像的时间。

4 结论

本文提出了一种人脸识别算法,该算法主要针对有限遮挡人脸识别。为此,使用基于多尺度的梯度直方图和PCA白化空间。最后,为了显示结果,系统在FERET数据库和本文收集的其他数据库上进行了测试,结果表明,我们的方法在有限遮挡条件下具有适当的结果。

参考文献:

[1] Y. Su, Robust Video Face Recognition Under Pose Variation[J]. Neural Processing Letters, 2017:1-15.

[2] H. T. Ho and R. Chellappa.Pose-invariant face recognition using markov random fields[J]. IEEE transactions on image processing, 2013,22(4):1573-1584,.

[3] D. E. King, Dlib-ml: A machine learning toolkit[J]. Journal of Machine Learning Research, 2009(10):1755-1758.

[4] V. Kazemi and J. Sullivan.One millisecond face alignment with an ensemble of regression trees[J]. in Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2014.

[5] C. Sagonas, Y. Panagakis, S. Zafeiriou and M. Pantic, Face frontalization for Alignment and Recognition[J]. arXiv preprint, 2015.

[6] 周孝佳,朱允斌,張跃.基于分块的有遮挡人脸识别算法[J].计算机应用与软件,2018,35(2):183-187.

[7] N. Dalal and B. Triggs.Histograms of oriented gradients for human detection[J]. in Computer Vision and Pattern Recognition, IEEE Computer Society Conference on, 2005.

[8] M. A. Turk and A. P. Pentland.Face recognition using eigenfaces[J]. in Proceedings IEEE Computer Society

Conference on Computer Vision and Pattern Recognition,Maui, HI, 1991:586-591.

[9] P. N. Belhumeur, J. P. Hespanha and D. J. Kriegman.Eigenfaces vs. Fisherfaces: recognition using class specific linear projection[J]. in IEEE Transactions on Pattern Analysis and Machine Intelligence, 1997,19(7):711-720.

[10] J. Wright, A. Y. Yang, A. Ganesh, S. S. et al.Robust Face Recognition via Sparse Representation[J]. in IEEE Transactions on Pattern Analysis and Machine Intelligence, 2009,31(2):210-227.

[11] W. Deng, J. Hu and J. Guo.Face Recognition via Collaborative Representation: Its Discriminant Nature and Superposed Representation[J]. in IEEE Transactions on Pattern Analysis and Machine Intelligence, 2017(99).

【通联编辑:唐一东】

上一篇:功夫派能量井:基于网络集中控制技术的智能多媒体教室系统探索
下一篇:没有了

相关阅读