使用特征反馈的模式识别:在人脸识别中的应用

更新时间:2023-09-12 04:26:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

International Journal of Control, Automation, and Systems (2010) 8(1):141-148 DOI 10.1007/s12555-010-0118-7 http://www.springer.com/12555

使用特征反馈的模式识别:在人脸识别中的

应用

Gu-Min Jeong, Hyun-SikAhn, Sang-Il Choi*, NojunKwak, and Chanwoo Moon

摘要:本文提出了一种新的使用特征反馈的模式识别的方法,并且展示了它在人脸识别中的应用。传统的模式识别的方法是使用PCS、LDC等提取特征并且应用于分类。另一方面,本文提出的方法能使体悟的数据在原始空间中被分析(使用特征反馈)。通过从提取的特征到原始空间的逆映射,我们可以分辨出原始数据中影响分类的重要部分。通过这种方式,我们可以将数据优化以获得更高的分类率,使之更简洁或简化需要的感知器。为证实本文提出的方法的实用性,我们利用耶鲁人脸数据库将其运用在人脸识别中。每一张人脸都使用特征反馈分为两部分——重要部分和非重要部分。另外,我们将人脸识别与图像压缩相结合。实验结果证明了本文提出的方法行之有效。

关键词:特征反馈;特征提取;人脸识别;特征模板;JPEG压缩

1. 引言

模式识别在理论上的挑战和在人脸识别【1-3】、指纹识别【7】和气体识别【8,9】中的应用使其受到了广泛的关注,因此,在过去的几十年,许多模式识别的方法被提出来。某些模式识别的方法致力于减少输入数据样本的维数【4,5,10,11】。为了提高分类率,传统的特征提取方法使用PCA【2】和LDA【11】,新的特征从基于统计和映射到较低维数的样本空间的输入数据样本中提取出来。

但是,模式识别面临的实际问题绝大多数在于输入变量数过大。例如,一幅图像有上万个像素,在很多情况中,将所有的像素用于人脸识别是十分冗余且困难的。因此,如果可以只分析输入变量中的重要部分,识别过程可以变得更高效,并且识别结果可以更精确。

基于以上现实,现有的一些研究专门致力于图像识别中的像素选择问题。Pang等人【14】提出了使用Gabor-LDA的判别式像素选择法[18]。Kokiopoulou和Frosssard【15】将采样过程看作一种监督特征选取问题。在文献【16】中,判别式像素是基于从NLDA

中获得的阶向量选取的【6】。

本文提出了一种新的使用特征反馈的模式识别方法,并且介绍了它在人脸识别中的应用。我们通过从特征空间到输入空间的逆映射来概括特征选取的方法。另外,为了更有效地使用图像数据(就数据大小而言),我们将图像压缩方法与人脸识别结合起来。

首先,我们通过用特征反馈获得的特征模板中选取的像素将图像分类。通过从使用特征反馈获得的特征模板中选取的像素空间将图像分类。通过把提取的特征映射到输入空间,我们可以估计每一个变量(图像中的像素)的相对重要性。为了实现这个目的,我们分析了特征空间和输入变量的关系。我们首先通过线性判别式提取了人脸图像的特征空间【3】,之后使用特征反馈区分了与特征相关的区域。我们从与特征相关的区域内获得特征模板,并将其用于图像的分类。 其次,我们根据像素相关的重要性压缩图片并且使用压缩的图片来完成人脸识别。跟容貌相关的区域——在分类中占据重要的部分,这部分被高质量的压缩而其他部分则被低质量压缩。通过这种基于JPEG技术的自适应压缩技术【19】,我们可以实时性地降低图片尺寸以及增强图片重要部分。这

个技术在例如数据获取、存储、处理和传输LDA的目标函数表达如下:

的高维度的数据管理中是很有优势的。最后,使用基于识别手段的方法将压缩的图片根

据容貌分类。通过实验,我们发现这个方法

虽然使结果数据的存储尺寸减小了,但识别率却高于那些通过提取原始数据的方法。

这篇文章的余下部分将在后面呈现。在第二部分,简要地回顾了相关的工作。特征反馈将在第三部分讲出,其在人脸识别方面的应用则在第四部分展现。第五部分描述实验结果以及第六部分做出结论。

2.相关工作

2.1 主要成分分析(PCA)

如果给定一个图形样本是维的,则该图像可以用n维向量空间内的每一个点来描述,其中这个向量空间通常被称作为输入空间或者图形空间。由于图形空间往往是一个高维度的空间,直接处理样本图形会导致相当巨大的计算负担。PCA方法是最流行使用最广泛的方法之一,这个方法在减少原始数据维度使其到达可以操控的尺寸中是非常有效的【2】。我们假设一系列N个图形样本,映射到n维图形空间中。然后PCA方法在样本空间内找到一组最好的映射向量,这组向量将会使所有的图形的整体离散度矩阵最大化。PCA的目标函数写作:

(1)

代表整体离散度矩阵,

是整个训练样本集的平均值。的列向量

是映射向量,被称为

Eigenface。

2.2线性判别式分析(LDA)

线性判别分析(LDA)最开始是针对监督学习发展起来的,特别用于分类和识别的问题,来寻求最佳的线性判别函数。然后,LDA方法在潜在空间中搜寻区分度最好的向量。这个方法的实现源于能够实时地使间内离散度矩阵的行列式最大化,以及使类内离散度矩阵的行列式最小化【3】。这意味着那些属于同一类别的样本被集中在一个小区域,并且每个区域之间隔得很开。

(2) 训练集合包含C类,并且每一类Ci中均含有样本Ni,

的定义为:

(3)

是类的平均值,并且使隶属于该类的一个样本。

的一系列广

义特征向量并且和最大广义特征值相一致,这可以通过的特征向量计算得到。注意带这里有最多c-1个非零特征值,所以m的上限是c-1.可是,由于输入空间的维数远大于使用的样本,(3)中的变得奇怪,这就是所谓“小样本尺寸问题(SSS)”【10】。为了避免这种SSS问题,我们首先使用PCA方法将输入空间的维度减小到跟

的秩一样,然后使用LDA方法减小维度使

。所以,给出

(4)

其中

(5)

的列向量是映射向量,被称为

Fisher脸。特征向量可以被如下线性转换:

(6)

的列向量

是特征空间的基。图1分别表现了用PCA和PCA+LDA方法从耶鲁人脸数据库【17】中提取的Eigenface和Fisherface。

3. 特征反馈

我们首先从一系列图形样本中提取特

征,然后将其再次反馈到图形样本中去。基于反馈的信息,每个样本被分成两个区域:重要的和非重要区域。

图形样本中的每一个值代表图形中第i个像素的灰度值。令为通过第二节描述的特征提取方法获得的映射向量,并且w可以是Eigenface也可以是Fisherface。表示输入空间第i个单元的坐标向量。然后, 和第l个特征向量可以在n维输入空间中用一组方向向量的线性组合来表示:

的每个组成元素

作为一个参照将图形分成两个不同的区域。的值是在输入空间中为了组成而增加到第i个方向向量上权重的总数。这说明的绝对值大小表明输入空间的第i个方向向量有多少组成了特征空间的基。因此,当的值大于预先设定的临界值T,则说明包含了第i个组成元素(图像中第i个像素点)的区域时重要区域,反之则为非重要区域。

我们首先通过有最大特征值的第一个Eigenface来辨别出一块重要区域。如图2所示,通过基于能最好地表现样本离散的PCA来辨别区域,大部分非脸部区域例如背景和一些相对无关的区域在样本离散中被剔除掉。我们针对平均值设定了一个临界值。图2表明那些被分成两个区域的图像都是根据相对应的值。在图2中,

在Eigenface中,白色的像素点被看做比黑色的更重要。然后,为了在人脸图像中获取对分类有用的区域,我们选取基于Fisher脸的像素点。同样的,我们可以根据每一个Fisher脸来定义重要区域。通过合并每一个重要区域,我们可以获得最终的“模板脸”或者“特征模板”,这都是对于分类很重要的区域。

详细的特征反馈步骤总结如下:

1. 使用PCA提取表示数据离散的有用的特征。我们将第一个Eigenface分成两部

分,EI和EU。EI和EU根据Eigenface的组成部分分别被看做重要和非重要部分。然后我们可以按如下方式分割Eigenface:

(7)是设定的的平均值。根据(7),我

们获取EigenfaceEI这一部分。

2. 使用PCA+LDA提取判别特征。考虑到特

征值的分布,我们选择Fisherface

相对应的最大特征值。我们将每个Fisherface分成两部分,和。在这里,和分别被看做第一个Fisherface中的重要和非重要部分。将定义成第一个Fisherface的临界值。然后我们将第一个Fisherface分割如下:

(8)根据(8),我们可以获取分段的Fisherface

。 3. 我们将分段的Fisherface

组成“模板脸”或者“特征模板”。“特

征模板”

使用如下公式获得:

(9)

是每一个Fisherface的权重。

4. 使用进行分类。

执行分类是使用上述提出的方法基于Fisherface的数量的临界值,以及合并的方式。这些参数的选择同样也是基于应用的。

4. 在人脸识别方面的应用

在这个部分,我们将上述的方法应用于人脸识别方面。在反馈阶段,用于特征反馈的特征都是用PCA和PCA+LDA获取的。首先,我们采用前面章节描述的流程构建特征模板。在分类阶段,测试图像就是用这种特征

模板进行分类的。同时,在用于人脸识别的特征图像建模方面也使用了图像压缩。 4.1采用特征反馈的人脸识别

如图3所示,我们首先采用特征反馈建立特征模板。然后,从模板图像中提取用于人脸识别的特征。采用特征反馈的人脸识别的详细流程如下:

Step1在通过(7)采用

提取分段的

图像后,在反馈阶段采用PCA+LDA方法提取用于特征反馈的有区分度的特征。在所有产生于PCA+LDA方法的c-1个Fisherface中,我们基于图4中特征值的分布,选取可用于特征反馈的Fisherface。在这篇文章中,我们采用了三个最大的特征值相对应的Fisherface。

Step2我们将每个Fisherface分成两部分,和。在这里,和在第l个Fisherface中被分别看做重要的和非重要部分。定义和T为的平均值和临界值。然后,我们将第l个Fisherface分割如下:

(10)根据(10),如图3所示,我们获得分

段的Fisherface和。 Step3我们通过这三个分段的Fisherface构架最终的特征模板。如图3所示,采取或运算,我们可以获取特征面具。特征面具中的白色像素点可看做在人脸图像中用于分类的重要像素点:

(11)

Step4我们按照图5的方式进行分类。通过特征面具获取的被选像素点在分类中被当做输入。

在分类中的那些重要像素点是在特征面具的形式下被选出来的。只有通过特征面具选出来的像素点才可用于分类。这提升了分类的效率,在第五部分的实验中有提到。

4.2采用特征反馈的人脸识别

在这个子章节中,我们介绍使用特征反馈的区域差别JPEG压缩技术。根据特征模板,分类采用的重要区域是高质量压缩的而剩下区域则是低质量压缩的。采用局部不同质量的压缩对于数据的存储和传输十分有效率,因为重要的信息得到保护,而冗余的信息则被剔除。通过区域差别JPEG压缩技

术,每像素的比特数(bpp)将得到减小。 如图6所示,采用JPEG压缩人脸图像,图像被分成8*8的方格。图像的重要部分采用高质量压缩而其他部分采用低质量压缩。根据这个,分类采用跟step3里面同样的特征面具。图7展现了使用区域差别的JPEG压缩技术的完整过程。

5.实验结果

5.1采用特征反馈的人脸识别

我们采用本文提出的方法,对耶鲁人脸

数据库的数据进行处理来评估这个方法。耶鲁数据库包含15类165种灰色图像,包括不同的脸部表情,戴或者不戴眼镜,在不同光线条件下的图像。这些照片中,每个眼睛的中心都被重新定位并且眼睛都被旋转了使得都能在同一水平线上,就像文献【18】中提到那样。每一张人脸图像都被重新裁剪调节使得每个眼睛都能位于120*100像素图片的一个固定位置。然后,直方图的均等化

将用于重新调节图像,使产生的像素点规范化使其带有零平均值和单位方差。图8展现了耶鲁数据库中11个在各种条件下的示例图片。

这11个有效的图像用来评估针对耶鲁数据库的图像的处理方法。在这个方案里面,来自于不同主题的图像随机被选取作为测试,而剩下的图像则用于练习。另一方面,如果训练集中有150张图片其中有15张用于研究。这个实验重复了11次,所以使得每张图片都在研究中出现了一次。对于分类而言,PCA+LDA方法用于特征提取,近邻法用作L2距离的量度标准的分类器。这表明PCA+LDA方法是众所周知的,但却不是最好的一个。

好的特征提取方法的选择不在这篇文章讨论的范畴之类;我们的侧重点在于如何有效的选取像素点,在人脸识别那一节提到过。因此,使用其他特征提取方法进行分类是可能的,并且既定的方式也是可以用于那些新方法的。

因为在不同的缩放比例下人脸图像的信息是不同的,所以识别的过程仍然和这个照片如何剪裁有关。因此,我们采用既定的

方式将两组图片剪裁成不同的缩放比例。第一组图,如图8(a)所示,包含的是比原始图片缩小了的图片,而8(b)中则是剪裁使人脸更近的放大图片,移除了背景和头发。 采用该方法进行试验,我们使用前三个Fisherface,然后分别按照图4和5中所描述的步骤进行分割和分类。为了找到合适的临界值T,我们采用不同的临界值来进行该方法。表1展现了不同的临界值下特别维度的特征空间的分类率的平均值。从表1的结果看出,我们对缩小的图片的临界值定为0.011,放大的图片为0.002。表1还呈现了不同维度的特征空间中,原始图片的识别率

和用本文提出的方法获取的模板图片的

识别率。在表2中,对于放大和缩小的两种图片而言,的平均识别率分别比高4.0%和2.0%。

5.2区域差别JPEG压缩技术(RDJC)

图9展现了缩小和放大图片的分块区域。表3展现了这些图片的bpp(比特每像素)。8比特的bmp文件,bpp的值为8。对于一个JPEG文件,缩小和放大的图片的bpp值分别为2.125和1.897。使用区域差别的JPEG压缩技术(RDJC),缩小和放大的图片的bpp值分别为1.703和1.825。

图10展现了用区域差别的JPEG压缩技术处理的图像。缩小的图片经过高质量,低质量,RDJC处理过的PSNR(峰值信噪比)分别为36.4,29.3和30.4dB。图11展现的是基于不同数量的特征, 和的分别的识别率。在图11中我们看到,虽然通过RDJC技术处理后,的存储大小比

和要小,但在几乎所有数量的特征中均好于,并且能够达到与相匹配

的识别率。

6.总结

本文提出了一种新的使用特征反馈的模式识别方法,并且介绍了它在人脸识别中的应用。通常,模式识别方法关注于特征提取。但是在本文中,我们关注于原始域中重要部分的选择。通过从提取的特征到原始空间的逆映射,我们分辨出影响分类的原始数

[5] P. J. B. Hancock, A. M. Burton, and V. Bruce, “Face processing: human perception and principal component analysis,” Memory and Cognition,vol. 24, no. 1, pp. 26-40, 1996.

[6] H. Cevikalp, M. Neamtu, M. Wilkes, and A. Barkana, “Discriminative common vectors for face recognition,”IEEE Trans. Pattern Anal. Mach. Intell.,

据中的重要部分。这是我们能够提高识别率,vol. 27, no. 1, pp. 4-13, 2005. 因为那些可能成为干扰的不必要的信息被剔除了。使用本文提出的方法能够优化数据,从而获得更高的分类率、使数据更简洁或者减少传感器阵列中所需的传感器数量。为了证实本文提出的方法的可应用性,我们将它应用到基于PCA+LDA的人脸识别中,它还可以应用于其他的用于分类的特征提取问题中。首先,我们使用特征反馈选取与特征有

关的区域,并且利用特征相关的像素建立特征模板。然后,我们利用从每一幅图像的特征模板中选取的像素来进行人脸识别。再者,我们提出了区域差异JPEG编码来提高效率。我们通过使用耶鲁人脸数据库的实验结果,证明使用我们提出的方法能提高分类率,并且使用RDJC能够降低数据率。

在本文提出的方法中,我们需要一种更加系统化的算法来决定门限值、T的值、Fisherface的数量以及Fisherface之间的合并准则。这些都是未来研究的目标。

参考文献

[1] A. K. Jain, R. P. W. Duin, and J. Mao, “Statistical pattern recognition: a review,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 22, no. 1, pp. 4-37, 1989. [2] M. Turk and A. Pentland, “Eigenfaces for recogni-tion,” J. Cognitive Neurosci.vol. 3, no. 1, pp. 71-86, 1991.

[3] P. N. Belhumeur, J. P. Hespanha, and D. J.Kriegman, “Eigenfaces vs. fisherfaces: recognition using class specific linear projection,” IEEE Trans. Pattern Anal. Mach. Intell., vol. 19, no. 7, pp. 711-720, 1997.

[4] J. W. Lu, K. N. Plataniotis, and N. Venetsanopoulos, “Face recognition using LDA-based algorithm,” IEEE Trans. Neural Netw., vol. 14, no. 1, pp. 195-200, 2003.

[7] D. Maio and D. Maltoni, “A structural approach to fingerprint classification,” Proc. of Int’l Conf. Pattern Recognition, vol. 3, pp. 578-585, 1996.

[8] P. Althaniz, J. Goschnick, S. Ehrmann, and H. J. Ache, “Multisensor microsystem for contaminants in air,” Proc. of Int’l Conf.Solid-State Sensors and Actuators, vol. 1, pp. 699-702, 1995.

[9] Y. Yang, S. Ha, and Y. Kim, “A matched-profile

method for simple and robust vapor recognition in

electronic nose (E-nose) system,” Sensors and Actuators B, vol. 106, pp. 263-270, 2005. [10] A. Webb, Statistical Pattern Recognition, 2nd ed., Wiley, Chichester, UK. 2002.

[11] K. Fukunaga, Introduction to Statistical Pattern Recognition, 2nd ed., Academic Press, 1990. [12] R. C. Gonzales and R. E. Woods, Digital Image Processing, 2nd ed., Prentice Hall, 2002.

[13] S. Mahamud and M. Hebert, “Minimum risk distance measure for object recognition,”Proc. of IEEE Int’l Conf. Computer Vision, vol. 1, pp. 242-248, 2003.

[14] Y. Pang, L. Zhang, M. Li, Z. Liu, and W. Ma, “A novel Gabor-LDA based face recognition method,” Lecture Notes in Computer Science, vol. 3331, pp. 352-358, 2004.

[15] E. Kokiopoulou and P. Frossard, “Classification specific feature sampling for face recognition,” Proc. of IEEE Workshop on Multimedia Signal Processing, pp. 20-23, 2006.

[16] S.-I. Choi, C.-H.Choi, and G.-M. Jeong, “Pixel selection in a face image based on discriminant features for face recognition,” Proc. of IEEE Int’l Conf. Automatic Face and Gesture Recognition, pp. 1-6, 2008.

[17] Center for Computational Vision and Control, Yale

University,

The

Yale

Face

Database,

http://cvc.yale.edu/projects/yalefaces/yalefaces.html. [18] C. Liu and H. Wechsler, “Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition,” IEEE Trans. Image Process., vol. 11, no. 4, pp. 467-476, 2002. [19] G. K. Wallace, “The JPEG still-picture compression standard,” Commun. ACM, vol. 34, pp. 30-44, April 1991.

[20] X. Jiang, B. Mandal, and A. Kot, “Eigenfeature regularization and extraction in face recognition,” IEEE Trans. Pattern Anal. Mach.Intell., vol. 30, no. 3, pp. 1-12, 2008.

作者介绍(略)

本文来源:https://www.bwwdw.com/article/l4mh.html

Top