人脸识别论文(基于特征脸)陈立

更新时间:2024-05-08 20:38:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

人脸识别论文 (基于特征脸)

学生姓名: 陈立 学 号: 20107977 专业年级: 10级计算机科学与技术一班

摘 要

生物特征识别技术使用了人体本身所固有的生物特征,与传统的身份识别方法完全不同,具有更高的安全性、可靠性、和有效性,越来越受到人们的重视。人脸识别技术作为生物特征识别技术的重要组成部分,在近三十年里得到了广泛的关注和研究,已经成为计算机视觉、模式识别领域的研究热点。人脸识别在公共安全、证件验证、门禁系统、视频监视等领域中都有着广泛的应用前景。

本文是在人脸数据库的基础上做人脸特征提取和识别研究,主要内容如下: (1) 对人脸识别研究的内容、相关技术、主要实现方法及发展历程作了详细介绍。

(2) 介绍主成分分析法(PCA)、K-L变换,并利用特征脸方法实现了人脸识别。 (3)给出了基于matlab环境的编程及实验结果,并对结果进行分析。

关键词:人脸识别,特征脸,K-L变换,主成分分析

第一章 人脸识别概述

1.1 生物特征识别技术

生物特征识别技术是通过计算机利用人体所固有的生理特征或行为特征来进行个人身份鉴定。生理特征与生俱来多为先天性的;行为特征则是习惯使然,多是后天性的。我们将生理和行为特征统称为生物特征。常用的生物特征包括:指纹、掌纹、虹膜、视网膜、脸像、声音、笔迹等。

那么,生物特征识别技术是如何进行个人特征识别的呢?

生物鉴别的过程分成三个步骤:生物特征数据采样,生物特征提取和特征匹配。数据采样过程是通过各种传感器对生物特征进行原始数据采集的过程,生物特征提取过程则从传感器采集的数据中抽取出反映个体特性的信息(通常是某种数学上的编码过程),匹配阶段则是计算生物特征之间的相似性并进行排序和一致性判断的过程。

生物特征识别技术主要有人脸识别、指纹识别、语音识别、虹膜识别等。生物识别技术在上个世纪己经有了一定的发展,其中指纹识别技术己经趋近成熟,但人脸识别技术的研究目前还处于起步阶段。指纹、虹膜、掌纹等识别技术都需要被识别者的配合,有的识别技术还需要添置复杂昂贵的设备。人脸识别则可以用已有的照片或是摄像头远距离捕捉图像,无须特殊的采集设备,系统的成本低。并且自动人脸识别可以在当事人毫无察觉的情况下即完成身份确认识别工作,这对反恐怖活动等有非常重大的意义。由于人脸识别技术具有如此之多的优势,因此它的应用前景非常广阔,已成为最具潜力的生物特征识别技术之一。

1.2 人脸识别技术

所谓人脸识别,是指对输入的人脸图像或者视频,判断其中是否存在人脸,如果存在人脸,则进一步给出每张人脸的位置、大小和各个面部主要器官的位置信息,并且依据这些信息,进一步提取每张人脸蕴含的身份特征,并将其与已知人脸库中的人脸进行对比,从而识别每张人脸的身份。其研究内容包括以下五个方面:

(1)人脸检测 从不同的背景中检测是否存在人脸,并确定其位置、大小、形状、姿态等信息的过程。它关系到后续识别工作能否正确进行,并保障最终识别结果的可靠性。

(2)人脸表征 确定表示检测出的人脸和数据库中的已知人脸的描述方式。通常的表示方式包括几何特征(如欧氏距离、曲率、角度等)、代数特征(如矩阵的特征矢量)和固定特征模板等。

(3)人脸鉴别 即狭义的人脸识别,就是通常所指的将待识别的人脸与数据库中的已知人脸进行比较,得出相关信息。这一过程的核心是选择适当的人脸表示方式和匹配策略,系统地构造与人脸的表征方式密切相关。

(4)表情/姿态分析 即对待识别人脸的表情或姿态进行分析,并对其加以归类。 (5)生理分类 对待识别人脸的物理特征进行分类,得出其年龄、性别、种族等相关信息,或从几幅相关的图像中推导出希望得到的人脸图像,如从父母的脸推导出孩子的脸像等。

本论文中的人脸识别主要是指狭义的人脸识别,指将待识别的人脸与数据库中的已知人脸之间进行匹配的人脸鉴别。

人脸识别的目的是让计算机具有通过人脸的特征来鉴别身份的功能。基于人脸特征的身份识别主要设计到复杂场景中的人脸检测及识别技术,是一种依托于图像理解、模式识别及计算机视觉、统计学和人工智能等高技术的研究方向。

1.3 人脸识别的研究背景及意义

在人类社会的发展进入到21世纪的今天,安全问题已经成为困扰人们日常生活的重要问题之一。社会的发展促进了人的流动性,进而也增加了社会的不稳定性,使得安全方面的需求成为21世纪引起广泛关注的问题。不论是享受各项服务如网上冲浪、还是居家、办公等都涉及到安全,以往这些行为基本上是通过符号密码来进行安全保护,但是随着服务数量的不断增加,密码越来越多以致无法全部记住,而且密码有时也会被他人所窃取,各种密码被破解的概率越来越高,因为通常由于记忆的原因,人们经常会选用自己或亲人的生日、家庭地址、电话号码等作为密码并长期使用,这些很容易被一些不法分子获取。可见在现代社会中,身份识别已经成为人们日常生活中

经常遇到的一个基本问题。人们乎时时刻刻都需要鉴别别人的身份和证明自己的身份,以获得对特定资源的使用权或者制权,同时防止这些权限被他人随意的取得。传统的身份识别方法主要基于身份标识物(如证件、卡片)和身份标识知识(如用户名、密码)来识别身份,这在很长一段时期是非常可靠和方便的识别方法,得到了广泛的应用。但是,随着网络、通信、交通等技的飞速发展,人们活动的现实空间和虚拟空间不断扩大,需要身份认证的场合也变得无不在。人们需要携带的身份标识物品越来越多,身份标识知识也变得越来越复杂和冗长在这种情况下,传统身份识别方式的弊端日益彰显。身份标识物品容易被丢失和伪造,份标识知识容易被遗忘、窃取和破解,而身份标识的重要性又使得一旦失去了身份标识会给标识的所有者甚至整个社会带来重大的甚至难以弥补的损失。在美国,每年约有上百万的福利款被人以假冒的身份领取;每年发生的信用卡、ATM、移动电话和冒领支票等成的损失达数百亿美元[2]。面临着这样的状况,人们对身份识别的安全性、可靠性、准确和实用性提出了更高的要求,必须寻求身份识别的新途径。

于是,近年来人类生物特征越来越广泛地用于身份识别,而且生物特征可以更好的进行安全控制,世界各国政府都在大力推进生物识别技术的发展及应用。与原有的人类身分识别技术(如:个人密码、磁卡、智能卡等)相比,基于人类生物特征的识别技术具有安全可靠、特征唯一、不易伪造、不可窃取等优点。人类本身具有很多相对独特的特征,如DNA、指纹、虹膜、语音、人脸等。基于这些相对独特的人类特征,结合计算机技术,发展起众多的基于人类生物特征的人类身份识别技术,如DNA识别技术、指纹识别技术、虹膜识别技术、语音识别技术、人脸识别技术。

人脸识别和其他的生物识别比起来有以下几个优点:1、其他的生物特征识别方法都需要一些人为的行为配合,而人脸识别不需要。2、人脸识别可应用在远距离监控中。3、针一对现在的第一、二代身份证,每个身份证都有人脸的正面照片,也就是人脸库将是最完善的,包括人最多的,我们可以利用这个库来更直观、更方便的核查该人的身份。4、相对于其他基于生物特征识别技术,人脸识别技术具有特征录入方一便,信息丰富,使用面广等优点,同时人脸识别系统更加直接友好。人脸识别技术作为生物识别技术的一种,以其特有的稳足性、方便性、唯一性等特点被愈来愈多地应用于除安全问题外的各种身份识别领域。

人脸识别技术可应用于以下方面: 1.在安全防范领域中的应用

Markov链,体现为用具有限状态数的Markov链来模拟签名信号统计特征变化的隐

含的随机过程,另一个是一系列随机函数所组成的集合,体现为与Markov链的每一个状态相关联的观测序列的随机过程。设有观察序列Q=Q1Q2…Qn和状态集=S{s1,s2,…sn},一个有n个状态的隐马尔可夫模型λ可以表示(π,A,B),其中π为初始状态概率矢量;A={aij}为状态转移概率矩阵,其中

aij=P{qt+1=Sj|qt=St},1<=i,j<=N;B={bj}Qt)}为观察符号概率分布,若B有M个观察值{v1,v2…mv},则bj(Qt)=P{qt=vk|qt=sj,1<=j<=N,l<=k<=M}。

HMM的使用涉及到训练和分类两个阶段,训练阶段包括指定一个HMM的隐

藏状态数,并且优化相应的状态转换和输出概率以便于产生的输出符号与在特定的运动类别之内所观察到的图像相匹配。匹配阶段涉及到一个特定的HMM可能产生相应于所观察图像特征的测试符号序列的概率计算。利用H顾进行验证同样由两个阶段组成,即利用训练样本估计MHM模型参数和利用HMM评价测试。这两个过程目前都有成熟的算法,HMM参数的估计可用Baum-welch参数估计算法或Segmental

K-means算法;对测试样本的评价,可以用Forward-Backward迭代算法估计签名

满足模型的概率,或用viterbi最优状态搜索算法计算过程经过的最优状态。因此,利用HMM模型的关键在于HMM类型的选择和一些参数的选择以及阀值的估计[4]。

2.2 分类器

在人脸识别过程中,通过提取特征模块,得到表示人脸图像的特征向量,此时需要利用分类器根据提取的特征向量进行分类处理,以确定当前人脸的身份。在这个过程中,分类器起着决策机制的作用,对最终的判别非常关键,分类器性能的优劣也将直接关系到人脸识别结果的好坏。常用的分类器有以下几种:

(1)最小距离分类器(NC)

最小距离分类器相似度量是以检测样本到类中心的距离大小为判据。 (2) 最近邻分类器(NN)

最近邻法是将所有训练样本都作为代表点,因此在分类时需

要计算待识别样本x到所有训练样本的距离,与x最近的训练样本所属于的类别即为待 识别样本x所属类别。假定有C个类别ω1、ω、ωn的模式识别问题,每类有标明类别

样本Ni个,i=1,2,?,C,我们可以规定以类的判别函数为

,k=1,2,…,Ni . (2.2.1)

其中xi的角标i表示以类,k表示ωi类Ni个样本的第k个,决策规则可以写为:

若 ,i=1,2,...,C, (2.2.2) 则决策x∈ωi。

(3) 三阶近邻法

k

三阶近邻法是计算像素的差值的绝对值。距离公式可表示为:

L(x,y)=lxi-yil (2.2.3)

由式(2.2.3)计算所得出的具有最小值的图像并不一定属于同—类别。三阶近邻法计算出与测试图像距离最小的三幅图像,计算这三幅图像所属的类分别计为

classl,class2,class3,若classl和class2且class2和class3不属于同一类,则测试图像属于classl;若classl和class2相同,则测试图像属于classl,而class2

与测试图像也是相似的;若class2和class3属于同一类,则测试图像属于class2,而class3与测试图像也是相似的,但classl虽然与测试图像距离最近却不属于同一类,可能是由测试图像的姿态和饰物引起的

(4))贝叶斯分类器

如果知道各类的先验分布和条件分布,就可以采用最大后验估计(MAP)的方法进行分类。在人脸识别中,有时假定人脸服从高斯分布,能够得到不错的结果。

(5)支撑向量机(SVM)是基于结构风险最小化得出的。尤其在小样本情况下,既

降低了训练集的错分风险,又降低了未知人脸(如检测集)的错分风险。在人脸识别中已逐渐得到应用。

(6)神经网络分类器(NNC),采用神经网络作为分类器是很自然的。一般一个3(MLP)模型、BP网络、径向基函数网络等。SVM也借鉴了神经网络的思想。

层网络对应模式识别中图像输入、特征提取、分类3部分。通常的NNC有多层感知机

g第三章 人脸识别系统的设计及实现

3.1 人脸识别流程

完成人脸识别的工作需要一系列的步骤,它们结合起来构成一个完整的流程。由于研究人员来自不同的学科、具有不同的背脊,而且不同的人脸识别应用中对识别的目标也不同,所以人脸识别的流程并不统一一个比较通用的人脸识别流程如下图所示:

输入图像 人脸检测/跟踪

→ →特征提取 →特征降维 →匹配识别 →

结果输出

图1 人脸识别流程图

其主要步骤包括:人脸检测/跟踪(face detection/tracking),特征提取(face

extraction),特征降维(face dimensionality reduction),匹配识别(matching and classification).它们之间基本上是串行的关系[3]。

(1) 人脸检测/跟踪。人脸检测是完成人脸识别工作的自动系统的第一个步骤。该步骤的目的是在输入的图像中寻找人脸区域。具体来说:给定意一幅任图像,人脸检测的目的是确定是否图像州有人脸存在,如果存在,给出每个人脸的具体位置和范围。实际应用中人脸图像的采集或获取常在非受控的条件下进行,这样所得到的图像中的人脸在尺寸、朝向、明暗、遮挡、分辨率等方面都有很多不同,使同一的人脸出现各种变形,并有可能导致各种误识、漏识等失败的情况。为校正人脸在尺度、光照和旋转等方面的变化,常需采用一些包括几何归一化(空间尺度归一化)和光照归一化(灰度幅值归一化)等手段来调整不同的人脸图像,以利于用统一算法进行识别。

(2) 特征提取。 为区分不同的人脸,需提取各种人脸的独特性质。也就是要从人脸图像中映射提取一组反映人脸特征的数值表示样本。这里首先需要采取某种表示方式来表示检测出的人脸和数据库中的已知人脸。通常的表示法包括几何特征(如欧氏距离、曲率、角度)、代数特征(如矩阵或特征向量)、固定特征模板、特征脸等。

(3) 特征降维。 人脸是一个非刚性的自然物体(柔性体),从人脸图像中可提

取很多不同特征,所以表征人脸的原始特征对应高维空间中的数据(对一幅M*N的图像,空间维数可达M*N)。直接利用这样高维的数据进行识别除需要很多的匹配计算量外,由于很难对各高维数据的描述能力做有效的判断,故还不能保证基于这么多数据进行的识别结果的正确性。在特征提取后,需采用紧凑的人脸表征方式,将原始特征进行筛选组合,集中信息,降低维数,使这些低维空间的有效性的到提高,以有利于接下来的匹配分类。

(4) 匹配识别。 在特征提取的基础上,选择使当的匹配策略,可将待识别的人脸与数据库中的已知人脸进行匹配比较,建立它们的相关关系,并输出所作出的判断决策/决定(识别结果)。与人脸检测不同,这里利用的主要是人脸个体差异的信息。有两种识别目的和情况需要区别:一种是对人脸图像的验证(verification),即要确认输入人脸图像中的人是否在数据库中,属于有监督的识别;另一种是对人脸图像的辨识(identification),即要确认输入图像中的人的身份,属于无监督的识别。

3.2 离线学习和在线匹配

人脸识别系统的构建及使用常由两个过程来完成,即离线学习和在线匹配。离线学习是利用作为训练样本的人脸图像,从中提取公共的特征,建立训练样本的特征子空间,使系统具有描述已有类别图像的能力,为在线匹配打下基础。在线匹配是要从输入的待识别人脸图像中提取相应的特征,将这些特征与离线学习的特征进行匹配,从而可借此将输入图像和训练图像建立联系,并将输入图像归入到某个训练图像类别中,如下图:

训练图像 特征提取 特征子空间 离线学习 训练图像 训练图像 特征子空间 在线匹配 分类结果

图2 即离线学习和在线匹配流程图

本实验即采用的这种方案。

第四章 KL变换和PCA人脸识别方法

4.1 简介

我们希望将图像原特征做某种正交变换,获得的数据都是原数据的线性组合,从新数据中选出少数几个,使其尽可能多地反映各类模式之间的差异,又尽可能相互独立,一个常用的方法就是主成分分析(PCA)。KL(Karhunen-Loeve)变换或主分量分析 (Principal Component Analysis,PCA),这是一种特殊的正交变换,它是重建均方误差最小意义下的最佳变换,起到减少相关性,突出差异性的效果,在图像编码上能去除冗余信息,也常用于一维和二维信号的数据压缩;这种变换采用主要特征对应的特征向量构成变换矩阵,保留原模式样本中方差最大的数据分量,在对高维图像编码时起到了降维作用。由于KL变换和PCA去相关性和降维作用,Mathew

A.Turk和P.Pentland首先将主成分分析运用到人脸识别中来。通过K_L变换得到高

维人脸空间的投影矩阵,人脸图像都可以由这些矩阵的线性组合来表示,正是因为这些矩阵呈现人脸的形状,所以将这种人脸识别称为特征脸(Eigenface)方法[5]。

4.2 KL变换和PCA分析

对给定的信号x(n),如果它的各个分量之间完全不相关,那么表示该数据中没有冗余;若x(n)中有相关成分,通过去除其相关性则可达到数据压缩的目的。主成分分析方法(PCA)基本思想是提取出空间原始数据中的主要特征(主元),减少数据冗余,使得数据在一个低维的特征空间被处理,同时保持原始数据的绝大部分的有用信息,从而解决数据空间维数过高的瓶颈问题。

一个宽平稳的实随机向量x(n)=[[x(0),x(1),…,x(N-1)],其协方差矩阵Cx

定义为:

?C0,0?C0,N?1??Cx=E{(x-μx) (x-μx)}= ???????C? ?N?1,0?CN?1,N?1?T

T

式中E{·}代表求均值运算,μ=E{x}是信号x的均值向量,Cx的元素

Cx(i,j)=E{x(i)-μx)( x(j)-μx)}=Cx(j,i)

即协方差阵是实对称的。显然,矩阵Cx体现了信号向量x的各分量之间的相关性。若x的各分量互不相关,那么Cx中除对角线以外的元素皆为零。

KL变换的思路是寻求正交矩阵A,使得A对x的变换y的协方差阵Cx为对角矩阵,其步骤如下:

先由λ的N阶多项式|λI-Cx|=0,求矩阵Cx的特征值λ0,λ1,…λN-1,以及N个特征向量A0,A1,…AN-1。然后将A0,A1,…AN-1归一化,即令=1,i=0,1,2?,N-1。由归一化的向量成A0,A1,…AN-1就构成归一化正交矩阵A,即

A=[ A0,A1,…AN-1]T

最后由y-Ax实现对信号x的KL变换。显然,矩阵A各向量之间相互独立,体现了去相关性,在图像编码中去除了冗余。

4.2.1 KL变换原理

假设X为n维的随机变量,X可以用n个基向量的加权和来表示:

n X?aφi (4.2.1.1)

i

?i?1式中:ai为加权系数,Фi为基向量,此式也可以用矩阵的形式表示:

X=(φ1φ2?φn)(a1a2…an)T (4.2.1.2) 其中 Ф=(φ1φ2?φn), α=(a1a2…an)T

我们取基向量为正交向量,Ф由正交向量构成,所以Ф是正交矩阵,即ФTФ=I将公式(4.2.1.1)两边左乘ФT,并考虑到Ф为正交矩阵,得α=ФTX即:αi=ФTiX。

我们希望向量α的各个向量间互不相关。那么如何保证α的各个分量互不相关呢?这取决于选取什么样的正交向量集。设随即向量的总体自相关矩阵为:

R=E[XTX] (4.2.1.3)

将公式(4.2.1.1)代入上式(4.2.1.3),得

R=E[XX]=E[Фα αФ]= ФE[αα]Ф (4.2.1.4) 我们要求向量α的各个分量间互不相关,即满足下列关系:

(4.2.1.5)

??1???写成矩阵的形式 ?????T ??n?则:R=Ф△Ф (4.2.1.6) ??TTTTT

将上式两边右乘上Ф,得: RФ=Ф△ФФ (4.2.1.7) 因为Ф是正交矩阵,所以得: RФ=Ф△ (4.2.1.8)

T

RФj=Фj△j (j=1,2,3,?n) (4.2.1.9)

可以看出,λi是x的自相关矩阵R的特征值,。Фj是对应特征向量。因为R是实对称矩阵,其不同本征值对应的特征向量应正交。

综上所述,KL展开式的系数可用下列步骤求出:

步骤一:求随即向量x的自相关矩阵R=E[XTX],由于没有类别信息的样本集的均值向量,常常没有意义,所以也可以把数据的协方差矩阵作为KL坐标系的产生矩阵,这里召是总体均值向量。

步骤二:求出自相关矩阵或协方差矩阵R的本征值λj和本征向量Фj。其中j=1,2?n。同时本征向量组成的矩阵为Фj。j=1,2?n。

步骤三:展开式系数即为α=ФTX。

K-L变换的实质是建立了一个新的坐标系,将一个物体主轴沿特征矢量对齐的旋转变换,这个变换解除了原有数据向量的各个分量之间相关性,从而有可能去掉那些带有较少信息的坐标系以达到降低特征空间维数的目的。

4.2.2 主成分分析法 (PCA)

主成分分析法(PCA)在人脸识别领域成功应用的一个重要理论基础是较好的解决了K.L变换后协方差矩阵的特征向量的求解问题。人脸识别是一个典型的高维小样本

问题,即人脸图像向量的维数一般较高,比如,实验用的ORL人脸库的图像大小为112x92的人脸图像,其对应的图像向量特征空间高达10304维,在如此高维的图像空间内,按照通常的算法,计算样本的协方差矩阵的特征向量是异常耗时的。同时,在人脸识别问题中,由于客观条件的限制,训练样本的数目一般较小,通常,训练样本的总数远远小于人脸图像向量的维数。针对高维小样本的情况,求解特征向量所采取算法的基本思想是,将高维的问题转化为低维的问题加以解决。

主成分分析法(PCA)是模式识别判别分析中最常用的一种线性映射方法,该方法是根据样本点在多维模式空间的位置分布,以样本点在空间中变化最大方向,即方差最大的方向,作为判别矢量来实现数据的特征提取与数据压缩。主成分分析法的原理如下:

已知n维空间的随机向量用φ(φ∈Rn)表示,利用公式将φ进行零均值处理,x=φ-E(φ),则E(x)=0。如果对x用一组完备正交基μj,j二1,2,?n展开,可得

k

(4.2.2.1) iji?1

假设只用前k项进行重构,则

x??aukxrec??ajujj?1(4.2.2.2)

其均方误差为:ξ=E[(x-xrec)T(x-xrec)] 因为

且αj=μjTx

(4.2.2.3)

所以 nnT??TTuξ=E??ujxxuj?=(4.2.2.4) jCuj ?J?k?1T?J?k?1其中C=E[xx]=E[(φ-E[φ]) (φ-E[φ])T]是x和φ的总体协方差矩阵。

?为了使重构的均方误差最小,并满足正交条件的约束,采用拉格朗日乘子法,将函数

J?k?1?nuTjCujJ(uj)= -

J?k?1???ujnTjuj?1?对μj(j=1.2?n)求导,得

(C-λjI)μJ=0,J=k+1,k+2…,n (4.2.2.5)

令k=1,此时ul,u2,…,un为总体协方差矩阵C的本征向量,λ1, λ2…λn分别是它们对应的特征值,这些特征向量经过正交化处理所形成的空间称为特征空间。将特征向量ul,u2,…,un按照它们的特征值进行降序排列λ1≥λ2≥λ3…≥λn。,则得到结论:

对于任一随机变量x,如果采用总体协方差矩阵C的前k个最大非0特征值所对应的特征向量作为坐标轴展开,可在相等截断长度下获得所有正交展开中最小的截断均方误差ξ

min

?min?j?k?1??ni(4.2.2.6)

下面我们将主成分分析法用于人脸识别[6]。

假设训练人脸图像的个数为M,将每一副图像按列串相接的方式排成长度为N的向量Γ1,Γ2,Γ3?, ΓM.其均值向量(即平均脸)为

Ψ=1/M

则每个图像相对于均值图像的差为ΦI-Ψ(i=1,2,?,M)。令矩阵A=[Φ1, Φ2?,Φm],则散布矩阵∑可以表示为:

∑AA=1/M

T

j?k?1??ni (4.2.2.7)

求出∑的特征值λk和特征矢量μk,由于μk看起来像一张人脸,因此μk常称作特征脸向量,用特征向量构成的图像称为特征脸图像。由于∑是NxN大小的矩阵,而且N的值较大,一般远大于训练样本的个数M,因此为了降低计算量,通常不直接求∑的特征向量μk,而是先计算大小为MxM的矩阵ATA的特征向量νk,根据代数理论,有

对于这些相互正交的特征向量,根据其对应的特征值的大小按照从大到小的顺序

j?k?1???inTi (4.2.2.8)

uk?1?kj?k?1?nA?k(4.2.2.9)

进行排列,取前面J(J

i,J

),i=1,2?,M:

ωi,k=<Φi,uk>=ukT(Γi-ψ) , (i=1,2,…M;k=1,2,…,J)

这里“<·>”表示内积。对于任一待识别的图像,用同样的方法求出其投影系数Oi=(ω1, ω2,?, ωj),则满足下列条件的第J个训练图像即为识别结果。

J*=arg min{||???i||}i?1,2,...M

PCA方法具有以下优点:

(4.2.2.10)

(1) 最小均方误差。 可以证明,PCA是在均方误差最小意义下的最优正交分解方法,因此用PCA进行信号压缩能够得到最大的信噪比。

(2) 降维。 由于基函数的个数往往远小于信号的维数,因此PCA变换能够大大降低数据的表示维数。这对模式识别中的特征提取非常有利。

(3)

消除冗余。 在基函数上的投影系数彼此之间是不相关的。

(4) 分解函数/合成函数相同。 分解函数(Analysis Function))作用于输入信号,得到信号的编码;合成函数(Synthesis Function)作用于信号的编码,得到原始信号。如果图像的分解和合成采用线性模型,则分解函数φI和合成函数Фi是和输入信号具有相同维数的向量,它们可以表示为:

αi=φiTI, I=∑iαiФi

主成分分析(PCA)法同样有其自身的缺点。PCA法将K-L变换后特征值从大到小进行排列,挑选相对大的特征值所对应的特征向量,构成一个K-L变换特征空间的子空间,来进行特征提取。又因为K-L特征空间中,较大特征值所对应的特征向量体现原图像的总体趋势、低频分量;较小特征值所对应特征向量体现原图像的细节变化、高频分量,所以PCA法提取图像总体特征,在人脸图像上的表现就是人脸的外形轮廓和灰度变化,以此作为人脸特征,却丢失了一些原有的重要信息。PCA法在人脸特征提取中可以取得较好的效果,但它是基于K一变换的一种特定的选择,无法根据图像的不同而进行优化选取,无法完全避免K-L变换的局限.

4.3 人脸识别中PCA算法步骤及流程

a. 训练过程

1. 构造训练样本集,即从人脸图像目录中读取多个人脸图像到训练样本集中,构造矩阵X;

2. 计算这些图像的平均值μ;

3. 计算协方差矩阵C=E[(x-μ)(x-μ)T]; 4. 计算特征值和特征向量:[V,D] = eig(C);

5. 按特征值从大到小排序,选择前几个最大的特征值对应的Ui作为变换矩阵W;

6. 把所有训练样本做变换y=WTx,保留系数y。 b. 识别过程

1. .读取一幅待识别图像;

2. 求取该图像相对于平均脸差值图像;

3. 求差值图像在各特征向量上的投影,对新样本也作变换,通过计算欧式距离看与哪个y最接近,最近者则判为那一类。 4. 与实际比较确定是否识别正确,统计识别率。

图解如下:

图3 人脸识别流程

4.4 实验及结果分析

我们使用MATLAB软件实现了人脸识别并统计其识别率。本实验采用PCA(主成分分析)方法,利用K-L变换和奇异值分解原理实现。并分别采用最近邻法和三阶近邻法分类器得出它们的成功率。(实验程序在附件中)

本论文实验采用的是是英国剑桥大学Oliveut研究所制作的ORL(Oliveut

ReesarhcLbaoratoyr)人脸数据库。该数据库包括40个不同人,每人10幅图像,共

400幅。每幅原始图像256个灰度级,分辨率112x92。ORL人脸图像是在不同时间、不同视角、各种表情(闭眼/睁眼、微笑/吃惊/生气/愤怒/高兴)和不同脸部细节(戴眼镜/没戴眼镜、有胡子/没胡子、不同发型)的条下拍摄的。

1. 首先分别取每个人脸的前2,3,4,5,6,7,8张图片作为训练集,剩余图片作为测试集,这样训练集分别为80、120、160、200、240、280、320,测试集分别为320、280、240、200、160、120。采用最近邻分类器,得出结果如下:

表1 采用最近邻法分类器,训练样本改变时识别率 训练集中每个人图片数 识别正确率 2. 当分别采用最近邻法分类器和三阶近邻分类器,训练样本都为40*5时,识别率:

最近邻法分类器:0.8400 三阶近邻分类器:0.8800

实验结果表明:随着训练样本的增加,识别正确率渐渐提高;使用三阶近邻分类器要比最近邻分类器效果好一些。

0.8031 0.8036 0.8167 0.8400 0.8625 0.8833 0.9000 2 3 4 5 6 7 8 结论:PCA算法能对图像进行降维,可提高对图像处理的计算速度;用三阶近邻分类可提高图像的识别率。实验表明采用特征脸方法实现人脸识别是可行的。

第五章 影响人脸识别的几个因素及人脸数据库介绍

对人脸的识别会受到很多因素的影响。例如光照环境的变化会改变人脸图像不同部位的明暗,不同的识别表情会改变图像中的人脸的外观,人脸成像时的姿态也有可能产生一定的遮挡。同样的识别方法对不同年龄、性别的人的识别效果不同,或者说随着人的年龄的改变,识别的成功率也会变化。

对其中若干影响因素做初步讨论如下: 1. 光照变化

在人脸识别中,光照条件的变化常引起人脸外貌或外观的明显变化,光照变化所导致的阴影、遮挡、明暗区、暗光、高光都会使识别率大幅下降。光照的变化可以来自光线方向或能量分布的不同,也会受到人脸3D结构的影响。

现有解决光照变化的方法可分两类:一类可称为被动的方法,它通过学习由于照明变化而导致的可见光谱图像的变化来设法减小光照变化造成的影响;另一类可称为主动的方法,它使用主动成像技术,使获得的图像具有在固定照明条件下所采集到图像的特点,或只有不受照明变化影响的采集方式获得的图像的特点。

2. 姿态变化

在采集人脸图像时,如果人的姿态发生变化,则其导致的投影形变会引起人脸面部不同部位的拉伸、压缩和遮挡,使图像发生很大的改变。人脸姿态在三维空间的变化共有6个自由度:沿X、Y、Z轴的平移和绕X、Y、Z轴的旋转。其中,沿X、Y轴的平移在图像上表现为人脸位置的变化,对其的校正可通过采用适当的检测方法获取变化量再借助坐标变换实现;沿Z轴的变化在图像上表现为比例的变化,对其的校正可通过缩放二维图像或三维人脸来实现。绕轴的变化可分为平面旋转、垂直深度旋转和侧深度旋转。其中,平面旋转是绕z轴的旋转;垂直深度旋转也叫上下旋转或仰俯旋转,是绕X轴的旋转;侧深度旋转有时被称为左右旋转或水平偏转,是绕Y轴的旋转。上述6个自由度的变化中绕X和Y轴的旋转难以直接从图像上确定。

克服姿态变化所带来问题的一种方法是从图像中估计出人脸的不同姿态,再设法

将其变换回人脸的标准姿态,用标准的人脸识别方法进行识别。还有一种方法是学习并记忆多种姿态下的特征,这相当于建立多个姿态,工作量会大一些。最后,也可以构建头部的3D模型,从中提取姿态无关特征来识别人脸。

3. 年龄影响

人的外形和纹理会随着年龄而变化,这也会导致人脸识别中的识别率下降。 解决年龄影响的思路与解决姿态影响的第一种思路有些类似,即从图像中估计出人脸的年龄,再设法将其变换回原来用于训练识别算法的人脸的年龄。与年龄有关的人脸特征即包括形状特征也包括纹理特征。形状特征可从人脸轮廓获得,而纹理特征可从人脸表面获得。在训练中,可建立起人脸特征与年龄之间的关系,即建立起年龄函数。利用年龄函数并结合人脸变老方式的分类,可自动估计出图像人脸的年龄。

另外,对人脸识别的研究还要求对识别的效果有客观的评价以及能对不同方法进行公平的比较,其中采用统一的数据库可方便比较工作,因为不同的数据库,产生的结果会有所差异。以下介绍一些典型的标准数据库。

(l)英国ORL人脸数据库。英国ORL(Olivetti Research Laboratory)人脸数据库包括从1992年4月到1994年4月拍摄的一系列人脸图像,由40个人的400幅灰度图像组成,每幅原始图像256个灰度级,分辨率112x92,图像背景为黑色。其中人脸脸部表情和细节均有变化,例如笑与不笑,眼睛睁着或闭着,戴或不戴眼镜等,人脸姿态也有变化,其深度旋转和平面旋转可达20度,人脸的尺寸也有最多10%的变化。这是目前使用最广泛的人脸数据库。

(2)英国Manchester人脸数据库。该数据库由30个人的690幅图像组成,其中训练集和测试集分开,有不同的光照和背景特征,而且对于每个人而言,前后两张照片之间的时间间隔至少有3周。训练集对光源有一定的约束,而在测试集中则变化多端。测试集还增加了两级难度:其一是对于其中的相似人脸,仅有发型,背景以及戴眼镜等变化;其二是特征遮挡,如头发,黑眼镜,手臂等。

虽然Manchester数据库远比ORL数据库测试更为全面,但因发表的比较结果不够多,从而远不如ORL使用广泛。

(3)美国FERET人脸数据库。美国FERET(Face Recognition Techoulogy)人脸数据库是目前最大的人脸数据库,由美国军方研究实验室提供,其中每人8张照片,两张正脸,3张从右到左的不同侧面角度的照片,有些人还提供了更多不同视点和不同表情的照片。该数据库中不包含戴眼镜的照片,拍摄条件也有一定的限制,人

脸大小约束在规定范围内。到1996年6月,该数据库已存储了1199个人的14126幅图像,而且逐年增加。但到目前为止,该数据库并未提供运动图像系列或包含语音信息。FERET数据库的最大缺点是非美研究机构的获取不便。

(4)日本ATR数据库。该数据库考虑了除人脸特征外的其他信息在人脸识别中的作用,提供人脸和语音的合成,由60人组成。但其中人脸图像是静止的而非运动图像序列。

(5)欧洲MZVTS多模型人脸数据库。该数据库用于测试多模型身份鉴别。目前该库由37人组成,每人有5个图像序列,拍摄时间间隔一周左右。其中至少有一个序列提供合成语音。

其他数据库还有: CMU(Carnegie Mellon University)正面人脸数据库,MIT单人脸数据库等。ORL人脸数据库是目前使用最广泛的标准数据库,它含有大量的比较结果,并且使用该人脸数据库发表的人脸识别论文数量是最多的,是识别算法之间进行比较的首选数据库。本文所采用的是ORL人脸数据库[6]。

第六章 总结与展望

6.1 总结

人脸识别具有重大的理论意义和应用意义,它是一项结合了多学科,多领域知识方法的技术。长期以来,如何利用计算机进行准确,快速的人脸识别,一直是图像处理与模式识别的研究热点与难点。社会的发展促进了身份认证技术市场的急速扩大,人脸识别因其自身的优点,在身份认证中的使用日益频繁。人脸识别技术具有广泛的社会需求和市场前景。

本文回顾了人脸识别发展历程及研究现状,详细介绍了人脸识别系统的构成与工作以及其中的一些关键性问题,对特征脸方法作了详细介绍,并运用其设计出人脸识别程序。本文所做的主要工作归纳如下:

(1) 概述了人脸识别技术的应用及其难点,发展与现状,研究内容与主要方法,及常用的人脸识别标准数据库。

(2) 介绍了人脸识别中会使用到的各种分类器。

(3) 详细介绍了人脸识别的流程、KL变换、特征脸方法(PCA),使用特征脸方法设计出人脸识别程序并计算出识别成功率。

(4) 在分类器的设计上,采用最近了邻分类器和三阶近邻分类器两种分类器进行分类识别,并且通过实验比较识别效果。

6.2 展望

人脸识别是一个多学科领域的挑战性难题,近30年来人脸识别的研究虽然取得了巨大的进步,但与人类的感知能力相距甚远。人脸识别涉及到很多理论和技术问题,本文只是进行初步的探索和尝试。在这个基础上可进行的后续研究可以从以下几个方面考虑。

首先,如何利用各种图像的特点,对静态人脸灰度图做相应的图像预处理,从而

克服光照、姿态和表情变化对识别的影响,提高人脸识别率。同时,可以充分利用边缘和锐化图像的特点,使预处理后的图像的识别效果更好。

其次,在进行人脸识别的特征提取过程中,如何能够更好的利用图像的各种信息,比如灰度统计信息和结构信息,将各种可能的信息集合起来,找到能最大限度的利用图像现有信息的人脸识别方法。

最后,每种人脸识别方法都各有优缺点,如何充分利用现有的各种人脸识别方法,发挥某一类方法的优点,克服某一类方法的缺点,将它们进行有效的综合和组合,也是以后一个探索的方向。

参考文献

[1] 聂祥飞. 人脸识别综述. 重庆三峡学院学报, 2009, 25(117):14. [2] 朱金魁. 人脸识别算法的研究. 东北林业大学硕士论文. 2009. [3] 王志良,孟秀燕. 人脸工程学(第一版).北京:机械工业出版社, 2008. [4] 安贝. 基于K-L变换的人脸识别方法. 四川大学硕士论文. 2005. [5] 邓迎宾. 人脸识别关键技术研究. 昆明理工大学硕士论文. 2007.

[6] 于清澄. 基于K-L变换的人脸识别算法研究. 沈阳工业大学硕士论文. 2007. [7] 程正东等. 基于子空间的人脸识别(第一版). 北京:清华大学出版社, 2009. [8] 齐怀峰. 基于特征脸的人脸检测与识别. 云南师范大学学报, 2005, 25(6):22-23.

[9] 张辉. K-L变换在人脸识别特征提取中的应用. 学术交流, 2008, 1:87-88. [10] 黎奎, 宋宇. 基于特征脸和BP神经网络的人脸识别. 计算机应用研究,2005,6:236-237.

[11]Aditya Kelkar. Face Recognition using Eigenface Approach. Proc.

CVPR ,2004,5

本文来源:https://www.bwwdw.com/article/pqbg.html

Top