基于ARM的实时人眼定位系统

更新时间:2024-07-11 07:10:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中北大学信息商务学院2011届毕业设计说明书

1 绪论

1.1 课题的背景及意义

随着我国社会和经济等各项事业的迅猛发展,许多行业对于快速和准确地识别有关人员身份的需求正日趋迫切。由于生物特征是人体的内在属性,具有很强的自身稳定性和个体差异性,所以人体的生物特征是进行身份识别最理想的依据。在这样的背景下,一门新的学科,即生物测定学引起了人们的研究热潮,生物测定学(Biometrics)是指通过计算机将人体固有的生理特征(如指纹、虹膜、面部、掌纹)或行为特征(如书写、声音等)收集并进行处理,来进行个人身份鉴定的技术。其中利用人脸的特征进行身份识别[1]具有直接、友好、主动的特点,成为身份识别最自然和最直接的手段。

眼睛作为人脸上最显著、最稳定的特征,可以被用于帮助定位人脸,提供人的注视信息,识别人脸动作(如表情变化)等。有资料表明,高速公路上发生的交通事故中有50%以上是由于长时间驾驶造成疲劳或由所见目标单调而形成注意力不集中,甚至打瞌睡等原因造成的,而驾驶员在车辆行驶过程中是否疲劳驾驶就可以从眼睛的状态反映出来。当驾驶员精神饱满时,眼皮张开程度及眨眼频率都有统计的正常值;当驾驶员精神萎靡不振时,眼皮张开程度明显变小,眨眼频率也明显降低。所以,利用驾驶员眼睛的状态信息来判断其疲劳状况是一种可行的方法。在车辆中安装驾驶员疲劳监测系统,利用摄像头对驾驶员的驾驶行为进行监控,获取驾驶员脸部的一段连续图像,对每幅图像中的眼睛状态进行分析,综合每幅图像的数据来获得一个眨眼周期。由于正常的眨眼频率与疲劳状态下的眨眼频率有着明显的区别,从而可以判断出该图像序列获取时驾驶员韵精神状态,在判断驾驶员疲劳时由系统适时的给出警告信号以避免事故发生。因此,准确、快速的获得每幅图像中眼睛的精确位置,就成为实现驾驶员疲劳状态监控的关键。

作为人眼定位的另外一个重要应用就是人脸识别。人脸识别不仅与模式识别、图像处理、计算机视觉和人工智能等多个学科相关,还与认知学、神经学、心理学等有紧密联系,在私法验证、安全监控、智能卡、档案管理、视频会议、人机交互等方面有着广泛的应用。特别是,有专家提出要在北京2008年奥运会使用人脸识别系统。如果在奥运会中使用人脸识别系统,就可以有效地管理奥运区内敏感区域和高风险实验室的人员出入,辨别后勤、食品运送人员及其他工人是否经过登记授权,防止恐怖人员等影响社会稳定的人员进入奥运区,防止意外事件发生。

第 1 页 共 40 页

中北大学信息商务学院2011届毕业设计说明书

随着后PC时代的来临,人们开始更多的关注这样一个全新的概念:嵌入式处理器。嵌入式处理器经过发展,已经由8位的单片机发展到32位的微处理器,已经能够满足图像处理等任务。ARM(Advanced RISC Machines,高级精简指令集机器)作为嵌入式技术中极其重要的一份子,发展极其迅猛[2]。采用ARM技术的设备已在各项领域中被广泛应用。在32位嵌入式微处理器市场上,基于ARM内核的微处理器在市场上处于绝对的领导地位,因此追踪ARM技术的发展趋势显得尤为重要[3]。而采用基于ARM技术来实现的人眼定位系统,具有体积小、低功耗、方便、快捷、经济等优点,很具有研究意义,工业应用广泛,有很好的发展前景。 1.2 国内外发展现状

人脸检测与人眼定位的研究[4]最早可追溯到十九世纪法国人Alton的工作,现代的研究,始于60年代末70年代初,在90年代以来成为了研究热点。目前,国内外对人脸检测和人眼定位的研究越来越热,国外比较著名的美国麻省理工学院,卡耐基梅隆大学等高校都建立了人脸检测实验室,其中著名的研究机构有Media lab,Human-Computer Interface Institute、Department of Engineering in University of Cambridge等。其它国家比如JAPAN、SINGAPO、KOREA等,在人脸检测方面也取得了相应的研究成果。文献[5]利用了人脸的几何、空间和灰度的度量特征,对人脸进行粗定位,然后利用人眼与嘴巴的三角关系来精确地定位人脸,人脸的检测率达到96.7%,器官特征的检测率达到90.0%。文献[6-7]对人脸样本和非人脸样本采用了Kohonen自组织映射网络进行聚类。Samaria[8]等人提出了使用HMM模型进行人脸检测的算法。他们将隐马尔可夫模型的状态迁移的条件使用人脸区域的结构信息来表示,这种方法的鲁棒性较好,对不同角度和不同光照条件的人脸图像都可以取得较好的识别效果。

国内开展人脸检测研究的主要单位有清华大学,哈尔滨工业大学,北京工业大学等,相对而言都取得了一定的成果。针对人脸检测环境的复杂性,文献[9-11]提出了一种利用肤色和支持向量机(SVM)的人脸检测方法,该方法可以有效地从复杂背景信息中检测出人脸。该方法是在统计学习理论的基础上发展出的一种新的模式识别方法,它采取基于结构风险最小化原理的方法,在检测速度上取得了很好的效果。

虽然经过国内外众多学者们的共同努力,人脸检测的速度有了一定的提高,但是相对于人脸检测的精度而言进步相对较慢。2001年,P.Viola的一篇文章[12]的发表可以认为是检测速度提高的一个转折点。他通过综合Adaboost和Cascade算法实现了实时的

第 2 页 共 40 页

中北大学信息商务学院2011届毕业设计说明书

人脸检测系统,使得人脸检测从真正意义上走向了实用。之后,更多的学者,如Rainer、Lienhart、B.Froba、Stan Z.Li、C.Liu等[13-15],开始将注意力集中到Boosting算法上来,使得在提高检测精度的同时也大幅度地提高了速度。著名的Intel OpenCV开源库[16]的人脸检测与跟踪算法正是使用了Adaboost算法实现的,它对正面人脸的检测及跟踪达到了相当好的效果。

目前的人眼定位方法大多都是在经过人脸检测确定人脸基本位置的基础上进行人眼定位的,显然,这样做可以减少背景干扰,缩小搜索区域,从而提高人眼检测的精度和速度。主要有以下几种方法:(1)灰度投影法,该方法多用于在人脸矩形区域中进行人眼的粗定位。由于在人脸图像中人眼的灰度较低,在人脸的水平灰度投影曲线上,认为曲线的最大值点(对应人的额头部位)和次最大值点(对应人的鼻中部)之间的一个极小值点对应位置为眼睛所在的大致水平位置 [17]。(2)二值化法,该方法首先用直方图阈值法将图像二值化,然后根据其中黑色区域的面积、形状和相对位置等几何特征确定出瞳孔的位置[18]。(3)Hough变换法[19],Hough变换是一种用于区域边界形状描述的方法,常常用于直线段、圆和椭圆的检测。由于眼球的圆形结构特征,人眼定位问题可以转化为在图像中确定圆形结构位置的问题。该方法的缺点是占用存储空间大,耗费时间长。(4)基于模版匹配的方法 [20],根据上眼睑曲线特征构造了一种弹性模板。(5)眼角检测法

[21]

,该方法通过Gabor滤波器检测眼角,因此要求脸像尺寸较大,对图像质量,尤其是

对眼角的对比度要求较高。(6)对称性检测法,对称性是识别物体可利用的基本性质之一,它包括点对称性(也叫中心对称性)和轴对称性。对于人脸图象来说,人眼、眉毛、嘴等都具有很强的点对称性[22]。(7)特征眼法,类似于特征脸法,该方法将候选眼部投影到特征眼空间得到构造眼部[23]。。

目前大多数人脸检测与人眼定位都是在运算速度很快的PC机上实现的,随着嵌入式系统运算速度的不断加快,人们开始在嵌入式系统中实现一些简单的图像处理。所谓的嵌入式系统就是软件硬件结合紧密的系统,一般而言,嵌入式系统的构架可以分为4个部分:处理器、存储器、输入输出接口和软件。而嵌入式处理器则是整个系统的心脏。从应用的角度来划分,嵌入式处理器可以分为以下四个类型:嵌入式微处理器、嵌入式微控制器、嵌入式DSP、嵌入式片上系统。嵌入式微处理器的基础是通用计算机中的CPU,在应用中,将处理器装配在专门设计的电路板上,只保留与完成功能有关的部分,这样可以大大减小系统的体积和功耗。为了满足应用的特殊要求,嵌入式微处理器虽然在功

第 3 页 共 40 页

中北大学信息商务学院2011届毕业设计说明书

能上和标准微处理器基本一样,但在工作温度、抗电磁干扰、可靠性等方面一般都做了各种增强。嵌入式微处理器目前主要有Am186/88、Power PC、MIPS、ARM系列等。其中,采用ARM技术知识产权(IP)核的微处理器,即通常所说的ARM微处理器,已经遍及各类电子产品市场,应用最为广泛,占有75%以上的市场份额。人们在嵌入式系统中处理一些简单的图像时,最先得到应用是在高速运算的DSP系统中,但由于DSP系统控制功能不足,扩展能力也不理想,所以人们开始尝试在ARM系统中开发人脸检测与人眼定位系统。

1.3 论文的主要研究工作

本文的研究目标是在ARM(S3C2440X)和嵌入式Linux组成的平台上进行图像采集、处理、计算及定位结果的显示,从而实现整个系统的功能,可以看作是对人眼定位便携化的一种新的尝试。本文采用了高性价比的ARM9嵌入式处理器,处理速度可高达203MHz,可以很好地实现图像处理功能;采用开源的、可裁剪的嵌入式Linux为操作系统,使系统具有处理复杂情况的能力,尤其是它的内核可裁剪,移植性好,性能稳定,因此在此系统上进行应用软件的设计。该系统构成简单,体积小,功耗小,性能稳定,安装简易,通用性强,可以满足多种工业应用的需要,而且开源操作系统的使用也降低了成本。

论文的主要内容包括以下几个方面:

(1)根据实时人眼定位系统的基本要求,从性能、价格、体积和实验室具体实验条件等各个方面进行软硬件选型,并依据嵌入式系统开发平台设计要求进行了系统设计。

(2) 将Adaboost算法应用于人脸检测中,构建了一个实时人脸检测系统。 (3) 系统的分析了OPenCV的结构,并将带有开源视觉处理库的OPenCV移植到嵌入式ARM平台上。 1.4 论文的结构安排

第一章主要介绍了本课题的研究背景及意义、国内外的发展现状以及本文的主要内容。

第二章从系统要实现的功能出发,进行嵌入式操作系统和微处理器选型以及硬件模块的选择,搭建了系统所需的软硬件平台。

第三章介绍了基于Adaboost算法的人脸检测的原理,对该学习算法的原理做了详细的分析和研究。其中包括如何利用积分图像快速地计算Haar特征、弱分类器、强分

第 4 页 共 40 页

中北大学信息商务学院2011届毕业设计说明书

类器以及级联分类器的训练方法。

第四章介绍了OpenCV库的功能及优势,重点研究了如何移植OpenCV到ARM的嵌入式系统,以及使用OpenCV来实现实时人眼定位的软件设计。

第五章展示了实时人眼定位的结果。

第六章总结全文并提出了本文还存在的一些不足之处。

第 5 页 共 40 页

本文来源:https://www.bwwdw.com/article/6lx.html

Top