基于51单片机的高速公路测速系统和车牌识别分析
更新时间:2024-06-05 16:24:01 阅读量: 综合文库 文档下载
- 高速公路雷达测速系统推荐度:
- 相关推荐
基于51单片机的高速公路测速系统和车牌识别分析
添加时间: 2010-3-20 11:19:19 文章来源: 文章作者: 点击数:17688
摘 要
鉴于高速公路限速牌不能很好地对司机起到警示作用的作用,本文设计了一套基于MCS-51单片机,包含光电探测装置和显示装置的电子屏幕。它不仅能方便设置并显示该路段的限制速度,以完成普通电子限速牌的限速提示功能,同时能将测得的车速实时显示,并自动判断是否超速。另外它低廉的造价和经计算证明较高的精度大大提高了它的可用性。
车辆牌照自动识别系统是近几年发展起来的基于图像和字符识别术的智能化交通管理系统,是目前国内外模式识别应用研究领域的一个热点。本文对系统中区域提取、图像预处理、字符分割和字符识别等环节涉及的算法、设计做了一个比较详细的论述。本文在图像预处理中重点介绍一种在图像获取阶段有目的定位关注的物体,讨论了灰度图像二值化的多种算法,利用它在原始图像形成的标识区域特性,在约束条件下,按照识别牌几何特征提出了一种特殊的二值化处理方法。实验证明该图像识别系统具有较高的可靠性与稳定性,减小了进一步车牌识别中计算量大的问题,从而提高了车牌识别的准确性和快速性。讨论了灰度图像二值化的多种算法基于数学形态学的图像去除噪声的方法。基于数学形态学的图像去除噪声是通过对图像的开、闭操作有选择的去噪声。可以去除直径小于字符笔划半径的孤立噪声点。还详细地介绍了基于字符形态划分的字符识别方法。基于字符形态划分的字符识别方法是在对数字字符结构进行充分分析的基础上,对基元检测,归纳字符形态特征,得到的快速字符识别方法。
关键词 :光电检测;车速测量;单片机;电子限速牌;车辆牌照;图像处理;基元检测;字符识别
基于51单片机的高速公路测速系统和车牌识别分析
Abstract
In view of the highway speed limit unlicensed drivers should not very well serve as a warning to the role, this article has designed a single-chip based on the MCS-51, including the photoelectric detection devices and display devices of the electronic screen. It not only can easily set up and display the road speed limit in order to achieve common electronic speed limit signs prompt function, can be simultaneously measured real-time display of speed and automatically determine whether the speeding. In addition it is low cost and the higher the accuracy of calculations greatly enhance its usability. Vehicle License Plate Recognition system is developed in recent years based on the image and character recognition operation of the Intelligent Traffic Management System, the application of pattern recognition at home and abroad are currently a hot area of
research. In this paper, the system of regional extraction, image preprocessing, character segmentation and character recognition algorithm, such as aspect involved in the design to do a more detailed exposition. In this paper image pre-processing in the introduction of a focus at image acquisition phase has the purpose of positioning objects of concern, discussed the gray image binarization of a variety of algorithms, use it in the original logo image formation of regional characteristics, in binding conditions, identification card in accordance with the geometric characteristics of a particular binarization approach. Experiments prove that the image recognition system has high reliability and stability, further reduce the vehicle license plate recognition in the calculation of a large quantity of questions, thereby increasing the accuracy of license plate recognition and speed.Discussed the gray image binarization algorithm of multiple images based on mathematical morphology method to remove noise. Images based on mathematical morphology to remove the image noise is through the open and close operation has chosen to noise. Can remove the character strokes of a diameter less than the radius of the isolated noise points. Also detail the division of character-based form of character recognition methods. Morphological character-based division of Character Recognition on the figure are at a full analysis of character structure based on element detection, morphological characteristics summarized characters get Character Recognition Express.
Key words: Photoelectric detection; speed measurement; Singlechip; electron speed licensing; vehicle license; image processing; motif detection; Character Recognition
目 录
摘
要............................................................................................................ I
Abstract....................................................................................................... II 第1章 绪
论........................................................................................... 2
1.1 车牌字符识别研究课题的背
景...................................................... 2 1.2 车牌字符识别研究的意
义.............................................................. 2
1.3 车牌字符识别研究的应用现状及发展.......................................... 3 1.4 本文主要内
容.................................................................................
. 4
第2章 车牌图像预处
理........................................................................ 5 2.1 数字图像处理的相关介
绍............................................................. 5 2.1.1 数字图像处理概
念....................................................................... 5 2.1.2 图像的数字化表
示....................................................................... 5 2.1.3 本文中图像处理所涉及的相关领域........................................... 6 2.2 图像二值
化..................................................................................... 6
2.2.1 彩色图像和灰度图
像................................................................... 6 2.2.2 基于灰度的图像二值
化............................................................... 7 2.2.3 图像二值化结果演
示................................................................... 9
2.3 用数学形态学的方法去除噪声.................................................... 10
2.3.1 数学形态学的几种基本运算..................................................... 10
2.3.2 经开闭运算前后的图像对比显示............................................. 16 2.4 单个字符图像的分
割................................................................... 17 2.4.1 我国车牌的特
点......................................................................... 17 2.4.2 对所要识别的车牌的分
析......................................................... 17
2.4.3 基于列扫描黑色像素积累的字符分割..................................... 18 2.4.4 已经分割后的单个字符演示..................................................... 18 2.5 本章小
结........................................................................................ 19
第3章 基于字符形态划分的字符识别............................................. 19 3.1 字符识别概
述................................................................................
19
3.1.1 目前字符识别的一些常规方法................................................. 20
3.2 字符轮廓分
析................................................................................ 21
3.2.1 字符轮廓的划
分......................................................................... 21 3.2.2 字符四方向轮廓公式化表示..................................................... 21
3.3 字符轮廓的变化特
征.................................................................... 22 3.4 字符形态划分的结构基
元............................................................ 22 3.4.1 字符结构基元划分原
理............................................................. 22 3.4.2 字符形态划分方法的特
点......................................................... 23
3.5 利用字符结构基元划分的字符识别原理.................................... 24 3.5.1 基元的检
测................................................................................. 24
3.5.2 轮廓的统计特
征......................................................................... 25 3.5.3 用字符形态识别数字字
符......................................................... 25 3.5.3.1 数字字符的特
点...................................................................... 25 3.5.3.2 数字字符的识别方
法.............................................................. 26
3.5.4 字符识别的matlab算法流程.................................................. 27 3.6 本课题整体流
程............................................................................ 29 3.6.1 对本课题流程的总体说
明......................................................... 29
3.6.2 用MATLAB完成本课题的流程图........................................... 30 3.7 基于字符形态划分的字符识别方法的特点和不足.................... 30 3.8 本章小
节.................................................................................
....... 31 结
论.......................................................................................................... 32 参考文
献................................................................................................... 33
第1章 绪 论
1.1 车牌字符识别研究课题的背景
随着21世纪经济全球化和信息时代的到来,作为信息来源的自动检测、图像识别技术越来越受到人们的重视。近年来计算机的飞速发展和数字图像技术的日趋成熟,为传统的交通管理带来巨大转变,先进的计算机处理技术,不但可以将人力从繁琐的人工观察,监测中解放出来,而且能够大大提高其精确度,汽车牌照自动识别系统就是在这样的背景与目的下进行开发的。汽车牌照等相关信息的自动采集和管理对于交通车辆管理、园区车辆管理、停车场管理、交警稽查等方面有着十分重要的意义,成为信息处理技术的一项重要研究课题。
关于车牌识别技术及定位系统研究,在我国已经有了十几年的发展历程,目前系统的应用还处于起步阶段,大规模投入使用的成熟系统还没有出现,汽车牌照识别系统作为改进交通管理的有效工具,技术水平仍需完善。
国内外学者对此已经有了较多工作,但实际效果并不理想,尤其是对车牌自适应性强、速度快、准确率高的高速车牌定位方法还有待进一步研究。另外,对辅助光源要求高,也很难有效解决复杂背景下多车牌移动识别的技术难题,如:车牌图像的倾斜、车牌表面污秽或磨损、光线干扰等都会影响定位的准确性。传统车牌识别一般仅支持单一车辆,背景比较简单。而当今许多实际应用场合,如在繁忙交通路口临时对欠税费、报废、挂失等车辆的稽查,则监视区域比较复杂,现有识别方法无法直接应用;而且多数情况下,同时出现多辆汽车,背景有广告牌、树木、建筑物、斑马线以及各种背景文字等,现有的识别方法也不能很好的适应多变的环境。
本课题主要是在对汽车图像进行细致分析,综合考虑了一定噪声干扰情况的基础上,从实用角度来研究车牌字符分割与识别的算法问题。
[2]
1.2 车牌字符识别研究的意义
智能交通系统(Intelligent Transportation System (ITS))是二十一世纪世界道路交通的发
展趋势。公路交通基础建设的不断发展和车辆管理体制的不断完善,为以视觉监控为基础的智能交通系统的实际应用打下了良好基础。在智能交通系统中,车牌自动识别系统是一个非常重要的发展方向。
车牌自动识别技术可以应用于道路收费系统、交通管理系统等领域,起到节省人力成本、提高效率、改进管理体系等作用。随着我国汽车数量的迅速增加,车牌自动识别技术呈现出巨大的经济价值和现实意义。
在高速公路和城市道路中使用车牌自动识别系统,可以防止车辆通过“换卡”逃费;在封闭式收费中,防止车辆“倒卡”逃费;防止通行卡流失;对车辆进行管理;对黑名单车进行稽查;对车型进行辅助分类。
车牌自动识别技术用于智能小区停车场,利用其能够不停车自动识别汽车牌照和车型的特点,在车辆经过卡口的一瞬间,得到识别结果并通过通信网络将识别出的车辆信息及入口信息传送到各出口。既不需要道口值班人员发放通行介质,又可保证车辆信息准确无误地送至出口,起到了替代道口值班员和节省通行介质的作用,可以节省这两项成本的开支。车场使用者也可以在最短的时间进入或离开停车场,提高车场管理质量。
智能交通系统在我国尚属起步阶段,车牌识别技术在其中占有重要位置。车牌识别技术的推广普及,必将对加强高速公路、城市道路和停车场的管理,减少交通事故、车辆被盗案件的发生,保障社会稳定等方面产生重大而深远的影响。
1.3 车牌字符识别研究的应用现状及发展
车辆牌照识别(License Plate Recognition, LPR)系统可以广泛应用于高速公路电子收费站、出入控制、公路流量监控、失窃车辆查询、停车场车辆管理、公路稽查等需要车牌认证的重要场合,尤其在高速公路收费系统中,实现不停车收费技术可提高公路系统的运行效率,LPR系统更具有不可替代的作用。
LPR技术作为交通管理自动化的重要手段,其任务是分析、处理汽车监控图像,自动识别汽车牌号,并进行相关智能化数据库管理。
汽车牌照识别系统(Vehicles License Plate Recgonition System,(VLPRS))是对公路上配置的摄像头拍摄的照片进行数字图像处理与分析,综合应用大量的图像处理最新成果和数学形态学方法对汽车图像进行平滑、二值化、模糊处理、边缘检测、图像分割、开运算、闭运算、区域标识等多种处理以提取车牌区域,进而达到对汽车牌照的精确定位并最终完成对汽车牌照的识别。
目前的车牌识别方法主要是针对车辆自动缓停收费、停车场管理等场合,所监视的区域一般只有单一车辆,背景也比较简单。
尽管如此,世界上依然有大量的学者从事车牌字符识别研究,对于解析度较高和图像比较清晰的车牌,这些方法能有效识别车牌中的字符,但对于较低解析度和较为模糊的车牌无能为力,因为这些方法只有在车牌中的每个字符被独立分割出来的前提下才能完成识别工作。而独立分割车牌取得字符,对较低解析度和较为模糊的车牌来说是非常困难的。车牌字符识别的研究在技术上已经取得了一定突破,然而离复杂多变的实际应用要求还有一定差距,许多新方法仅停留在理论和文章上或者限定在比较狭窄的约束范围内,并不能以产品的形式大范围投入使用。因而对车牌字
符识别的具体分析和研究仍然是很有必要的。
车牌识别系统的具体应用发展也很迅猛,从原来的停车静止拍摄场景应用,如收费站、停车场等,发展到移动公路车辆稽查、违章自动报警、超载闯红灯等实时监控场合应用,增加神经网络自适应识别学习对于系统响应的速度、网络化、智能化、识别成功率等实用化要求也越来越高。随着上述核心技术的研究发展,应用领域和功能等也获得大幅提高。
1.4 本文主要内容
文结构划分为三章:
第一章 绪论。课题研究目的、背景、意义,概要介绍了汽车牌照识别的应用现状及发展。分析了汽车牌照识别的发展演进状况。对牌照识别系统进行了简单的需求分析,简要介绍了本文的行文安排。
第二章 车牌图像预处理。本章通过对车牌图像进行灰度处理、灰度图像二值化、并且用数学形态学中的开闭运算对图像中的污点进行噪声虑除,之后又利用列方向黑色像素积累的方法将车牌图像分割成七幅单个字符的图像以对下一步的字符识别做准备。
第三章 基于字符形态划分的字符识别。本章是对已经进行二值化,并且已经分割好的单幅字符图像进行识别。这一章是车牌号码中数字的自动识别研究的关键。通过对基元的检测,字符轮廓的统计。用一种简单易行的方法实现车牌中数字的自动识别。 单片机测速部分
以89C51单片机为基础的车速测量和显示技术。利用89C51片内所带的可编程定时/计数器和I/O口,通过光电开关采集中断信号来获得时间信号,并通过双字节除法获得速度信息,然后输出显示。
系统主要由3部分组成:信号采集部分,信号处理部分和显示输出部分。其关系如图1所示。 图1
1.1 信号采集部分
需要采集的时间信号有2部分:设定的限制时速和车辆通过设定测量距离S的时间间隔。 设定的限制时速通过8255PA口的按键开关读入,因此可以通过断开或闭合开关来方便设定不同路段的限制时速。
时间间隔的测量采用的是2组红外反射型光电开关[3],分别采样车辆通过时的信息。当有车辆通过时,光电开关接收器接收不到光信号,处于关状态,即输出一个低电平,经整形后将此信号输入到89C51中断口即产生中断信号。2组信号分别产生中断的时间差就是车辆通过定长距离的时间。这个时间差的计算采用了周期法。即将89C51定时器T0设定为定时模式,产生一个固定频率的参考脉冲作为加法计数器的时钟信号。T1工作于l6位计数模式,保证在最慢速度时不出现溢出情况。在第1个光电开关产生中断信号时,开始启动加法计数器;然后到第2
个光电开关产生中断信号时,停止计数。假设计数器的值为M,参考脉冲的周期为Tm,则测量时间T为M×Tm,误差为±Tm。考虑实际的必要性和程序的复杂性,设定的最小计时单位为1ms。
高速公路上车辆单向行驶的特点使得采集系统大大简化,无需考虑车辆通过2个光电开关的先后性。2个光电开关只需依车辆行驶方向按设定测量距离S平行放置。考虑到道路复杂性,在每个车道分别安装一套此采集系统,并分别显示通过各车道的车速,这样即便在测量范围内出现车辆跨道、变道行驶,两车道的显示系统可以同时显示同一辆车的车速,完全避免了因超速等现象可能带来的测量紊乱问题。
1.2 信号处理部分
信号处理部分以AT89C51[4]单片机为核心,选择12MHz晶振,外围电路简单,适合批量生产。其片内所带的I/O口将信号采集部分和显示输出部分连接起来。将设定的测量距离s与采集到的时间信息T作双字节除法。在与设定的限制时速做出比较后,将结果送给显示输出部分。值得说明的是测量距离是一个很重要的参量,设定的太大或太小都将导致测量精度的下降。综合前面设定的最小计时单位l ms、程序的系统误差以及高速公路上车流量的普遍情况,计算出较合适的测量距离为3~6m,其具体设定的测量距离可以根据车速的情况设定。
1.3 显示输出部分
显示输出部分主要实现3个功能,限定时速的显示和通过车辆的实时车速显示以及超速报警显示。对于限定时速的显示,本设计采用的方法是将8255PA口读入的按键开关信号送给串行口输出,通过移位寄存器74LS164[5]静态显示。而实时车速显示通过8255的PB口动态扫描显示。实际应用中显示模块的技术比较成熟,可选择点阵LED或7段显示LED等。超速报警显示通过P1.1口低电平点亮发光二极管实现。
2 系统实现
2.1 流程图
采用MCS-51系列单片机的汇编语言编制的软件由主程序和中断服务程序组成,程序流程图如图2所示。系统上电复位后,先读取设定的限速,之后进入等待程序。车速的检测按照先后顺序分别使用了中断口INT0和中断口INT1,当车辆通过光电开光0时,满足中断条件,中断程序开启定时器TO和中断INT1,为了防止信号干扰,同时关闭中断INT0,之后进入等待程序。车辆通过INT1时,中断服务程序关闭计时器,中断INT1同时调用除法程序开始计算车速,根据计算结果与限定时速进行比较,判断是否出现超速情况并将本次测试结果输出后延迟显示一定时间,之后重新准备下次测速。
2.2 软件的抗干扰设计
由于微处理机和2条外部信号相连,较易受到外部信号的干扰,因此应该设计必要的抗干扰程序。首先对INT0和INT1 2个中断源采取轮流开放与关闭的方法,在同一时间内只能有一个中断处于开放状态,防止另一个中断产生干扰信号。其次设定测速的有效值范围,如40 km/h-160 km/h,并转化为时间量,即计数器的计数范围(112,450)。如果测得的时间超过此范围判断为产生错误,恢复到循环起点。还引入了看门狗程序,当程序运行异常时自行跳转到循环起点。 3 测量精度及实验分析
简单的测速原理简化了系统的硬件组成,大大降低了生产成本。另外出于能更好地警示司机不要超速安全行驶的目的,结合下面的分析可以看出此系统的测量精度是完全能满足要求的。本文采用的晶振频率12MHz,每个机器周期为1μs,设定测量的最小周期为1ms,测量距离为5m,测量范围可达到0-255km/h。当汽车以80km/h的速度行驶时,其通过测试系统的时间为0.225S。而测试系统的响应和程序处理时间在几十微秒范围内,不会对测量带来影响,总的测量时间误差在2 ms内,由此得最大速度误差 ΔV/V小于1% ,即便考虑到一些干扰,测量结果也完全能满足所需要求。
第2章 车牌图像预处理
2.1 数字图像处理的相关知识
由于车辆牌照识别系统的处理对象是从实地拍摄的含有车辆牌照的图像,因此系统的关键技术几乎都是基于数字图像的处理和分析。基于数字图像处理的车辆牌照识别系统在处理车牌中的铆钉等噪声方面针对性较强,简单方便并且效果很理想。但是其中涉及的思想很丰富,所以本文在本章开篇对数字图像处理进行相关的介绍。
2.1.1 数字图像处理概念
图像的数字处理是以计算机为中心,包括各种输入、输出及显示设备在内的数字图像处理系统上进行的,是将连续的模拟图像变成离散的数字图像后,用建立在特定的物理模型和数学模型基础上编制的程序控制,运行并实现种种要求的处理。所谓数字图像处理,就是用计算机对图像进行处理,从而达到预想的目的。从内容上看,图像处理可概括为如下的几个方面:
图像增强( Image Enhancement) :主要是突出图像中需要的信息,而减弱或者去除汽车牌照识别与停车场管理系统设计与实现除不需要的信息,削弱干扰和噪声,从而使有用的信息的得到加强,便于区分或者解释。主要方法有直方图增强,伪彩色增强,灰度窗口等技术。增强后的图像未必和原来的图像一致。
图像复原( Image Restoration) :其主要目的是去除干扰和模糊,恢复图像的本来面目。经典的例子如去噪就属于图像复原处理。图像噪声包括随机噪声和相干噪声。去模糊也是复原处理的任务。
图像编码(Image Coding):在满足一定的保真度要求下,简化图像的表示,从而压缩表示图像的数据,以便于传输与存储。
图像重建( Image Reconstruction) :重建是从数据到图像的处理,也就是说输入的是某种数据,而处理结果得到的是图像。该处理典型的应用是CT 技术。图像的重建的主要算法有代数法,迭代法,傅立叶反投影法,卷积反投影法等,其中卷积反投影法应用的最为广泛。
图像分析( Image Encoding) :对图像中的不同对象进行分割、分类、识别、描述和解释,又可以称为图像识别。其中,图像分析可以认为是图像处理的高级阶段。图像分析主要研究的是使用机器分析和识别周围的视觉图像,从而得出结论性的判断,用于指导进一步的动作,这实际就是人类视觉系统的模拟,也是人脑各种功能模拟中最困难的领域。在图像分析中,图像信息的表达方式可以归结为下列几种:
(1) 原始的和模拟的图像信息,它是客观存在的图像,如一张照片等。
(2) 灰度数字图像,它是原始图像的数字化形式,可以用计算机进行增强、恢复等处理,通常要比原始图像有更好的视觉效果。
(3) 二值或标号图像,它是灰度图像经过分割处理后的产物,包括了图像所研究的物体的一般结构信息,如轮廓、边缘等。
本文中的对彩色车牌图像进行处理并对其中的数字进行识别。提取特征信息,其处理的最终目的是为了识别。处理时对于那些用于判别车牌号码的特征信息给予抽取,而其他信息则尽量予以舍弃,达到高度的信息压缩,并根据抽取的特征信息进行分类和识别。
2.1.2 图像的数字化表示
为了利用数字计算机来处理图像,首先必须把连续的图像变换成离散的数字图像。一幅数字图像是在其空间坐标上和灰度上都离散化并进行数字编码的图像。图像f(x,y)在空间坐标上的离散化称为采样;图像f(x,y)在灰度上的离散化则称为量化。经过采样和量化,图像f(x,y)可以用一个矩阵来表示,取行和列的交点标出图像的每个像素,每一像素对应一个灰度值。为实现数字化,灰度值必须离散,例如分成k个等级。一般量化与采样数值都取为2的整数幂。
如:一幅图像用512行×512列的矩阵来表示,即像素数为(512*512),灰度量化256(2的8次方),那么其二进制信息量为:
512×512×8=2097152(bit) (2-1)
2.1.3 本文中图像处理所涉及的相关领域
图像处理涉及了多种学科理论和应用知识,包恬人工智能、计算机视觉、机器人技术、拓扑学等多种学科。
本文主要涉及到的领域是计算机视觉。计算机视觉就是用计算机模拟人的眼睛和大脑,对客观世界进行视觉感知和解释。众所周知,视觉对人类来说是最有用的,但也是最复杂的一种感知周围环境的手段。随着科学技术的日益发展,计算机视觉的应用范围正在不断扩大。计算机视觉是机器人智能及第五代计算机的关键因素之一。计算机视觉的一般目的是根据从某一景物的图像中提取的信息对这一景物作结构描述、识别和理解。
2.2 图像二值化
在车牌自动识别系统中,从汽车的彩色图像信息输入到最终车牌号码的获取大致要经过如下几个过程:车牌图像二值化、区域分割、字符切分、字符识别。其中二值化是非常关键的一步,二值化的效果直接影响到后面的切分和识别。因为字符的切分和识别是基于车牌区域的二值化结果进行的。二值化算法又称为阈值算法,其目的就是要找出一个合适的阈值, 将待研究的区域划分为前景和背景两部分。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。为此,必须对二值化算法作深入细致的研究。
2.2.1 彩色图像和灰度图像
定义二维亮度函数f(x,y),其中,x、y是空间坐标,f(x, y)是点(x,y)的亮度幅值。 彩色图像由三个二维亮度函数f(x,y)组成(RGB色制为R(x,y),G(x,y),B(x,y))。(x,y)表示图像的空间坐标,R(x,y),G(x,y),B(x,y)三个函数的值表示配色方程中三色的色饱和度。根据配色方程,即图像中任意一点的色度,都可以用R(x,y),G(x,y),B(x,y)三各色饱和度函数相加得到。
灰度图像是一个二维灰度(或亮度)函数f(x,y)。(x,y)表示像素的位置信息,函数值就是该像素的灰度值。对于灰度图像而言,每个像素的亮度f(x,y)用一个数值来表示,通常数值范围在0到255之间,用灰度值0表示黑、用255表示白,其它值表示处于黑白之间的灰度。 对于将彩色图像转换成灰度图像时,图像灰度值可由下式(2—2)计算,
(2-2)
2.2.2 基于灰度的图像二值化
假设一幅灰度车牌图像的大小为M行N列,用f(x ,y) (0≤x (2-3) 这里的T 称为阈值(Threshold) ,经过二值化处理后,字符前景和车牌背景就由黑白两种颜色分开,选择不同的阈值会得到不同的分离结果。在车牌识别中对车牌灰度图像进行二值化的方法主要有全局动态二值化、局部自适应二值化。 2.2.2.1 全局动态二值化 全局动态二值化从整个灰度图像的像素分布出发寻求一个最佳的门限值,其中的经典算法是Otsu算法,它是在判别最小二乘法的基础上推导出来的。基本思想是:取一个阈值t ,将图像像素按灰度大小分为大于等于t 和小于t 两类,然后求出两类像素的平均值方差 (类间方差) 和两个类各自的均方差 (类内方差) ,找出使两个方差比 / 最大的阈值t,该阈值即为二值化图像的最佳阈值。这种方法不论图像的直方图有无明显的双峰,都能得到较为满意的效果。因此这种方法是阈值自动选取的较优方法。 具体方法如下: 设给定图像具有1 ,2 ,3 , ??,L ,共L 级灰度,阈值设为k ,把灰度大于k 和小于k 的像素分为两类。类1中的像素总数为 ,平均灰度为 ,方差为 ;类2 中的像素总数为 ,平均灰度为 ,方差为 ;所有图像像素的平均值为 。类间方差 和类内方差 分别由下几式决定: 算法的描述如下: ①求出图像中最大的灰度max gray ; ②令k = 0 ; ③求出大于和小于k的这两类像素总数和像素的灰度平均值; ④计算类间方差 和类内方差 ; ⑤k = k + 1 ,循环3~5 步,直到k > max gray ; ⑥找出最大的值,得到相应的阈值k。 Otsu 算法基于图像像素的灰度值分类,按照使类间方差与类内方差比值最大的原则获得门限值,使目标字符占用背景空间方差最大,即找出使两个方差比 / 的最大的阈值T ,这种算法具有以下优点: ①算法的实现简单; ②基于图像的整体特性的积分而非局部特性; ③可推广到多阈值的分割方法; ④该算法的适用性强。 然而,尽管该方法有一定的自适应性,但以灰度分布为特征,判决准则函数S ( k) = / 可能呈双峰,即全局最大值不能保证是正确的阈值;另外当图像存在光照不均匀的现象时,往往整幅图无法找到合适的单一阈值。 2.2.2.2 局部自适应二值化 局部自适应二值化是针对灰度图像中的每一个像素逐点进行阈值计算的,以当前点为中心选取一个适当的邻域模板,从这个模板中的像素灰度值中获得判据,来决定对当前点是置0 还是置1。文献中的LEVBB 算法是局部自适应算法的典型算法: ① 对每一点计算阈值: ②计算另一阈值T3 : ③对每点的阈值T2进行一次滤波处理得新阈 ④逐点对图像进行二值化 若(f (x ,y) > T4 (x ,y) ) 且(T3 (x ,y) > (T1 - min) ) 则b (x ,y) = 1否则b(x ,y) = 0 其中T1 满足 ,H(x)为灰度直方图。 2.2.2.3 二值化的方法很多,但又没有对任何目标对象都普遍适用的方法,必须根据具体的处理对象而定。二值化的关键是要找到合适的阈值t来区分目标和背景。根据本小节以上对灰度图像二值化的介绍,这里使用一种最简单直观的二值化——直接选择某个阈值t,由上式进行二值化。可以通过反复选择t的值套用公式,找到效果最佳的阀值。 2.2 边界提取算法选取 边界提取的算法采用Roberts边界检测算子(局部差分算子) ,其算法由下列公式给出: S(i,j)=|f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1-[f(i+1,j-1)+2f(i+1,j)+f(i+1,j+1)]|+|f(i-1, j-1) +2f(i,j-1)+f(i+1,j-1)-[f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)] | 取适当门限THs ,则若S(i,j)>THs ,则(i,j)为阶跃边缘点,其中S(x,y)是具有整数象素坐标的输入图像,平方根运算使该处理类似于在人类视觉系统中发生的过程。在边界提取算法中拉普拉斯算子的效果最好,然而它的计算量大,在车牌初步定位中使用Roberts算子也能满足需要。Roberts算子提取边界的结果如图4所示。 区域寻找与分割 得到边界图像后,就可以对其进行区域寻找和分割处理。在对288×768的二值边界图像处理时,使用隔5行对区域进行一次特征查找和识别,如果满足条件,就停止继续查找。直接从灰度图中剪切下所要的区域,以便做后续识别处理。车牌特征:在一定的矩形区域内,边界图像二值变换次数在一定范围内,本文识别方法是以车牌号区域内二值变化数范围(28-50 次)为主要搜索方法,辅助以区域外的图像二值变化数较少的特征来搜索所要的区域。目的是为了在搜索过程中减少搜到的冗余区域,以达到高的精确度和准确度。区域分割后的图像效果如图5 所示。 2.2.3 图像二值化结果演示 如图2—1、图2—2、图2—3所示,分别演示出了灰度处理后,二值化和取反后的车牌图像。但是,很明显可以看到取反后的图像上存在一些诸如螺丝钉等一些我们并不想得到,有可能对后续字符的识别产生严重影响的噪声点。 为了得到清晰且没有任何噪声的车牌图像。我将在下本一节中介绍用数学形态学的方法去除噪声的方法。实验证明效果很理想。 图2—1由彩色车牌经灰度处理后的灰度图像 图2—2二值化后的图像 图2—3二值化后图像取反得到白底黑字的图像 2.3 用数学形态学的方法去除噪声 二值图像中所有的像素点值只有0和1两种值,在形态学中,把0和1对应于关闭和打开,关闭对应该像素点的背景,而打开对应该像素点的前景。用这种方法很容易识别出图像的结构特征。本节主要讨论二值形态学的内容。 数学形态学的基本操作为膨胀、腐蚀。以及由膨胀腐蚀结合在一起的开、闭操作。击中、击不中操作。 (1) 腐蚀:是用结构元素S在被研究的对A中移动,当S全部在A中时,S的原点的位置留下,而其他的部分腐蚀掉。 (2) 膨胀:先做结构元素S的映射,S的映射在A上移动,当S的映射至少有一个点和A 重合是,其原点的位置将被保留下来。 (3) 开运算:是腐蚀和膨胀的综合,即先用S腐蚀A ,再用S膨胀A。 (4) 闭运算:跟升运算正好相反,既先膨胀,再腐蚀。 (5) 击中:被研究对象X,结构元素S1和S2,且S2和S1的交集是空集,击中的结果是X被S1腐蚀 的结果与X被S2膨胀的结果之差。 2.3.1 数学形态学的几种基本运算 膨胀和腐蚀是两个形态学基本的操作。本质上是用结构元素映射输入图像。二维或平面结构元素是一个包含0和1元素的数组。结构元素的中心像素成为原点,它是结构元素参与形态学运算的参考点,通常为用户期望的像素。 膨胀过程是在图像中对象的边界上添加像素点,而腐蚀是逆过程。对应的添加和移除像素点的数量依赖于图像结构元素矩阵的大小和形式。 2.3.1.1 膨胀 膨胀是在二值图像中“加长”或“变粗”的操作。这种特殊的方式和变粗的程度由一个称为结构元素的集合控制。图2—4说明了膨胀的计算过程。图2—4(a)显示了包含一个矩形对象的简单二值图像;图2—4(b)是一个结构元素,在此例中它是一条5个像素长的斜线。计算时,结构元素通常用0和1的矩阵表示;有时,如图中所示,为方便起见只显示1。另外,结构元素的原点必须明确标明。图2—4(b)用黑色方框标明了结构元素的原点。图2—4(c)明确地描述了膨胀处理,这种处理会将结构元素的原点平移过整个图像区域,并且核对哪些地方与值为1的像素重叠。图2—4(d)所示的输出图像在原点的每个位置均为1,从而在输入图像中结构元素至少重叠了一个1值像素。 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 a) 1 1 1 1 1 (b) 平移到这些位置的结构元素来覆盖原图像中的任何1值像素 * * * * * * * 当原点平移到“*”处时,结构元素在原图像中叠加1 * * * * * * * * 1 1 1 1 1 1 1 * * * 1 1 1 1 1 1 1 * * * 1 1 1 1 1 1 1 * * * * * * * * * * * * * * * (c) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 <, /TD> 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (d) 图2—4 膨胀示例:(a)带有矩形图像的原图像;(b)以对角线排列的有5个像素的结构元素。 结构元素的饿原点带有黑框;(c)平移到几个位置后的结构元素;(d)输出图像 数学上,膨胀定义为集合运算。A被B膨胀,记为A B,定义为式(2-4)其中,φ为空集,B为结构元素。总之,A被B膨胀是所有结构元素原点位置组成的集合,其中映射并平移后的B至少与A的某些部分重叠。这种在膨胀过程中对结构元素的平移类似于空间卷积。图2—4并没有明显的显示出结构元素的映射,因为这种情况下结构元素是关于原点对称的。图2—5显示了非对称结构元素及其映射。 (2-4) 1 (a) (b) 图2—5 结构元素映像:(a)非对称结构元素;(b)结构元素基于原点的映像 膨胀满足交换律,即 在图像处理中,我们习惯于令A B的第一个操作数 1 1 1 1 1 1 1 1 1 1 为图像,而第二个操作数为结构元素,结构元素往往比图像小得多。从现在开始,我们将遵循这个原则。 2.3.1.2 腐蚀 腐蚀“收缩”或“细化”二值化图像中的对象。像在膨胀中一样,收缩的方式和程度由一个结构元素控制。图六说明了腐蚀的过程。图 1 1 1 1 1 1 1 1 1 2—6(a)和图2—4(a)相同,图2—6(b)是结构元素,即一条短垂直线。图2—6(c)描述了副食在整个图像区域平移结构元素的过程,并检查在哪里完全匹配图像的前景部分。图2—6(d)所示的输出图像中,结构元素原点的位置的值为1,因而该元素仅叠加了输入图像的1值像素(即它并不叠加任何图像背景)。 腐蚀的数学定义与膨胀相似,A被B腐蚀 (2-5) 换言之,A被B腐蚀是所有元素的原点位置的集合,其中平移的B与A的背景并不叠加。 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (a) 1 1 1 (b) 在这些地方输出为0,因为结构元素叠加在背景上。 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 在这里输出为1,因为结构元素在就前景上完全匹配。 (c) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 (d) 图2—6 腐蚀的说明:(a)带有矩形对象的原图像;(b)垂直排列的3象素结构元素。结构元 素的原点加黑加粗;被平移到图像上不同位置的结构元素;(d)输出图像 2.3.1.3 膨胀与腐蚀的组合:开运算和闭运算 正在图像处理中的实际应用中,我们更多得以各种组合的 来使用膨胀和腐蚀。最常用的膨胀和腐蚀的组合,也是本课题中所使用的是开运算和闭运算。 A被B的形态学开运算可以记做A B,这种运算是A被B腐蚀后再用B来膨胀腐蚀的结果: (2-6) 开运算的另一个数学表达式为 (2-7) 其中, 指大括号中所有集合的并集,符号C D表示C是D的一个子集。该公式的简单几何解释为:A B是B在A内完全匹配的平移的并集。图2—7(a)事例了这种解释。图七显示了集合A和圆盘型结构元素B。图2—7(b)显示了B在A内完全匹配的一些平移。这些平移的并集为图2—7(c)中的阴影部分;这个区域即为开运算的结果。该图形中的白色区域是结构元素不能完全在A中匹配的区域,因而不是开运算的结果部分。形态学开运算完全删除了不能包含结构元素的饿对象区域,平滑了对象的轮廓,断开了狭窄的连接,去掉了细小的突出部分[2]。 A B B在A中平移 (a) (b) (c) (d) (e) 图2—7 开运算和闭运算是平移的结构元素的并集:(a)集合A和结构元素B;(b)在集合A内完成匹配的B平移;(c)开运算的结果(平滑区域);(d)B在框A外平移;(f)闭运算 结果; A被B的形态学闭运算记做A B,它是先膨胀再腐蚀的结果: (2-8) 从几何学上讲,A B是所有不与A重叠的B的平移的并集。图2—7(d)显示了一些与A不重叠的B的平移,通过完成以上平移并集操作,我们得到了图2—7(e)所示,这就是闭运算的结果。像开运算一样,形态学闭运算会平滑对象的轮廓。然而,与开运算不同的是,闭运算一般会将狭窄的缺口连接起来形成细长的弯口,并填充比结构元素小的洞。 2.3.2 经开闭运算前后的图像对比显示 图2—8 经二值化去反后的图像 图2—9 经开闭运算后去除噪声的图像 如图2—8和图2—9所示,经过开闭运算,原来存在于图片中的如螺钉污点等噪声已经被成功滤除; 2.4 单个字符图像的分割 2.4.1 我国车牌的特点 目前我国汽车牌照制式的主流是 1994年7月1日启用的92式号牌,如下表所示: 表2—1 车牌制式表 汽车类型 大型汽车 小型汽车 使馆汽车 领馆汽车 境外汽车 外籍汽车 规格 前440*140,后440*220 440*140 440*140 440*140 440*140 440*140 颜色 黄底黑字黑框线 蓝底白字白框线 黑底白字红“使”字白框线 黑底白字红“领”字白框线 黑底红字红框线 黑底白字白框线 牌照的第一位是省份的简称,汉字;第二位是发证机关,字母,其中I不用;第三位、第四位是数字或字母(92式号牌原来规定第四位是数字,但由于编码饱和,许多城市己用上字母了),其中字母I、O不用,后三位是数字。牌照中,每个字符宽45mm,高90mm,间隔符宽10mm,每个单元间隔12mm,所以牌照实际字符区的大小为409mm X 90mm。 2.4.2 对所要识别的车牌的分析 对车牌二值化后,下一步就是进行字符分割,取出车牌的7个字符。采用何种字符分割策略必须在充分了解车牌区域图像的特征基础上才能进行。 我国存在不同的车牌颜色类型,主要是蓝底白字和黄底黑字两种。蓝底白字的车牌区域经二值化后,字符颜色是白色,背景是黑色;黄底黑字经二值化后,字符颜色是黑色,背景则是白色。但是,经过对黑背景白色字体的图像进行取反操作,已经可以将图片都转化成白色背景黑色字体的图像。 车牌区域字符的宽度、高度、字符之间的间隔都有一定的比例(详见表二), 由于拍摄的角度的缘故,实际比例和标准比例会有一定偏差,但这些偏差反映到图像上并不大,就本文研究的图像来说,通常偏差只在一到二个像素之间。 2.4.3 基于列扫描黑色像素积累的字符分割 经过牌照定位与二值化后得到的是一块只包含牌照字符的水平条形区域,为了下一步输入字符识别部分进行识别,需要将这些字从牌照二值图像中一一分割出来。通常车辆牌照的字符大小、字体以及排列间隔都是按一定的标准,绝大多数都只有一行,而位置的安排和间隔很有规律性,共有七位字符:第一位是汉字,通常代表车辆所属的省份,或是军种、警别等有特定含义的字符简称,第二位为大写的英文字符,一个圆点间隔之后的第三位是英文字母或是数字,其余的四位均为数字。 如车牌上共有 n个字符。图像上字符部分为黑色,背景部分为白色。计算图像在列方向上的黑色像素分布曲线。因为字符之间有一定的白色间距,所以黑像素分布曲线中会有n-1个谷底部分。划分出谷底的上坡线和下坡线就可以得到2*n-1个边界值作为图像分割的界限。 假设图像矩阵为:356*90(356行90列)。有7个字符。 计算出列方向黑像素分布 从6个谷底得到13条上坡线和下坡线 按坡线分割图像 图 2-10 在不同大小的同一块车辆牌照图像中,由图(2-10)的算法进行分割比较试验。结果表明,都能正确地定位并分割出牌照区域,正确地分割出每一个牌照字符,实验表明,该算法对牌照大小具有较好的容忍度。 2.4.4 已经分割后的单个字符演示 如图2—11所示,按上述方法将二值化后的车牌字符分割成七幅单个的字符图像,分割效果很理想。 图2—11分割后的图像 2.5 本章小结 对彩色车牌图像的预处理是字符识别环节的前奏。车牌预处理效果的好坏将关系到字符识别是否能够成功。因此,本章通过对车牌图像进行灰度处理、灰度图像二值化、并且用数学形态学中的开闭运算对图像中的污点进行噪声虑除,之后又利用列方向黑色像素积累的方法将车牌图像分割成七幅单个字符的图像以对下一步的字符识别做准备。 第3章 基于字符形态划分的字符识别 3.1 字符识别概述 基于字符形态划分的字符识别原理是一种完全基于结构知识的字符识别方法。该方法以字符的结构特点和笔画类型、数据及位置作为识别基础。对汽车牌照中的字母和数字进行分类识别。 汽车牌照识别是基于图像分割和图像识别理论,对含有汽车牌照的图像进行分析处理,从而确定 汽车牌照在图像中的位置,并进一步提取和识识别出文本字符。从不同车牌图像中分割出的字符图像各不相同,尺寸变化范围大,增加了识别的难度。尽管可以采用图像变换方法将分割出的所有字符图像归一化为相同尺寸,但归一化过程又不可避免地丢失有用的字符信息,造成图像失真,无助于提高识别准确率,并且浪费时间,降低了识别速度。 本文通过分析汽车牌照的特点,提出了一种利用字符的笔画特征和结构知识对汽车牌照中的字母和数字进行识别的方法。试验表明,该方法识别速度快、准确率高,不受字符图像大小影响,适应性强。 与其它识别系统一样,牌照字符识别系统的关键也在于字符特征的提取,也就是如何选取既容易提取又能为识别系统提供尽可能高的模式鉴别能力。特征的提取和选择对识别系统至关重要,它基本上决定了识别系统的性能和识别精确度,甚至还可能影响到整个系统的识别的成功与否,一般来说,用于字符识别的分类特征应满足以下要求: 具有较强的分辨能力,即同一类中各样本间距离应尽量小,而字与字之间的差距应尽量大,最好没有交叠部分。具有较高的稳定性和抗干扰性,对字符的平移、旋转和尺度变换不敏感,受字符笔划断裂或粘连的影响尽可能小。特征码应便于提取,算法要尽量简便,在保证识别系统的性能的条件下,特征码的算法代价不能过高,以减少机器开销,提高运算速度。 3.1.1 目前字符识别的一些常规方法 与其它的字符识别系统一样,牌照字符识别系统的关键在于字符特征提取和模式匹配。在特征提取和匹配时主要有以下几种方法:一种是利用字符的结构特征和变换进行特征提取,如:Fourier 变换、Karhuren-Loeve 变换等,这种方法对字符的倾斜、变形都有较高的容忍度,但运算量巨大,对计算机性能要求高;一种是利用字符的统计特征进行特征提取,目前多数字符识别系统均采用此方法;还有一种是基于字符结构分析的识别方法,这种方法可以识别有较大旋转、变形、缩放的字符图像,但需要进行复杂的字符笔划分析和抽取,对牌照字符图像质量要求较高。考虑到车辆牌照字符中只有26 个大写英文字母、10 个阿拉伯数字和50 个左右的汉字,所组成的字符集合较小,因此在实验归纳的基础上提取出较多的正交特征码是可能的。 MATLAB语言是由美国MathWorks公司推出的计算机软件,经过多年的逐步发展与不断完善,现已成为国际公认的最优秀的科学计算与数学应用软件之一,是近几年来在国内外广泛流行的一种可视化科学计算软件。它集数值分析、矩阵运算、信号处理和图形显示于一体,构成了一个方便的、界面友好的用户环境,而且还具有可扩展性特征。实验证明该软件功能强大,语言简洁易学,人机界面友好,工具箱具有丰富的技术支持并集成了该领域专家的智慧,应用简单而效果良好。 3.2 字符轮廓分析 目前为止,已经有成熟的OCR商业软件,或者其他形式的产品。但在实际应用中,要根据实际需要开发精简的识别算法。这里介绍一种采用数字字符轮廓结构特征和统计特征相结合的方法,并从中选出稳定的局部特征,利用结构语句识别的方法进行数字的识别。能够实现多种样式的数字的准确识别。同时还提高了识别的速度。 我国汽车牌照中使用的字符包括59个汉字、25个英文字母(字母I不用)和10个阿拉伯数字三种类型共94个,且都是印刷体,结构固定、笔画规范。图1是车牌号码中使用的全部字母和数字的图像。这些字符的形态有5种类型:a左斜(L)、b右斜(R)、c竖直(V)、d圆弧(C)、和e突变(P)。如下图(3-1)。数字字符就是这5种基本字符形态的组合。所以,基于字符形态划分的字符识别的基本原理就是先通过字符轮廓提取出字符的形态信息,然后通过形态组合识别字符。 3.2.1 字符轮廓的划分 由于受噪声和随机污点的干扰,以及基于连通值的图像腐蚀和膨胀会引起字符的变形。为了尽量减少这种变形对信息特征的干扰,或者从变形的字符中提取可靠的特征信息,将字符的整体轮廓分解为,顶部,底部,左侧和右侧4个方向的轮廓特征来描述。是的当中某部位的笔划发生变形时,不会改变或者减少对其它部位特征的影响。 3.2.2 字符四方向轮廓公式化表示 字符轮廓可以分解为顶部,底部、左侧和右侧4个方向。下面对每个方向的轮廓定义作出论述: 左侧轮廓由式(3-1)(LP(k),k=1,2,?,M)定义为字符最左侧边界像素点的水平方向坐标值。 (3-1) 式 (3-1)中P(x,y)表示图像中坐标为(x,y)像素点的水平方向坐标值。同理,右侧轮廓由式(3-2)定义为为字符最右侧边界像素点的水平方向坐标值: (3-2) 相应的,顶部轮廓(TP(k),式(3-3))定义为字符最高边界像素点的垂直方向坐标值。底部轮廓(BP(k),式(3-4))定义为字符最低边界像素点的垂直方向坐标值。 (3-3) (3-4) 左侧、右侧、顶部和底部轮廓定义如图(3-1): 3.3 字符轮廓的变化特征 轮廓的整形: 为了描述轮廓的变化特征,定义4个方向轮廓的一阶微分: (3-5) 式(3-5)中 Y RP 0 BP TP 0 L 图3-1字符轮廓定义示意图 3.4 字符形态划分的结构基元 3.4.1 字符结构基元划分原理 利用上面的轮廓一阶微分变化趋势,可以定义构成字符轮廓的基本基元。基本基元共有5个,分别为:左斜(L)、右斜(R)、竖直(V)、圆弧(C)、和突变(P)基元: (1) 竖直 定义:假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数。若SR=0,SL=0,则微结构V。如图(3-2 a)所示: (2) 左斜 定义:假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数。若:SR=0,SL大于阈值LT,则为结构L,如图(3-2 b) (3) 右斜 定义:假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数。若:SR=0,SR大于阈值RT,则为结构R,如图(3-2 c) (4) 圆弧 定义:假设SL,SV和SR分别表示某侧轮廓一阶微分值大于零,等于零和小于零的个数。若:SR大于阈值RT,SL大于阈值LT,则为结构C,如图(3-2 d): 需要指出的是,圆弧示意图只是一种抽象,它表示结构中包含了上升和下降的两种趋势。而不仅仅只是如图(3-2 d)所示的具体形状: (5) 突变 对于连续的字符轮廓,其一阶微分值的变化量比较小,而当字符轮廓不连续时,其一阶微分值相对较大。因此,定义:当轮廓的一阶微分值超过阈值PT时则字符轮廓有突变,即为结构P,如图(3-2 e)所示: 基元结构示意图如图所示。 间断 图 3-2 字符基元结构示意图 [11] 。以左侧轮廓为例,定义上述基本 a b c d e 3.4.2 字符形态划分方法的特点 字符形态划分方法具有如下特点: 对字符进行充分的分析后得到的5种笔划,是对字符形态的充分解析。 字符结构相对独立,正交性好。识别误码率小。 不需要将待识别的字符与全部字符进行匹配识别,因而提高了识别速度和准确率。 3.5 利用字符结构基元划分的字符识别原理 字符的形态已经划分为5种类型斜(L)、右斜(R)、竖直(V)、圆弧(C)、和突变(P) 。数字字符可以是由5种基本字符基元中若干种的组合。 先对字符形态进行解析,得到每个字符是哪几种基元的组合。然后对图像上检测到的基元进行字符形态的重构。就可以识别出数字字符了。 3.5.1 基元的检测 根据上述的定义,考虑实际应用中存在的干扰,基元的检测规则如下: 假设PD(k)表示某侧轮廓的一阶微分,k=1,2,?,K,SL,SV和SR分别为检测到的PD(k)大于零,等于零和小于零的个数,PT、RT和LT为正整数,则: (1) 若PD(k)≥PT,则在k处检测到结构突变(P); 若SL (2) 由于字符轮廓突变处,表示字符轮廓不连续,则突变前后的轮廓特征必须分别检测。即若k1处检测到P,则在[1,k1-1]的字符轮廓范围内统计SL,SV和SR独立进行结构基元检测。若在k2处又检测到P,则在[k1+1,k2-1]范围内进行基元检测,依此类推。 (3) 由于字符轮廓基元形成需要一定数量轮廓像素点,即只有当SL+SV+SR≥T时,才能进行基元检测,否则不进行基元检测。例如,当SL+SV+SR=2时,其形成的基元结构是不稳定。 (4) 检测到突变结构P的有效范围在x∈[ST,N-ST+1] ,y∈[ST,M-ST+1],其中ST表示字符笔划的宽度。这主要是为了避免干扰严重情况下,轮廓边缘光滑处理不够理想时,可能检测到的假突变基元。 3.5.2 轮廓的统计特征 采用上述的结构基元还不足以准确识别残缺和完整的数字,下面引入轮廓的统计特征加以补充。 (1) 水平方向的最大字符宽度Wmax: (3-6) 该特征主要用于识别数字1。当 ,即为数字1,H=M。 (2) 垂直方向的笔划数 M为字符笔划高度,ST为字符笔划宽度。 该特征主要用于识别数字0和8。因为0和8的轮廓结构特征及其相似。所以借助于垂直方向笔划数加以区分。受数字底部残缺的影响,8在垂直方向上的最大笔划数也可能为2。采用检测到笔划数为2时垂直方向的最小值S2来代替。 假设j列上像素点 ,检测到垂直方向的笔划数为1,在 检测到了第二个笔划,则 ,表示,检测到第二个笔划像素点的位置。当 时,检测到的字符为8,否则为0。 3.5.3 用字符形态识别数字字符 用字符形态识别数字字符,首先要分析数字字符的特点,然后针对每个数字字符的特点,对应上面字符形态模型的内容,得到形态模型组合与数字字符的关系。 3.5.3.1 数字字符的特点 数字字符是这5种基本字符形态的组合。十个数字为:0123456789 下面逐个分析阿拉伯数字的特点: 0: 顶部轮廓是圆弧,且左侧轮廓和右侧轮廓各有一个圆弧,检测到垂直方向第二个笔划的位置在 左侧。 1: 水平方向的最大字符宽度小于字符高度的一半。 2: 顶部轮廓有一个圆弧,并且左侧轮廓有两个基元,一个是突变另一个是左斜。 3: 顶部轮廓有一个圆弧,并且左侧轮廓不是圆弧而是突变。 4: 顶部轮廓是左斜并且还包含一个突变,右侧轮廓是竖直。 5: 顶部轮廓是竖直,右侧轮廓有一个突变。 6: 顶部轮廓是圆弧,右侧轮廓有一个突变,左侧轮廓有一个基元(圆弧)。 7: 顶部轮廓是竖直,左侧轮廓有一个突变,右侧轮廓有一个基元(左斜)。 8: 顶部轮廓有一个圆弧,左侧和右侧各有一个基元(圆弧)。检测到垂直方向第二个笔划的位置在 右侧。 9: 顶部轮廓有一个圆弧,左侧轮廓有一个圆弧,还有一个突变。 3.5.3.2 数字字符的识别方法 将数字字符的顶部、左右两侧的局部轮廓结构特征和轮廓统计特征组合成特征向量,用以描述10个数字。根据特征向量,采用结构语句识别算法识别底部残缺的和完整的数字字符配识别都从顶部轮廓特征开始。局部轮廓结构特征和统计特征描述数字: Size()表示结构集合中有几个结构元素。 Ln表示左侧轮廓的结构元素个数。 [16] 。由于 底部特征丢失,会改变左右两侧的部分结构特征,但不会影响顶部特征。因此特征描述和机构匹 3.5.4 字符识别的matlab算法流程 输入字符图像 将文字图像归一化到24像素点的高度 左端, 轮廓检测 右端轮廓检测 结构特征提取 采用四边的轮廓结构特征和笔划统计识别字符 输出结果 图3-3单个字符识别流程图 采用四边的轮廓结构特征和笔划统计识别字符所得的结果如图所示 (a) (b) (c) (d) 图3-4数字识别结果的边框图形演示:(a)车牌中第一个数字0的轮廓识别结果;(b)图车牌中第二个数字8的轮廓识别结果(c)图车牌中第三个数字2的轮廓识别结果(d)图四车牌中最 后一个数字8的轮廓识别结果 3.6 本课题整体流程 汉字识别部分 车牌汉字字符特征提取按如下几个方面进行: 1车牌汉字的笔画特征。本文中车牌汉字的笔画特征主要是指通常意义上的汉字字体的笔画,比如横、竖、撇、捺等四种。 2 车牌汉字的结构特征。本文中车牌汉字的结构特征主要是指通常意义上的汉字字体的‘左右结构’、‘上下结构’、‘独立结构’。 3 车牌汉字的结构特征。本文中车牌汉字字符的笔顺结构主要是指通常意义上的汉字字体书写时的大致的习惯顺序,比如从上到下、从左到右2种。 车牌汉字字符特征提取是结合字体的笔顺特征进行。首先,利用图像的分割扫描字体的结构特征,比如车牌汉字字符中的‘鄂’字先分为左右结构,再分为上下结构,以此类推,最后定位在‘口’字独立结构上;同时分别编码为1(左右结构),2(上下结构),3(独立结构)。定义字体的结构特征为5维向量,不足的补零,最后‘鄂’字的结构特征被编码为XA=[12123]。同理,车牌汉字字符的‘京’字被编码为XA=[23003](其中的0表示本次特征扫描中没有数值,即为空数据)。其次,按‘笔顺’(即从上到下、从左到右)扫描字体的笔画类型,并编码‘横’为1,‘竖’为3,“撇”为2,“捺”为4,并定义用一个5*7的矩阵存储每一个汉字的笔画特征数据。其中的维数5对应于字体的结构特征向量的维数,7对应于字体的笔画分析,要求精确到笔画数。例如,构成车牌汉字字符的“川”字的每一个结构字块的分析为: 其中的0表示本次特征扫描中没有数值,即为空数据。 4车牌汉字字符的模糊模式识别 模糊处理:由于扫描字体笔画类型过程中,同一种笔画类型的走向可能不同。尝试进行模糊描述。为此建立如下的隶属函数以描述笔画特征: “横”1:1-abs(θ-90/17.5),72.5<θ<90; 1-abs(θ+90/17.5),-90<θ<-72.5; “竖”3:1-abs(θ/7.5),-7.5<θ<7.5; “撇”2:1-abs(θ+40/32.5);-72.5<θ<-7.5; “捺”4:1-abs(θ-40/32.5);7.5<θ<72.5。 利用上述方法分别对要识别的汉字进行特征提取,以建立标准样本识别库。 贴近度的计算:选择格贴近度 (A,B)=A*B^(A(θ)*B(θ)); 其中,A代表待识别样本的特征矩阵; B代表标准识别样本的特征矩阵; θ代表字体的笔画走向角。 识别的实现:分别计算待识别汉字与标准样本汉字的贴近度,把贴近度最大的作为识别结果。字符标准识别样本字库:京、津、沪、渝、冀、豫、黑、吉、辽、皖、鲁、新、苏、浙、赣、鄂、桂、甘、晋、蒙、陕、闽、贵、青、藏、川、宁等。 识别过程实验测试用例分析 本文在WindowsXP操作系统下进行程序设计,在VC+6.0环境下设计实现了人机交互界面,采用MATLAB语言编程实现,在MATLAB6.5环境下设计了车牌汉字字符的特征提取和模糊识别相关子程序。 用于实现车牌汉字字符模板初始化的iniffmwork()函数,用于实现车牌图像细化的thin()函数,用于车牌汉字字符结构特征提取的jgfx()函数,用于车怕汉字字符笔画特征提取的bhfx()函数,和用于计算机模糊匹配度计算的adhere()函数等等。 在VC++6.0中,相应源程序中的主要调用语句如下: engEvalString(ep,“[CB,CMAP]=bmpread(‘picturel.bmp’,‘bmp’);”); engEvalString(ep,“imshow(CB,CMAP);”); engEvalString(ep,“title(读入图片);”); engEvalString(ep,“CB = thin (CB,CMAP);”); engEvalString(ep,“imshow(CB,CMAP);”); engEvalString(ep,“title(细化处理);”); engEvalString(ep,“CB=fanse(CB);”); engEvalString(ep,“figure;”); engEvalString(ep,“imshow(CB,CMAP);”); engEvalString(ep,“title(反色处理);”); engEvalString(ep,“xarange=5;”); engEvalString(ep,“xbrange=7;”); engEvalString(ep,“TO=double(CB);”); engEvalString(ep,“[M,XA,xanum]=jgfx(TO,xarange);”); engEvalString(ep,“[XB,XU,XM,xbnum]=bhfx(M,TO,xarange,xbrange);”); engEvalString(ep,“wordrange=30;”); engEvalString(ep,“[AM,BM,UM,BMNUM]=iniffmword(wordrange);”); engEvalString(ep,“[maxend,flagp]=adhere(XA,XB,XU,AM,BM,UM,BMNUM,wordrange,xbnum);”); 图1 VC 界面图 图2 结构分析 图3 结构分析 图4 结果显示 3.6.1 对本课题流程的总体说明 一般的车牌识别系统分为如图所示三部分: 车牌定位 字符分割 字符识别 图3—5一般车牌识别系统框图 而本课题主要研究的是字符分割和字符识别两部分。在字符分割之前要得到已经进行部分处理后的图像。因此,本文在整体上分为两大部分。分别是车牌图像的预处理和字符识别。 在车牌图像的预处理部分要完成任务是:将所拍设下来的彩色车牌图像进行二值化并变成白底黑字的车牌图像,之后,通过数学形态学在MATLAB中的应用来进行车牌中存在的一些噪声的处理。然后根据对图片中列方向的黑色像素的积累的特点,通过列扫描的方法分析了图片的特征,由此,分割出七幅单个字符的图像。为下一补的字符识别做了准备。 在字符识别这一环节中。因为汉字的识别涉及到庞大的模式识别系统,所以本文主要是对车牌中数字的识别。而数字识别也主要是基于字符轮廓和基元检测的方法进行识别。此方法简化了程序,并得到了较好的效果。 3.6.2 用MATLAB完成本课题的流程图 开始 输入车牌图像 彩色图像转化成灰度图像 将灰度图像转化成二值图像 用开闭运算去除车牌中噪声 将图片分割成七幅单幅图像 输入单幅图像 四方向轮廓特征提取 基元检测 结构识别 输出结果 终止 图3-6车牌识别系统整体流程图 3.7 基于字符形态划分的字符识别方法的特点和不足 该方法是对字符结构的充分析构下通过归纳的方法的到的。 它的特点是: 不需要建立识别样本库,完全依据字符自身的结构特征进行逼近识别。 不需要将待识别字符与全部字符进行匹配识别,只需要归纳出较少的若干字符形态特征,(一般不超过3个特征,就可以识别出字符)因而提高了识别速度和准确率。 该方法的不足之处是对图像画质的要求较高,图像噪声对字符形态的影响是较大的。由于采用了基于连通值的去噪方法,所以一定程度上弥补了不足。对于噪声直径小于字符笔划宽度的情况可以较好的进行识别,但是对于噪声直径大于字符笔划宽度的图像,识别的结果可能会有所偏差。因此,基于字符形态划分的字符识别方法虽然拥有诸多优点,但还要接受更多的挑战。 3.8 本章小节 本章是对已经进行二值化,并且已经分割好的单幅字符图像进行识别。这一章是车牌号码中数字的自动识别研究的关键。通过对基元的检测,字符轮廓的统计。用一种简单易行的方法实现车牌中数字的自动识别。 结 论 本文是用MATLAB软件对车辆牌照中数字的自动识别。属于计算机视觉与模式识别领域的交叉应用。在本文中应用到了大量的MATLAB中关于图像处理方面的函数,并涉及到了数字图像处理,计算机应用等多方面的学科。 预处理中,图像灰度处理,图像二值化等方面充分利用了MATLAB的函数库,是程序简单易读且可实施性很强。在图像去噪方面应用了数学形态学中的开闭运算,实现了车牌中铆钉的有效去除,效果良好。字符图像分割,则是在对我国车牌的细致分析下,针对我国车牌的特点采用了列向量黑色像素积累的方法。事实证明此方法简单实用。 在字符识别环节,介绍了基于字符形态划分的字符识别方法。从字符的笔划上对字符进行解析和重构。实验结果表明,对于经过良好去噪的图像字符识别效果也是比较理想的。 程序中一切都从简单化出发,所以一些算法中还存在许多的不足。但是在完成本科毕业设计中,查阅了大量的相关资料,自我学习能力有了进一步提高。 近些年来,国内外许多学者经过对车辆牌照自动识别的研究,现在已经有许多新的方法涌现。相互取长补短,克服了车辆牌照自动识别系统的一些不足和欠缺的地方。本文也汲取了前人的一些 精华。虽然,还不是很成熟,但是如果经过进一步的优化,相信可以更进一步的提高识别的质量,达到工程实用的效果。 参考文献 [1] 李尚生,姜永华.瞬时中频测试技术及其在捷变频雷达测试中应用[J].电子测量技术,2000(1):36—38. [2] 王云新,江俊峰,刘铁根.光电检测电路设计[J].电子测量技术,2005(6):18—19. [3] 李华。MCS-51系列单片机实用接口技术[M].北京:北京航空航天大学出版社,1993. [4] 李朝青.单片机原理及接口技术[M].北京:北京航空航天大学出版社,1998. [5] 薛栋梁.MCS-51/151/251单片机原理与应用(二)[M]。北京:中国水利水电出版社,2001. [6] 徐爱钧.单片机高级语言C51编程与应用[M].北京;电子工业出版社,2001. [7] 王大印。基于数字图像处理的车牌识别系统。北京工业大学。理学硕士学位论文。2003年5月。1~3 [8] 程健。汽车牌照自动识别技术的研究。汕头大学。硕士学位论文。2003年3月,6~7 [9] 应宏微。汽车牌照静态图像识别系统的研究。浙江工业大学。硕士学位论文。2004年4月。1~3 [10] 王家文、曹宇编著。《MATLAB 6.5图形图像处理》国防工业出版社,1989年,170~171 [11] 冈萨雷斯,[美] Rafael C.Gonzalez、 Richard E.Woods 、Steven L.Eddins 编著。《数字图像处理(MATLAB版)》Digital Image Processing Using MATLAB。阮秋琦等译。电子工业出版社,2005年9月,252~263,305~307 [12] Abhijit S。Pandya, Robert B。Macy 著,徐勇等译,神经网络模式识别及其实现,电子工业出版社,1999(6),35~55 [13] Darwiche E,Pandya A。S,and Mandalia A。D, “Automated opticalrecognition of degraded characters” SPIE vol。1661,1992 [14] Nelson。M, The Data Compression Book, M & T Books, San Mates, CA, [15] Naito T,Tsukada T,Yamada ,et al. Robust license2plate recog2 nition method for passing vehicles under outside environment [J ] . IEEE Transactions on Vehicular Technology , 2000 , 49(6) :2309~2319. [16] 叶芗芸,等. 文本图像的快速二值化方法[J ]。红外与毫米波学报,1997 ,16(5) :344~350 [17] 龙建忠。汉字识别算法研究及其在车牌识别系统中的应用。四川大学电子信息学院。2003年。8~10 [18] 韩永强,李世祥,汽车牌照子图像的定位算法,微型电脑应用,1999,15(3),14~16 [19] 宋建才。自符结构知识在车牌中的应用。计算机应用。2004年第四期。18~19 [20] 李宏升,利用牌照识别技术的停车场安全防盗系统,计算机系统应用,1999,10(5),14~16 [21] 叶晨洲,廖金周,一种基于纹理的牌照图像二值化方法,微型电脑应用,1999,6(5),28~ 29 张引,潘云鹤.面向车辆牌照字符识别的预处理算法.计算机应用研究,1999,7:85- 87. [22] 刘玲,张兴会。智能化车牌识别系统研究。仪器仪表学报。2005,25(4),476~478 . 翻译中文 前言 数字图像处理的特点在于需要大量的实验工作来确定给定问题的求解方法。本章将简要地介绍将数字图像处理中的理论与现代软件及成为一个原型环境的方法,其目的是为求解图像处理中的各类问题提供有着良好支持的工具集。 1.1背景知识 图像处理系统基础设计的一个重要特点是测试及试验的有效程度,正常情况下,这在得出可接受的解决办法之前是需要的。这一特点意味着公式化方法和快速圆形候选求解方法的是现在减少运算开销及时间方面会起重要作用。 以教学素材的方式在软件环境的充分支持下填补理论与应用之间空白的著作并不多。本书的主要目的是将宽泛的理论概念与现代图像处理软件工具实现这些概念所需要的知识集成在一本书中。在后续章节中,素材的基础理论主要源于Gonzalez and Woods所著(并由Prentice Hall出版社出版)的教材《数字图像处理》。软件原码和支持工具基于Math Works公司的MATLAB图形处理工具箱中的软件包。本书的素材与Gonzalez and Woods所著的教材《数字图像处理》中描述的结构、符号及风格相同,这样,两本书相互参考就简单多了。 本书自成体系。为了掌握本书的内容,读者应有图像处理方面引导性的准备,学习过本科高年级或研究生一年级的正规课程,或者具有自学变成所必需的背景。读者还应熟悉MATLAB以及初步的计算机编程基础知识,例如要有大学二年级获三年级水平的面向技术的编程语言方面的指示。由于MATLAB是面向数组的语言,所以矩阵分析的基本知识也很有用。 本书的特点是以原理为基础,通过教材的形式进行组织和表达,而不是一本手册。因此,在开发任何新的编程设想之前首先会介绍理论和软件的基本概念。利用大量的例子说明并且进一步阐述本书的材料,这些例子涵盖了从医学和工业检测到遥感和天文。这一方法可以从简单概念到图像处理高级算法的实现循序渐进地介绍。然而,已经熟悉MATLAB、IPT和图像处理基础的读者可以直接进入感兴趣的特殊应用,在这种情况下,书中的函数就可作为IPT函数的一种扩展来使用。本书中开发的所有函数都有丰富的文档资料,并且每个函数的源代码都包含在各章节或附录C。 本书后续章节中开发了60多个函数。这些函数把IPT中大约175个函数及补充并扩展了近35%。另外,为了配合特殊应用,新汉书还举了例子,这些例子说明了八已有的MATLAB和IPT函数与新的源码结合在一起的方法,以便在数字图像处理较宽泛的领域内开发原型求解方案。工具箱函数以及本书中开发的函数可在大多数操作系统下运行。本书的WEB站点提供了一个完整的列表。 1.2什么是数字图像处理 一幅图像可以定义为一个二维函数f(x,y),其中x 和y是空间坐标,而f在任意一对坐标(x,y) 处的幅度称为该点处图像的亮度或灰度。当x,y和f的幅值都是有限的离散值时,称该图像位数字图像。数字图像处理就使用计算机处理数字图像。注意,数字图像是由有限数量的元素组成的,每个元素都有一个特殊的位置和数值。这些元素成为画素或像素。像素是广泛用于定一数字图像元素的术语。第2章中将正是地讨论这些定义。 视觉是我们感觉中最高级的,因此,图像在人类赶制中起着最重要的作用并不令人奇怪。然而,人类的视觉限制在电磁波谱的可视波段,而成像机器几乎覆盖了全部电磁波谱,其范围从伽玛射线靠无线电波。他们还可以在人类不常涉及的图像源所产生的图像上进行处理,包括超声波、电子显微镜和计算机产生的图像。这样,数字图像处理就包含了很宽泛的应用领域。 图像处理所涉及的领域到底有多广,作者们并无统一的见解。有时,人们将图像处理为其输入和输出均是图像的一个科学。但我们认为这存在局限性,并有点认为界定的意思。例如,在这种定义之下,计算图像的平均亮度这种简单任务将不被认为是图像处理操作。另外,存在像计算机视觉这样的领域,其最终目的使用计算机来模仿人类视觉,包括学习和推理,并根据视觉输入采取相应的行动。该领域本身是人工智能的一个分支,其目的是模仿人类智能。人工智能的研究领域从发展的意义上看还处于初始阶段,迄今站要比预期的慢得多。图像分析领域(也称图像理解)介于图像处理和计算机视觉之间。 图像处理和计算机视觉之间并没有明显的界限,但我们可通过考虑三种类型的计算机化处理来加以划分:地基、中级和高级处理。低级处理包括原始操作,如降低噪声的图像预处理、对比度增强和图像锐化。低级处理的特点是其输入与输出均为图像。图像的中级处理涉及诸如分割这样的任务,几把土乡分为区域或对象,然后对对象进行描述,以便把他们简化为师和计算机处理的形式,并对单个对象进行分类(识别)。中级处理的特点是,其输入通常是图像,但输出则是从这些图像中提取的属性(诸如边缘、轮廓以及单个对象的特征)。最后,高级处理通过执行通常与人类视觉相关的感知寒暑,来队是别的对象进行总体确认。 基于前面的注释,我么可知图像处理和图像分析之间的重叠之处是图像中单个区域或对象的识别。这样,本书中所谓的数字图像处理就包含了其输入和输出都是图像的过程,从图像中提取特征的过程,以及对单个对象进行识别的过程。为说明这些概念,我们现在考虑文本的自动分析这一领域。该领域的图像获取过程,包括文本、于处理图像、提取(分割)个别字符、以适应计算机处理的形式描述字符以及识别这些个别字符,就在本书中所谓的数字图像处理范围之内。弄清这些内容后就了解了图像分析和计算机是觉得领域。正像我们所定义的那样,数字图像处理已成功用于许多领域,给人们带来了巨大的社会和经济价值。 如前一章所述,MATLAB为数字图像处理来了一套广泛的函数,这些函数处理的是多位数组,而土乡(二位数值数组)正是多维数组的一种特例。图像处理工具箱(IPT)扩展MATLAB是数值计算能力的函数,这些函数与MATLAB语言的简洁表示,使得大量的图像处理操作可以按简洁明了的编码方式进行,从而为求解图像出问题提供一个理想的软件圆形环境。在这一章中,我们将介绍MATLAB表示法的基本知识,讨论大量的IPT基本属性和寒暑,并介绍能进一步增强IPT的程序设计概念。因此,本章中的内容是后续大部分章节的内容的基础。 2.1数字图像的表示 一幅图像可以被定为一个二维函数f(x,y),其中x和y是空间(平面)坐标,f在任何坐标电(x,y)处的振幅成为图像在该点的亮度。灰度是用来表示黑白图像亮度的一个术语,而擦色图像是由单个二位图像组合形成的。例如,在RGB彩色系统中,一幅彩色图像是由三幅独立的分量图像(红、 绿、蓝)组成的。因此,许多为黑白图像处理开发的技术适用于彩色图像处理,方法是分别处理三幅独立的分量图像即可。彩色图像处理将在第6章详细讲解。 图像关于x和y坐标以及振幅连续。要将这样的一幅图像转换成数字形式,就要求数字化坐标和振幅。将坐标值数字化成为取样;将振幅数字化成为量化。因此,当f的x,y分量和振幅都是有限且离散的量时,称该图像位数字图像。 2.1.1坐标约定 取样和量化的结果是一个实数矩阵。在本书中,我们使用两种主要的方法来表示数字图像。假设对一幅图像(x,y)取样后,得到了一幅有着M行和N烈的图像。我们称这幅图像的大小位M*N。坐标(x,y)的值是离散量。为使符号表示清洗和方便,我们为这些离散坐标使用整数值。在很多图像处理书籍中,图像原点定义在(x,y)= (0,0)处。沿图像第一行的下一座标值为(x,y)=(0,0)。注意,符号(0,1)用来表示沿第一行的第二个取值,而不表试图像在取样时的实际物理坐标值。 工具箱中用于表示数组的坐标约定于前段所述的坐标约定有两处不同。首先,工具箱使用(r,c)而不是(x,y)来表示行于列,但坐标顺序与前段所述的坐标顺序一致。在这种情况下,坐标元组(a,b)的第一个元素表示行,第二个元素表示列。另一区别是该坐标系统得原点在(r,c)=(1,1)处。因此,r是从1到M的整数,c从1到N的整数。 IPT文档将之成为像素坐标。IPT还采用另一种较少使用的坐标约定,称为空间坐标,这种坐标使用x来表示列,使用y来表示行。这与我们所用的变量x与y正好相反。在本书中,除少量例外外,我们将不使用IPT的空间坐标约定,但读者在IPT文档中一定会遇到这种术语。 2.2读取图像 使用函数imread可以将图像读入MATLAB环境,imread的语法为 Imread(‘filename’) 其中,filename是一个含有图像文件全名的字符串(包括任何可用的扩展名)。例如,命令行 >>f=imread(‘chestxray.jpg’); 将JPEG图像chestxray读入图像数组f。注意,这里使用单引号(‘)来界定filename字符串。命令行结尾处的分号在MATLAB中用于取消输出。若命令行中未包含分号,则MATLAB会立即显示该行中指的运算的结果。在MATLAB命令行窗口中出现的提示符(〉〉)指明了命令行的开始。 就像上面的这个命令行一样,当filename中不包含任何路径信息时,imread会从当前目录中寻找并读取图像文件。若当前目录中没有所需要的文件,则它会尝试在MATLAB搜索路径中寻找该文件。要想读取指定路径中的图像,最简单的办法就是在filename中输入完整或相对的路径。 〉〉f=imread(‘D:\\myimages\\chestxray.jpg’); 从驱动器D上名位myimages的文件夹中读却图像文件读取图像文件chestxray.jpg;而 〉〉f=imread(‘.\\myimages\\chestxray.jpg’); 从当前的工作目录中名为myimages的子目录中读取图像文件chestxray.jpg。MATLAB桌面工具条上的当前目录窗口会显示MATLAB的当前工作路径,并提供一种非常简单的方法来手工改变当前的路径。 2.3显示图像 在MATLAB桌面上图像一般是用函数imshow来显示,该函数可基本语法为 Imshow(f,G) 其中,f是一个图像数组,G是显示该图像的灰度级数。若将G省略,则默认的灰度级数是256。语法 Imshow(f,[low high]) 会将所有小于或等于low的值都显示为黑色,所有大于或等于high的值都显示为白色。介于low和high之间的值将以默认的级数显示为中等亮度值。最后,语法 Imshow(f,[ ]) 可以将变量low设置为数组f的最小值,将变量high设置为数组f的最大值。函数imshow的这一形式在显示一幅动态范围较小的图像或既有正值又有负值的图像是非常有用。 函数pixval经常用来交互地显示单个像素的亮度值。该函数可以显示覆盖在图像上的光标。当光标随着鼠标在图像上移动时,光标所在位置的坐标和该点的亮度值会在该图形窗口的下方显示出来。处理彩色图像时,红、绿、蓝分量的坐标也会显示出来。若按下鼠标左键不放,则pixal将显示光标初始为之间的欧几里得距离。此处应注意的事,语法 Pixal 会在上一次显示的图像上显示光标。单击光标窗口上的X按钮可将其关闭。 2.4保存图像 使用函数imwrite可以图像写到磁盘上,该函数的语法为 Imwrite(f,’filename’) 在该语法结构中,filename中包含的字符串必须是一种可视别的文件格式扩展名。换言之,所要使用的文件格式要由第三个输入参量明确地指定。例如,下面的命令可将图像f写为TIFF格式且名为 Patient10_run1的文件: >>imwrite(f,’patient10_run1’,’tif’) 或 〉〉imwrite(f, ’patient10_run1.tif’) 若filename中不包含路径信息,则imwrite会将文件保存到当前的工作目录中。 函数imwrite可以有其他的参数,具体取决于所选的文件格式。后续章节中的大部分工作都是处理JPEG或TIFF格式的图像,所以我们将注意力放在这两种格式上。 另一种常用但只适用于JPEG图像的函数是imwrite,其语法为 Imwrite(f,’filename.jpg’,’quality’,q) 其中,q是一个在0到100之间的整数(由于JPEG压缩,q越小,图像的退化就越严重)。 2.6图像类型 2.6.1亮度图像 一幅亮度图像是一个数据矩阵,其归一化的取值表示两度。若亮度图像的像素都是uint8类或uint16类,则他们的整数直翻胃分别是[0,255]和[0,655365]。若图像是double类,则像素的取值就是浮点数。规定双精度型归一化亮度图像的取值范围是[0,1]。 2.6.2二值图像 二值图像在MATLAB中具有非常特殊的意义。一幅二值图像是一个取值只有0和1的逻辑数组。因而,一个取值只包含0和1的uint8类数组,在MATLAB中并不认为是二值图像。使用logical函数可以把数值数组转换为二值数组。因此,若A是一个由0和1构成的数值数组,则可使用如 下语句创建一个逻辑数组B: B=logical(A) 若A中含有除了0和1之外的其它元素,则使用logical函数就可以将所有非零的量变换为逻辑1,而将所有的0值变换为逻辑0。使用关系和逻辑运算符也可以创建逻辑数组。 要测试一个数组是否为逻辑数组,可以使用函数islogical: Islogical(c) 若c是逻辑数组,则该函数返回1;否则,返回0。 2.6.3术语注释 前两节用了大量的笔墨来阐明术语“数据类”和“图像类型”。通常,在我们提到一幅图像时,是指一幅“data_class image_type图像”,其中的data_class是一种类,而image_type则是本节开始时定义的图像类型之一。因此,一幅图像的特性是由数据类和图像类型这两者来表征的。例如,“uint8亮度图像”表示一幅像素都是uint8数据类的亮度图像。工具箱中的有些函数支持所有的数据类,而有些函数只支持特殊的数据类。例如,前面提到的二值图像中的像素只能是logical数据类。
正在阅读:
XX年银行反假币宣传活动总结09-13
AP美国历史备考知识点03-08
宁波穿白水域通航安全监督管理规定12-26
八年级语文下期末模拟试卷2110-20
明洞及洞门作业指导书03-22
《牛津小学英语》五年级下学期口语测试要求08-18
自考03200预防医学练习题2011-12
Employment Background Date Position Institution03-19
培养、指导青年教师及成绩证明材料04-09
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 测速
- 车牌
- 单片机
- 高速公路
- 识别
- 基于
- 分析
- 系统
- 浅谈东莞市环境卫生管理中存在的问题及对策毕业论文
- 预应力混凝土连续梁桥悬臂浇筑施工知识讲座 - 图文
- 2013年国家公务员考试行测模拟题及答案解析二
- 监理考试模拟题1
- 监理单位考核评价表
- 2011-2018年高考真题物理试题分类汇编:研究平抛运动(精编+解析
- 电磁炉主板检测标准
- 银行风险尽责审查资格证书试题
- 颂歌献给党歌唱大赛活动方案
- 三相电压型PWM整流器设计发言稿
- 粒子滤波原理和仿真
- 抵顶工程款协议书特别提示
- 奥林匹克训练题库·数阵
- BBS论坛设计论文(完整版!)(1) 2 - 图文
- c#复习资料
- 破产法案例分析题目
- 生鲜电商物流配送模式比较分析
- 五四运动知识竞赛
- 织造辅助机械项目可行性研究报告(发改立项备案+2013年最新案例
- 2018年物理教师年度工作总结