基于matlab图像处理的车牌识别研究

更新时间:2024-06-08 10:49:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

毕业设计(论文)

基于MATLAB图像处理的车牌识别研究

学 院 专业名称 班级学号 学生姓名 指导教师

2013年6月13日

东北大学秦皇岛分校毕业设计(论文) 第 I 页

基于MATLAB图像处理的车牌识别研究

摘 要

汽车牌照自动识别技术[1](License Plate Recognition,LPR)是智能交通系统的核心技术,不但可以广泛地应用于交通流量检测,而且还可以应用于交通控制与诱导,机场、港口、小区的车辆管理,不停车自动收费,闯红灯等违章车辆监控以及车辆安全防盗等领域。因此,具有广阔的应用前景。本论文就是在这种背景下,研究基于图像处理的汽车牌识别系统。

车牌识别一般可以分为车牌预处理、车牌的定位、车牌的字符分割和字符识别四个主要部分。本文在分析近年来一些典型的车牌识别系统,掌握基本的原理和方法后,在已有算法的基础上,在某些环节加入自己的改进,以自己拍摄的某一车牌为实例,以MATLAB作为平台工具,根据实际的处理过程划分章节,详细地阐述了对车牌进行识别的具体步骤、涉及的算法及相关外延知识,并最终确定了一套有效的车牌识别算法。

关键词: 车牌识别(LPR),图像处理,车牌定位,字符分割,字符识别

东北大学秦皇岛分校毕业设计(论文) 第 II 页

Research on License Plate Recognition Based on MATLAB

Tutor:Wang Lifu

Author :Zhang Ruochen

Abstract

The vehicle License Plate Recognition(LPR) system as core of ITS, plays a very important role. It not only can widely be applied traffic flux detect, but also be applied traffic control and lead. It can also be applied to some fields where the vehicle breaks the laws, such as airport seaport, communities’ vehicle manage, no halted vehicle’ fee, and vehicle’ safe. So it has widely applied in the future. Basing on the current thing, the thesis will expound the course that searches and deals with image of the License Plate.

License plate recognition can generally be divided into pre-processing, license plate location, license plate character segmentation and character recognition four main sections.After analyzing some typical license plate recognition system in recent years, mastering the basic principles and methods, and based on the algorithms which are existing, this paper makes its own improvements in some areas. Through taking a license plate as an example, working on MATLAB as platform and tool, according to the actual division of chapters, this paper elaborates on the license plate to identify the specific steps algorithms involved and related epitaxial knowledge, and finally work out an effective license plate recognition algorithm.

Key Words: License Plate Recognition(LPR), image processing, vehicle plate locating,

character segmentation, character recognition

东北大学秦皇岛分校毕业设计(论文) 第 III 页

目 录

1绪论 ............................................................... 1 1.1 研究背景和研究意义 ............................................ 1 1.2 国内外车牌识别技术的研究现状 .................................. 2 1.3 车牌自动识别的主要方法 ........................................ 5 1.3.1 IC卡识别技术 ............................................... 5 1.3.2 条形码识别技术 ............................................. 5 1.3.3 图像处理技术 ............................................... 5 1.4 基于图像处理的车牌识别技术的研究难点 .......................... 7 1.4.1 我国汽车牌照自身特点[6] ....................................... 7 1.4.2 外部环境影响 ............................................... 7 1.4.3 拍摄角度问题 ............................................... 7 1.5 车牌识别系统概述 .............................................. 8 1.5.1 车牌识别系统的硬件设计 ..................................... 8 1.5.2 车牌识别系统的软件设计 ..................................... 9 1.6 本文主要内容 ................................................. 10 2车牌图像预处理 .................................................... 11 2.1 灰度化 ....................................................... 11 2.2 二值化处理 ................................................... 12 2.3 图像增强 ..................................................... 14 2.3.1 灰度拉伸 .................................................. 14 2.3.2 滤波处理 .................................................. 15 2.4 边缘检测 ..................................................... 17 2.5 数学形态学 ................................................... 19 2.5.1 数字形态学概述 ............................................ 19 2.5.2 形态学滤波的基本操作 ...................................... 19 2.5.3 填充处理 .................................................. 21 3. 车牌定位算法的研究 .............................................. 22 3.1 引言 ......................................................... 22 3.2 车牌规格及特征 ............................................... 22 3.3 传统的车牌定位算法分析 ....................................... 22 3.3.1 基于纹理特征的车牌定位法 .................................. 22 3.3.2 基于神经网络的定位算法 .................................... 23 3.3.3 基于数学形态学的定位方法 .................................. 23 3.4 本文研究的车牌定位算法 ....................................... 24

东北大学秦皇岛分校毕业设计(论文) 第 IV 页

3.4.1 选取结构元素 .............................................. 24 3.4.2 车牌区域的提取 ............................................ 27 4. 车牌字符分割算法的研究 .......................................... 29 4.1 传统的字符分割算法分析 ....................................... 29 4.2 字符分割算法中的问题分析 ..................................... 30 4.3 本文研究的字符分割算法 ....................................... 30 4.3.1 车牌精确定位 .............................................. 30 4.3.2 字符分割算法 .............................................. 325. 基于神经网络的车牌字符识别 ....................................... 355.1 常用的车牌字符识别方法 ....................................... 355.2 基于神经网络的字符识别 ....................................... 355.2.1 神经网络概述 .............................................. 365.2.2 BP神经网络构造和训练 ..................................... 375.2.3 BP神经网络算法 ........................................... 375.3 字符识别 ..................................................... 385.3.1 建立字符模板数据库 ........................................ 385.3.2 神经系统识别的matlab实现 .................................. 40结 论 ........................................................... 45致 谢 ........................................................... 46参考文献 ........................................................... 47附 录 ........................................................... 49

东北大学秦皇岛分校毕业设计(论文) 第 6 页

的图像处理技术方法提出汉字识别的分类是在抽取汉字特征的基础上进行的。根据汉字的投影直方图 (Projection Histogram),选取浮动闽值,抽取汉字在Y方向的峰值,利用树形查表法进行汉字的粗分类。然后根据汉字在X方向的投影直方图,选取适当阈值,进行量化处理后,形成一个变长链码,再用动态规划法,求出与标准模式链码的最小距离,实现细分类,完成汉字省名的自动识别。

传统模式识别技术一般包括模板匹配法,统计特征法等.进入90年代,由于计算机视觉技术(Computer Vision Technique)的发展,开始出现汽车牌照识别的系统化研究[3]。1990年A.S.Johnson等运用计算机视觉技术和图象处理技术实现了车辆牌照的自动识别系统.该系统分为图象分割 (Image Segment)、特征提取和模板构造 (Feature Extraction and Template Formation)、字符识别(Character Recognition)等三个部分.利用不同闭值(Threshold)对应的直方图不同,经过大量统计实验确定出车牌位置的图像直方图的闭值范围,从而根据特定闭值对应的直方图分割出车牌,再利用预先设置的标准字符模板进行模式匹配(Pattern Matching)识别出字符。 1990年R.A.Lotufo等使用视觉字符识别技术研究分析所获取的图像[4],首先在二值化图像中找到车牌,然后用边界跟踪技术提取字符特征,利用统计最邻近分类器(Statistical Nearest Neighbor Classifier)与字符库中的字符比较,得出一个或几个车牌号码,对这些号码做核实检查,看是否确实有该车牌号码,从而最终确定出一个实际存在的正确的号码。总之,这个时期的应用在识别正确率方面有所突破,但还没有考虑到识别实时性的要求,识别的速度有待进一步提高。

近几年以来,计算机及其相关技术发达的一些国家开始探讨用人工神经网络技术解决车牌的自动识别问题[5]。例如1994年M.M.M.FAHMY等就成功地运用了BAM(Bidirectional Associative Memories)神经网络方法对车牌上的字符进行自动识别,BAM神经网络是由相同神经元构成的双向联想式单层网络,每一个字符模板对应着唯一一个BAM矩阵,通过与车牌上的字符比较,识别出正确的车牌号码。这种采用BAM神经网络方法的缺点是无法解决识别系统存储容量和处理速度相矛盾的问题。

东北大学秦皇岛分校毕业设计(论文) 第 7 页

1.4 基于图像处理的车牌识别技术的研究难点 1.4.1 我国汽车牌照自身特点[6] (1) 字母、数字、汉字混合

我国车牌不单有英文字母和阿拉伯数字,还有汉字,汉字的识别难度较英文字母和数字大的多,从而增加了识别的难度。 (2) 颜色种类多

国外的车牌颜色种类相对少一些,而我国的车牌颜色种类较多。大致分为四种:黄底黑字,蓝底白字,黑底白字和白底黑字。 (3) 人为因素

由于环境、道路或人为因素造成有严重污渍、模糊不清的或偏斜很大的车牌可以在我国上路行驶。在国外,这种情况是不允许的。 (4) 车牌格式多

国外的车牌格式很单一,我国的车牌格式却有很多:民用车牌、公安警车牌、武警车牌、军车车牌、外交车牌、特种车牌、消防车牌等等。

(5) 国车牌悬挂的位置不唯一。由于不同公司出产的汽车型号和外形的各有不同,导致了车牌悬挂位置的不确定性。 1.4.2 外部环境影响

(1) 外界光照条件各不相同,白天和晚上光照不同

光照对图像质量影响很大。不同的光照角度,对车牌光照的不均匀度影响也较大。不同视觉,不同气候条件,以及背景光、车牌反光程度决定了车牌区域的亮度特征。

(2) 外界背景的复杂程度也影响车牌的定位准确率

背景中与车牌区域特征相似区域的大小反映了背景的噪声程度。例如与车牌字符相似的车体上的或背景远处的广告语,容易影响车牌的粗定位 1.4.3 拍摄角度问题

(1) 不同实际工程其摄像方位和角度不一样

实际工程中摄像方位相对于车辆行驶的方向一般是正上方、左侧和右侧。如果摄

东北大学秦皇岛分校毕业设计(论文) 第 8 页

像角度越小,车牌在平面图像中变形越小,识别效果越好。摄像方位和角度对车牌字符分割影响较大,对车牌校正方法的校正能力的要求也更高了。

(2) 光线较暗时,不同的人工光照角度、方位和亮度对车牌识别系统影响也不一样 尽管规范的车牌对光的散射能力较强,但光照的方位角度不同时,也会影响车牌的亮度。亮度不均匀对车牌二值化算法的适应性提出了更高的要求。 (3) 不同的实际工程,图像的分辨率要求也不同

分辨率大小影响车牌识别系统的识别速度和字符的识别率。OCR(演变成为利用光学技术对文字和字符进行扫描识别)中字符的象素分辨率一般为32x32,而车牌识别系统字符的分辨率一般在12x12和24x24之间。分辨率过高时,整个识别系统的处理时间会明显增多,特别是在车牌分割、车牌二值化的处理时间会显著增加。分辨率过低,字符识别率会下降,字符中的汉字的二值化效果较差,车牌识别系统的识别率会下降。

1.5 车牌识别系统概述

一个完整的车辆牌照识别系统是一个复杂的系统,应该包括图像采集、图像预处理、车牌定位、字符切分、字符识别以及图像编码、数码传输与更新等步骤,基本可以分为硬件部分和软件部分,硬件部分主要完成车辆图像的摄取采集,软件部分主要完成对采集到的车辆图像进行车辆牌照定位、车牌字符切分与车牌字符识别等工作,这部分工作最为复杂,最后对识别结果进行数据传送和存储,将处理后的识别信息交给管理系统进行管理。整个系统的核心是软件部分的工作,能否通过牌照对车辆进行有效管理,很大程度上取决于软件部分识别车牌的准确性。 1.5.1 车牌识别系统的硬件设计

一个车牌识别系统的基本硬件配置由摄像机、主控机、采集卡和照明装置组成。例如在停车场管理系统中,系统硬件主要包括车辆传感探测器、高性能工控计算机、高分辨率CCD摄像机、高放大倍数镜头、CCD自动亮度控制器和视频采集卡等。

首先是探测车辆的接近、通过和停留等。常用的有光探测器、微波雷达通过型探测器、测速雷达探测器、声探测器、红外探测器、电磁感应探测器和压敏探测器等。我国停车场应用较多的是红外探测器和电磁感应环探测器。设置在停车场入口和出口

东北大学秦皇岛分校毕业设计(论文) 第 9 页

的两对红外发射和接收设备进行车辆检测。利用编码调制信号,增强抗干扰的能力,具有较强的可靠性。前端工控机利用红外线探测到车辆经过的信号时,控制图像采集卡抓拍图像,并对抓拍的汽车图像进行牌照识别,同时控制摄像机光圈的大小,以适应外界环境不同的光照条件。然后将识别出的牌照信息储存到服务器中,当车辆离开时,同样的进行牌照识别,将其与前面输入的牌照信息进行对比,计算出停车时间,然后计费。

1.5.2 车牌识别系统的软件设计

本课题主要侧重算法的研究,主要工作是设计软件,对已摄取到的卡口车辆照片实现车牌识别。硬件设备采集到图片后首先要考虑图像的存储格式。目前比较常用的图像格式有*.BMP、*.JPG、*.GIF、*.PCX等,本课题采集到的图片是*.JPG的格式。

软件系统的编写大多采用VC或者MATLAB语言,本课题选用了MATLAB语言。MATLAB具有以下优点:

(1) MATLAB编程效率高,使用方便。MATLAB以矩阵作为基本语言要素大大提高了数值计算的编程效率。MATLAB本身拥有丰富的函数库,并具有结构化的流程控制语句和运算符,用户在使用过程中能够方便自如地应用。其图像处理工具箱更是大大扩展了MATLAB解决图像处理问题的能力,其他还有诸如用于神经网络和小波的工具箱等,对于算法的分析都有着很大的帮助。

(2) MATLAB扩充能力强,交互性好,移植性和开放性较好。MATLAB的库函数同用户文件在形式上是一样的,用户可以根据自己的需求方便地建立与扩充新的库函数,扩充其功能。MATLAB可在Windows系列、UNIX、Linux、VMS 6.1、PowerMac平台上使用,且所有的核心文件和工具箱文件都是公开的,用户可以修改源文件构成新的工具箱,从而可以扩充很多新的功能,利于算法的研究和改进。

(3) 较强的图形控制和处理功能,自带的API使得用户可以方便地在MATLAB与C、C++等其他程序设计语言之间建立数据通信。

整个软件系统是一个具有车牌识别功能的图像分析和处理软件。首先将采集到的汽车图像进行灰度化、灰度拉伸和滤波处理,以降低噪点、增加车牌部分的对比度。然后,通过对预处理后的图像进行小波变换分解提取图像边缘,并进行形态学处理,这时,车牌的轮廓已经非常清晰,并且可以和非车牌区域明显区分开来了,接着,根

东北大学秦皇岛分校毕业设计(论文) 第 10 页

据车牌的特点进行车牌初步定位,提取出车牌图像。将提取出的车牌图像进行二值化处理,根据投影图的特点查找倾斜的角度,采用坐标变换的方法进行车牌倾斜校正,并利用其垂直投影图中字符显示出的峰群的特点进行字符切分。最后利用BP网络完成了整个车牌字符的识别。整个系统的设计主要采用了M语言。

目前车牌识别的理论趋于成熟,在车牌识别系统中应解决以下几个关键问题: (1)图像预处理:对采集的图像进行滤波、边界增强等处理,以克服图像干扰,改善识别效果;

(2)车牌定位:对采集的图像,定位出车牌的具体位置; (3)字符分割:在车牌图像上,逐个提取单个字符的图像; (4)字符识别:在每个字符图像中识别出字符文字。 流程顺序如图1-1所示。

原始图像获取图像预处理车牌定位车牌字符识别车牌字符分割

图1.1 系统框图

1.6 本文主要内容

本文在分析近年来一些典型的车牌识别系统,掌握基本的原理和方法后,在已有算法的基础上,在某些环节加入了自己的改进。以自己拍摄的某一车牌为实例,以MATLAB作为平台工具,根据实际的处理过程划分章节(车牌预处理、车牌的定位、车牌的字符分割和字符识别),详细地阐述了对车牌进行识别的具体步骤、涉及的算法及相关外延知识,并最终确定了一套有效的车牌识别算法。

东北大学秦皇岛分校毕业设计(论文) 第 11 页

2车牌图像预处理

2.1 灰度化

通过摄像头采集到的车牌图像是24位的彩色位图,考虑到图像文件的存储量和处理图像需要占用大量的系统资源,所以第一步要进行图像灰度变换,图像灰度化有各种不同的算法,比较直接的一种是给原像素的RGB值各自加权一个系数,然后求和,作为新灰度值。基于此原理,首先逐个将像素颜色分解成3个原色灰度R、G、B(分别显示红、绿、蓝三种颜色),然后考虑具有相同灰度值的不同原色对视觉亮度的反应不同,灰度值大的像素点比较亮(像素值最大为255,为白色),反之比较暗(像素值最小为0,是黑色),将三原色灰度按照如下比例公式[7]:

Y=0.299*R+0.587*G+0.114*B (2.1) 在实际计算时,可按下式进行:

Y=0.30*R+0.59*G+0.11*B (2.2)

计算得到一个新的灰度值,用这个值分别作为三原色的灰度合成一个新颜色。

读入原始图像并显示出来,如图2.1,代码:

i=imread(picture); figure, imshow(i);

图2.1 原始彩色车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 12 页

灰度处理后如图2.2所示。程序代码:

j=rgb2gray(i); %灰度处理

figure, imshow(j)

图2.2 灰度处理后的车牌图像

2.2 二值化处理

二值图像是指整幅图像内仅有黑、白二值的图像,在它们之间不存在其它灰度层次的变化。二值化算法又称闭值算法,目的是找出一个合适的闭值将待研究的车牌区域划分为前景和背景两部分。二值化后的车牌要能再现原字符图像,基本不出现笔画断裂和粘连现象,尽量不丢失原字符的特征。另外二值化算法可以用于车牌定位过程中精确定位车牌的上下左右边界。

常用的二值化算法有基于灰度的二值化和基于彩色的二值化。基于灰度的二值化主要有全局动态二值化和局部自适应二值化;基于彩色的二值化主要有基于 HSV(Hue Saturation Value)空间的彩色二值化。本文首先提取有关色彩的信息,然后对灰度图像进行二值化处理。

图像二值化的关键在于阐值T的选取,根据闭值T来区分图像中的对象和背景。设原始灰度图像为f(x,y),变换过后的二值图像为g(x,y),则二值化的过程表示为[8]:

g(x,y)=

(2.3)

东北大学秦皇岛分校毕业设计(论文) 第 13 页

根据闭值选取情况,分为全局闭值、局部闭值和动态闭值。

(1)全局闭值法根据图像的直方图或灰度空间分布确定一个闭值,实现灰度图像到二值图像的转化。典型的全局闭值法包括Qstu方法,最大嫡方法等。全局闭值算法简单,对于目标和背景明显分离、直方图分布呈双峰的图像效果良好,对那些由于光照不均匀、噪声干扰较大等原因使直方图分布不呈双峰的图像效果明显变差。

(2)局部阐值法通过定义考察点的领域,并由领域计算模板,实现考察点灰度与领域点的比较;非均匀光照条件等情况虽然影响整体图像的灰度分布,但是对局部图像的性质没有什么影响,从而局部闭值法比全局闭值法有更广泛的应用。如Bemsen算法是一种典型的局部闭值法;光照不一致的情况,如一种局部二值化的适应算法,应用车牌字符自身布局的先验知识来进行区域门限校正,取得了比较理想的实验效果,与以往的逐点进行二值化的方法相比,这种方法大大提高计算速度,因而在处理大规模的图像数据时能起到更明显的效果。

(3)根据上述两种方法的优缺点,有效结合使用是一种不错的方法。自适应二值化方法的动态阐值法是利用像素自身及其领域灰度变化的特征,此算法充分考虑每个像素领域的特征,所以能够更好的突出背景和目标的边界。二值化后的车牌周围有一个长方形的边框,在字符识别中经常被认为是字符的一部分而影响识别效果。处理后如图2.3所示。程序代码:

l=im2bw(k); figure, imshow(l);

图2.3 二值化处理后的车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 14 页

2.3 图像增强

由于光照影响、照相机曝光不足以及动态范围太窄等原因,车牌图像往往会产生对比度不足的弊端,使图像细节分辨不清,如果不经过处理必然会影响识别率。图像增强的方法有两类。一类是空域增强法,包括灰度变换、直方图均衡化和邻域平均法;另一类是频域增强法,主要有高通滤波、低通滤波和带通滤波等。鉴于计算速度上的考虑,本文采用灰度拉伸和邻域平均法来增强对比度,利用空间域的中值滤波技术来消除噪声干扰。 2.3.1 灰度拉伸

所谓灰度拉伸,是指根据灰度直方图的分布有选择地对灰度区间进行分段拉伸以增强对比度。许多拍摄的图像中,灰度级集中在很小的区域内、对比度不强,影响人和机器对图像的处理。此时可以利用灰度的线性拉伸将灰度范围拓展到0一255的灰度范围。灰度拉伸和灰度的线性变换有点类似,都用到灰度的线性变换,但拉伸不是完全的线性变换,而是分段进行缘性变换,它的拉伸范围和拓展程度可以自由选择。

如图2.4所示。它将输入图像中某点(x, y)的灰度f (x, y),通过映射函数T,映射成输出图像中的灰度g(x, y),即:

g(x, y) = T[f (x, y)] (2.4)

图2.4 灰度变换的对比曲线

灰度拉伸后如图2.5,程序代码:

k=imadjust(j); figure, imshow(k);

东北大学秦皇岛分校毕业设计(论文) 第 15 页

图2.5 灰度拉伸处理后的车牌图像

2.3.2 滤波处理

车牌图像往往存在一些孤立的噪点。在汽车牌照图像处理初期,若不能有效抑制或者去除这些噪点,将影响车牌定位的准确性或者造成无法定位。通常采用图像平滑的方法去除噪点。为了消除图像中的噪声,直接在空间域上对图像进行平滑滤波。它的作用是模糊和消除噪声。

图像平滑包括空域滤波和频域滤波。空间域的平滑滤波一般采用简单平均法进行,即求邻近像素点的平均亮度值,称为邻域平均法。邻域的大小与平滑的效果直接相关,邻域越大平滑的效果越好,但邻域过大平滑会使边缘信息损失的越大从而使输出的图像变得模糊,因此需要选择合理邻域的大小,实际中一般采用邻域窗口大小为3x3。图像由灰度值相近的小块组成,相邻像素间存在很高的空间相关性,噪声是独立的,我们用像素预定邻域内的各像素的灰度平均值代替该像素原来的灰度值,就可以实现图像的去噪。最简单的局部平滑算法称非加权邻域平均,它均等地对待邻域中的各像素,即把各个像素灰度的平均值作为中心像素的输出值。

空域滤波中采用平滑滤波器的另一种方法——中值滤波,去除噪点的效果最好。中值滤波是一种非线性滤波,也是一种邻域运算,类似于卷积。中值滤波的计算不是

东北大学秦皇岛分校毕业设计(论文) 第 16 页

加权求和,是把它邻域内的所有像素按灰度值进行排序,取该组的中间值作为邻域中心像素点的输出值。中间值取法如下:当邻域内像素个数为奇数时,取像素灰度值排序后的中间值;当邻域内的像素个数为偶数时,取排序后的中间两像素灰度值的平均值。邻域可以选择不同大小和形状的窗口,如线状、方形、十字形、圆形、菱形等。不同形状的窗口产生不同滤波效果,使用中必须根据图形的内容和不同的要求加以选择。从以往的经验看:方形或圆形窗口适宜外廓线较长的图像,十字形窗口对有尖顶角状的图像效果好。使用中值滤波去除噪声的方法多种多样,十分灵活。一种方法是先使用小尺度邻域,后逐渐加大邻域尺寸进行处理;另一种方法是一维滤波和二维滤波交替使用。此外还有迭代操作,对输入图像反复进行中值滤波,直到输出不再有变化为至。中值滤波的突出优点是在消除噪声的同时,还能防止边缘模糊。如果图像的噪声多是孤立的点,这些点对应的像素又很少,而图像则是由像素较多、面积较大的块构成,中值滤波效果很好。处理后如图2.6所示。程序代码:

m=medfilt2(l); figure, imshow(m);

图2.6 中值滤波处理后的车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 17 页

2.4 边缘检测

图像边缘是图像的基本特征之一,它包含对人类视觉和机器识别有价值的物体图像边缘信息。边缘是图像中特性分布的不连续处,图像周围特性有阶跃变化或屋顶状变化的像素集合。图像边缘存在于目标与背景、目标与目标、基元与基元的边界,它标示出目标物体或基元的实际含量,是图像识别信息最集中的地方。

经典的边缘提取方法是考察图像的每个像素在某个领域内灰度的变化,利用边缘邻近一阶或二阶方向导数变化规律的方法进行检测边缘,这种方法称为边缘检测局部算子法[10]。边缘增强是要突出图像边缘,抑制图像中非边缘信息,使图像轮廓更加清晰。边缘占据图像的高频成分,边缘增强属于高通滤波。边缘的种类分为两种:一种称为阶跃性边缘,它两边的像素灰度值有显著不同;另一种称为屋顶状边缘,它位于灰度值从增加到减少的变化转折点。对于阶跃性边缘,二阶方向导数在边缘处呈零交叉;而对于屋顶状边缘,二阶方向导数在边缘处取极值。如果一个像素落在图像中某个恤体的边界上,那么它的领域将分成一个灰度级的变化带。对这种变化最有用的两个特征是灰度的变化率和方向,它们分别以梯度向量的幅度和方向来表示。

边缘检测算子检查每个像素的领域并对灰度变化率进行量化,包括方向的确定。通常使用基于卷积算子求卷积的方法,常用的传统边缘检测算子有Robert算子、Sobel算子、Prewitt算子、Laplacian算子和Canny算子。由于Sobel算子提取的轮廓失真最小,本文采用Sobel算子边缘检测。

Sobel算子是一种将方向差分运算与局部平均相结合的方法[11]。该算子是在以f(x,y)为中心的3又3邻域上计算x和y方向的偏导数,即

?sx?{f(x?1,y?1)?2f(x?1,y)?f(x?1,y?1)}???{f(x?1,y?1)?2f(x?1,y)?f(x?1,y?1)}????? (2.5) s?{f(x?1,y?1)?2f(x,y?1)?f(x?1,y?1)}??y??{f(x?1,y?1)?2f(x,y?1)?f(x?1,y?1)}}???上式应用f(x,y)邻域图像强度的加权平均差值,其梯度大小

22g(x,y)?sx?sy (2.6)

?s|x?|sy| (2.7) 或取绝对值 g(x,y)Sobel边缘检测的卷计算子为:

东北大学秦皇岛分校毕业设计(论文) 第 18 页

??1 ???2???10001?? 2??1?1??1?2???000? ????121??上面两个卷积算子对图像运算后,代入(2.8)式,求得图像的梯度幅度值g(x,y),然后选取适当门限TH,作如下判断:如果g(x,y>TH,则(i,j)为阶跃状边缘点,{g(i,j)}为二值边缘图像。Sobel算子容易在空间实现,Sobel边缘检测器产生较好的边缘检测效果,同时引入局部平均受噪声影响也比较小。当使用大的邻域时,抗噪声特性会更好,但会增加计算量,并且得到的边缘也较粗。处理后如图2-6所示。程序代码:

w=double(m);

g=edge(w,'sobel',0.45,'both');

figure, imshow(g);

图2-6 边缘检测Sobel算子处理后的车牌图像

Sobel算子利用像素点上下、左右相邻点的灰度加权算法,根据在边缘点处达到极值这一现象进行边缘检测。因此Sobel算子对噪声具有平滑作用,能提供较为精确的边缘方向信息,但局部平均的影响同时会检测出许多伪边缘,且边缘定位精度不高。当对精度要求不高时,Sobel算子是一种较好的边缘检测方法。

东北大学秦皇岛分校毕业设计(论文) 第 19 页

2.5 数学形态学

数学形态学广泛应用于图像处理和计算机视觉领域,它能够进行各种几何参数的间接测量,反映图像的体视性质,适于描述图像的随机性质。数学形态学基于形状集合理论而提出,运算本质上是并行的,便于并行处理实现。用数学形态学算子对图像进行滤波,不需计算每点的局部特征,速度快且抗噪能力比较强。 2.5.1 数字形态学概述

数学形态学(Mathematical Morphology,简称形态学)是研究数字图像形态结构特征的理论,它通过对目标图像的形态变换实现结构分析和特征提取。利用形态学作为工具从图像中提取对于表达和描述区域形状有用的图像分量,比如边界、骨架以及凸壳等。形态学用于图像预处理或后处理,如形态学滤波、细化和修剪。下面将介绍形态学在滤波方面的应用。

数学形态学是一种非线性滤波算法[9],Minkowski结构和、差运算,即形态膨胀和腐蚀是数学形态学的基础。结构元素是数学形态学中的关键概念,是一个可以在图像上平移、且尺寸比图像小的集合。结构元素起着主、客观之间界面的作用,可以方便的按照目的选用不同形状和尺寸的结构元素,来度量和提取图像中对应的形状,达到对图像进行分析和识别的目的。数学形态学运算是将结构元素在图像范围内平移,同时施加交、并等几何运算。数学形态学可以用来解决抑制噪声、边缘检测、特征提取、图像分割、形状识别、纹理分析、图像恢复与重建和图像压缩等问题。 2.5.2 形态学滤波的基本操作

本文针对二值图像进行形态学滤波处理。在二值图像中,所有黑色像素的集合是图像完整的形态学描述,采用从小到大不同的结构元进行处理达到滤除噪声的目的。式(2.4)到式(2.7)给出了二值形态变换的基本变换公式,基本形态变换包括腐蚀、膨胀、开操作和闭操作。腐蚀是一种消除边界点的过程,结果是使目标缩小,孔洞增大,因而可有效的消除孤立噪声点;膨胀是将与目标物体接触的所有背景点合并到物体中的过程,结果是使目标增大,孔洞缩小,可填补目标物体中的空洞,形成连通域。先腐蚀后膨胀的过程称为开运算,它具有消除细小物体,并在纤细处分离物体和平滑较大物体边界的作用;先膨胀后腐蚀的过程称为闭运算,具有填充物体内细小空

东北大学秦皇岛分校毕业设计(论文) 第 20 页

洞,连接邻近物体和平滑边界的作用。对图像做了开运算和闭运算,闭运算可以使图像的轮廓线更为光滑,它通常用来消掉狭窄的间断和长细的鸿沟,消除小的孔洞,并弥补轮廓线中的断裂。

设f(x,y)和b(i,j)均为二维离散空间上的两个离散函数,其中f(x,y)为图像位于(x,y)处像素的灰度值,b(i,j)为具有一定形状和大小的结构元素,则b(i,j)对灰度图像f(x,y)膨胀与腐蚀运算定义如下:

膨胀: (f⊕b)(x,y)=max{f(x-i,y-j)+b(i,j)} 腐蚀: (f⊙b)(x,y)=max{f(x+i,y+j)-b(i,j)} 结构元素b(i,j)对灰度图像f(x,y)进行形态开运算和闭运算定义如下:

开操作: (f·b)(x,y)=[(f⊙b)⊕b](x,y) 闭操作: (f·b)(x,y)=[(f⊕b)⊙b](x,y) 膨胀处理后如图2.7所示。程序代码:

se90=strel('line',3,90); se0=strel('line',3,0); p=imdilate(g,[se90 se0]); figure, imshow(p);

图2.7 膨胀处理后的车牌图像

(2.8) (2.9)

(2.10) (2.11)

东北大学秦皇岛分校毕业设计(论文) 第 21 页

2.5.3 填充处理

利用matlab中的imfill指令,对图像进行填充处理,将图中封闭曲线的内部进行填充,以便后一步处理。处理后如图2.8所示。程序代码:

n=imfill(p,'holes'); figure, imshow(n);

图2.8 填充处理后的车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 22 页

3. 车牌定位算法的研究

3.1 引言

车牌定位方法是在图像处理的基础上,对图像进行分析、总结并经过大量的实验确定的,定位方法的研究与车牌本身的特征和图像处理技术分不开的。同时在车牌识别系统中,牌照的定位准确与否直接影响到字符分割和字符识别的准确率。车牌定位的主要工作是从摄入的车辆图像中找到车辆牌照所在的位置,并把车牌从该区域中准确的提取出来,供后续的字符分割使用。 3.2 车牌规格及特征

为了准确、快速地定位车牌,人们提出了许多定位算法。其中大部分算法是根据车牌的特征而设计的,目前所利用的车牌特征主要有[12]: (1)形状特征

车牌的边缘是线段围成的有规则的矩形,大小是标准的,一般为440*140.车牌在原始图像中的相对位置比较集中,大小变化有一定范围。 (2)颜色特征

现有的车牌有蓝底白字、白底红字、白底黑字、黑底黄字、黑底白字五种颜色类型。

(3)灰度跳变特征

车牌的背景、字符颜色相差明显,表现在灰度图像中的灰度级也就互不相同。这样在车牌边缘形成了灰度突变边界,即穿过车牌的水平直线呈现连续的峰、谷、峰的分布,呈现出规律的纹理特征。 3.3 传统的车牌定位算法分析 3.3.1 基于纹理特征的车牌定位法

车辆图像随拍摄环境的变化而不同,然而车辆牌照具有不因外部条件变化而改变

东北大学秦皇岛分校毕业设计(论文) 第 23 页

的特征。车牌内有多个基本成水平排列的字符,字符和牌照底在灰度值上存在跳变,因而车牌这个矩形区域(包括边缘)有丰富的边缘存在,呈现出规则的纹理特征。在传统的基于灰度分割技术上,这些特征为车牌定位研究提供了切实可行的依据。

基于纹理分析的方法利用车牌区域内字符纹理丰富的特征定位车牌,它对于光照偏弱、偏强、不均匀性、牌照倾斜和变形等情况不敏感。但该方法应用于背景复杂的图像时,容易把一些纹理分布较丰富的非车牌区域定位进来,产生包含车牌在内的车牌候选区域,这是纹理分析方法的缺陷。 3.3.2 基于神经网络的定位算法

利用神经网络来定位车牌是一类较为常见的方法。本算法的基本步骤和各模块的功能如下[13]:

神经网络训练模块:收集一定数量的车牌图像样本,归一化后输入至BP神经网络进行训练,达到预定的正确率后,训练结束。本模块将获得一个对车牌敏感的BP神经网络。图像预处理模块:提取车牌前,对图像进行预处理;抑制噪声,提高图片质量。车牌定位模块:利用训练好的神经网络在图像中搜索车牌区域,定位车牌。

本方法的特点是从车牌区域特征来判别牌照,因此在搜索时会重点考虑以下表面特征(如边缘、对比度、纹理等)而忽视图像区域的内容。有用信号的特征有时会误导搜索,如果因为定位模块忽视了非牌照区域包含的车牌特征信号点,将这些区域送入后续步骤将会影响车牌字符识别。 3.3.3 基于数学形态学的定位方法

基于数学形态学的车牌定位算法是利用开启和闭合这两种运算在图像中进行定位。数学形态学中的开闭运算具有以下特点[14]:开运算可以擦除图像中的像素。从而能够去除孤立的小点、毛刺,保持总的位置和形状不变。闭运算可以使图像中的像素粘连。这一特点可用于填平小孔、弥合小裂缝,保持总的位置和形状不变。

利用数学形态学中的开闭运算对图像处理,得到多个车牌可能区域,然后用多区域判别法在图像的多个车牌可能区域中找到车牌的正确位置。此算法中结构元素大小的选取至关重要。结构元素过大,会使非车牌区域的边缘点粘连在一起,可能的车牌区域增多,给随后的多区域判别算法带来困难;结构元素过小,车牌区域无法粘连在一起,可能使真正的车牌区域不包含在可能车牌区域集合中。

东北大学秦皇岛分校毕业设计(论文) 第 24 页

3.4 本文研究的车牌定位算法 3.4.1 选取结构元素

在进行形态学处理时,首先采用imclearborder函数对提取后的车牌边缘进行处理,删除和图像边界相连的细小的对象,使得相邻的区域可以连成一个整体。然后进行数学形态学的腐蚀和膨胀运算,从而使车牌区域的垂直边缘连接成一个整体,同时和周围的干扰区域分离,成为一个独立的区域。水平结构元素可以是形如[1?1]的滑动窗口,结构元素的大小取决于车牌图像的大小,一般取所有车牌图像大小的统计均值。处理后如图3.1所示。代码如下:

t=imclearborder(n,4); figure, imshow(t);

图3.1 清除与边界链接物体处理后的车牌图像

然后进行闭运算,使得水平相邻的边缘连接成为连通区域。

再进一步在垂直边缘上进行开运算,两次结构元素的选取是由实验的结果得到的。在采用这两个结构元素进行开运算后使得车牌区域与其它背景区域分开,成为独立的连通域。处理后的图像如图3.3和图3.4所示。从图中可以看出,车牌区域已经非常明显,和其他区域有明显的区别。代码如下:

东北大学秦皇岛分校毕业设计(论文) 第 25 页

c=strel('square',28); f=imclose(t,c); figure, imshow(f); e=imopen(f,c); figure, imshow(e);

图3.2 闭运算处理后的车牌图像

图3.3 开运算处理后的车牌图像

再次清理图像中的无关因素,提高识别准确度。清除与边框相连的部分和图像中小于2000的噪点,尽可能的减少干扰。清除后的图像如图3.4和3.5所示。代码如下:

东北大学秦皇岛分校毕业设计(论文) 第 26 页

x=imclearborder(e,4); figure,imshow(x); x1=bwareaopen(x,2000); figure,imshow(x1);

图3.4 移除边界处理后的车牌图像

图3.5 清除噪点2000后的车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 27 页

3.4.2 车牌区域的提取

提取候选区域的步骤是:首先对经过开闭运算处理的图像进行区域提取,并计算区域特征参数,然后根据车牌的先验知识对区域特征参数进行比较,提取车牌区域。本课题选择使用车牌的宽高范围和比例关系对车牌进行初步定位。

对车牌的区域提取可以利用regionprops函数,对图像每个区域进行标记,标记后如图3.6所示。代码如下:

[B,L]=bwboundaries(x1,4);

figure,imshow(label2rgb(L,@jet,[.5 .5 .5]))

1.231.290.510.210.131.130.970.760.721.21

图3.6 标记后的车牌图像

2007年实施的车牌标准规定,车前车牌长440mm,宽140mm。其长宽比例为440/140≈3.15。根据图像像素的大小,这里选取筛选条件为宽在50到150之间,高在20到50之间,同时宽高比例应大于0.45,就可以比较准确的得到车牌的大致位置。。然后计算每个区域图像特征参数:区域中心位置、最小包含矩形,面积。最后计算出包含所标记区域的最小矩形的宽和高。初步提取的车牌图像如图3.7所示。程序代码如下:

东北大学秦皇岛分校毕业设计(论文) 第 28 页

for k=1:length(B)

boundary=B{k};

delta_sq=diff(boundary).^2;

perimeter=sum(sqrt(sum(delta_sq,2))); area=stats(k).Area; metric=22*area/perimeter^2; metric_string=sprintf('%2.2f',metric);

if metric>=0.9&&metric<=1.1 centroid=stats(k).Centroid; plot(centroid(1),centroid(2),'ko'); goalboundary=boundary; s=min(goalboundary,[],1); e=max(goalboundary,[],1);

goal=imcrop(l,[s(2) s(1) e(2)-s(2) e(1)-s(1)]); end

text(boundary(1,2)-35,boundary(1,1)+13,metric_string,'Color','g','FontSiz

e',14,'FontWeight','bold');

end

figure,imshow(goal),title('初步定位');

图3.7 初步提取的车牌图像

东北大学秦皇岛分校毕业设计(论文) 第 29 页

4. 车牌字符分割算法的研究

4.1 传统的字符分割算法分析

字符分割往往是根据字符的基本特征来预先定义目标,往往仅仅对图像中的某些部分感兴趣。为了辨别和分析,所以,需要将它们分离出来,在此基础上才能对目标进行下一步的分析。现在的分割算法有很多,分类方法也有很多种,比较常用的算法是基于图像相邻像素在像素值方面的两个性质基础上实现的。所以,通常应用于字符分割方面的算法有以下几类[17]:

(1)直接分割法 直接分割法最为常见的是垂直投影分割方法。垂直投影分割方法主要是利用字符在垂直方向上的投影完成的。而且,垂直投影分割方法主要是以二值化后的图像为基础上实现的。首先,应将车牌的灰度图像二值化。二值化后的图像像素值只有两个值,白色的像素值是1,黑色的像素值是0。然后我们取得字符间距局部的最小值。这个字符间距是通过计算车牌每个字符间的距离得出的。将作为分割字符的字符尺寸限制值。接着我们就做垂直投影。因为字符之间的部分为黑色,灰度值都为0。所以,做垂直投影后,投影处的值也为0。而字符部分的投影就会是形成曲线。所以,我们根据字符间距的大小就可以完成字符的分割。

从二值化后的图像我们可以看出,如果对图像做垂直投影的话,字符区域的像素值变化较为明显,会形成一定的曲线,而在字符间距的区域,像素值的变化就较弱,同时在投影后会存在噪声的干扰,所以在进行分割之前我们一般要去除噪声的干扰,而大部分的干扰来自车牌区域的边框和铆钉。而边框和铆钉的内部灰度值为 1。这在做垂直投影的时候,会给分割造成干扰。所以,在做垂直投影前,一般都要去除边框和铆钉。直接分割法相对来说比较简单,但是在分割时受到的干扰噪声影响较大,导致分割不够准确。

(2)基于识别基础的分割法 基于识别基础的分割法,是以分割为目的,而将识别作为基础,二者是结合在一起使用的。我们先对待分割的图像进行识别,然后通过识别结果对图像进行分割。所以,识别的准确性直接影响到分割结果。这样,基于识别基础的分割算法使用起来的准确性很难保证。

东北大学秦皇岛分校毕业设计(论文) 第 30 页

(3)自适应分割线聚类法 自适应分割线聚类法首先需要建立一个分类器,分类器要进行训练来完成对图像的分割。首先,我们先设图像中的每一列为定义的分割线。然后使用分类器对分割线进行判断。但是,如果字符之间有粘连或者断裂,而且对这样的字符训练是很困难的。所以,这类方法的使用是很有局限性的,算法的运算量很大,比较复杂。

这几种是目前字符分割中常用的算法,从分析中可知,这几种算法往往受环境和图像质量的干扰较大。所以,对字符分割算法分割进行改进也是字符识别过程中的研究重点。

4.2 字符分割算法中的问题分析

我们拍摄的图像往往会受到一些不定的因素影响,例如,摄像机的摆放角度偏移。这样我们拍摄的图片往往会产生在某一方向上的倾斜。从我们提取到得车牌区域的图像就可以看出,该图像发生了水平方向上的倾斜。这样对我们的分割就造成了影响。这是字符分割中的第一个常见问题,就是字符倾斜的问题。另外一个问题是在实际应用中,一般车牌都容易受污斑和掉落等因素影响,这样车牌会有较大的噪声干扰。这样就会给待分割的字符造成相互粘连或者是字符边缘模糊等问题。这样会严重的影响分割效果。所以,车牌倾斜校正和去除噪声,一直是字符分割普遍且所要解决的问题。

4.3 本文研究的字符分割算法

针对车牌字符分割中常见的问题,本文研究的字符分割算法主要分为两个部分:车牌精确定位和字符分割算法。 4.3.1 车牌精确定位

根据形态学处理得到的车牌区域,只是初步定位,车牌字符的外围还有许多影响识别的内容,这时需要我们将其去除,进而进行进一步的精确定位。

字符的外围一般还带有白色边框,初步定位后,白色边框与图片的边界相连,这时,调用matlab中的imclearborder指令,将此白色矩形边框去除。去除边框后如图4.1所示。程序如下:

东北大学秦皇岛分校毕业设计(论文) 第 31 页

a=imclearborder(goal,4); %去除车牌边框

figure,imshow(a),title('去除边框');

图4.1 去除边框后的车牌图像

去除边框后可看到图中仍存在许多早点,这对于后续的字符切割和字符识别都是影响很大的,在这里需进行一步去除噪点的处理。调用matlab中的bwareaopen指令,参数设定为200。处理后如图4.2所示。

图4.2 去除噪点后的车牌图像

可以看到,图像中除了我们希望看到的字符信息外,几乎不存在其他影响的因素,只剩下字符。这时,需要进一步车牌定位,将字符外部多余的空余部分除掉。方法:由于在经过初步定位处理后,车牌上下边界往往没有干扰信息,而且车牌的上下边框由于是水平的,在边缘提取的时候已经被除去。因此,在查找上下边缘时可以从上到下搜索,找到第一个不为零的点,然后从下往上搜索,找到第一个不为零的点,这两点之间即为车牌的上下边界。车牌的左右定位同理。处理后如图4.3所示

东北大学秦皇岛分校毕业设计(论文) 第 32 页

图4.3 车牌的精确定位图像

4.3.2 字符分割算法

为了准确识别牌照上的汉字、英文字母及数字,必须把单个字符从牌照中提取分离出来。在实际处理中,通常由于存在较大的干扰噪声,使得牌照图像中产生字符之间粘连或字符断裂,字符的笔画变粗、字符的轮廓模糊不清的现象。经牌照定位而分割出的牌照区域不完全精确到牌照的字符区域,在牌照边框附近会出现误差几个像素。目前车牌字符分割算法主要有三种[19]:连通区域法、静态边界法和垂直投影法。

连通区域法:利用字符或字符的一部分构成连通域的特性,把这些连通域切分出来,也就切分出车牌字符。通常情况:车牌上的字符除汉字外,其它的都是字母或数字,它们在理想状态下是全连通,但在实际情况中,车牌区域内存在很多噪声区域,这些区域与车牌中的字符线条粘连在一起,使字符的连通域特性不规范,甚至车牌中的字符与车牌上下边框粘连成一个很大的连通区域。如果仍然使用连通区域法进行字符分割将很难得到满意的结果。所以连通区域法适用于分割清晰的车牌图像,即对图像质量要求很高。

静态边界法不受噪声影响,但依赖车牌图像的正确提取。静态边界法认为定位阶段提取的车牌区域是车牌的精确位置,即车牌边界已经准确定位。利用车牌本身存在的模板特征分割车牌,对车牌定位阶段要求过高。如果在此基础上加动态边界匹配规则,分割准确率会大大提高。

本文中,综合对于车牌信息的先知了解,再结合垂直投影发,对字符进行切割。 根据前文中提到的有关我国车牌统一规格的知识,如果平均分配每个字符在牌照中占据的宽度,那么每个字符宽度为:width/7(width 为车牌图像的宽度)。但是,实际上,第二个第三个字符之间存在一个黑点,牌照左右两边与图像边缘也都有一定的

东北大学秦皇岛分校毕业设计(论文) 第 33 页

宽度,所以每个字符的宽度应该小于width/7。考虑所有的情况,一般情况下最小的宽度为width/9。因此,字符的宽度可以从width/9 到width/7 之间渐进的变化得到。

垂直投影法: 其思想是根据车牌字符的特点,将车牌图像进行垂直方向的投影,因为字符区域的黑色像素点比较多,比较集中,同时每个车牌字符之间有一定的空隙间隔隔开。这样投影下来得到的投影图应该有多个相对集中的投影峰值群,只要根据峰值群的特点进行分割,就可以得到车牌的字符。利用字符块在垂直方向上的投影必然在正确分割位置上取得局部最小值,且这个位置要满足车牌字符规则和字符尺寸限制。对车牌区域作垂直方向的投影,首先在水平方向从左至右检测各坐标的垂直投影数值,当找到第一个局部最小值点时,认为这个点是最左面字符的边界;然后在水平方向上从右至左检测坐标的垂直投影数值,当找到第一个局部最小值点时,认为这个点是最右面字符的边界。得到两边字符的边界之后,用同样的方法找到每个字符的边界。

车牌字符切分的具体算法为:

(1)对车牌图像进行垂直投影,计算出字符的宽度后,确定字符的中间位置,并计算相邻两个字符之间的间距,即中间距离的差值。取其最大值定为第二个字符和第三个字符之间的距离。以此为分界线,分别向前、后两个方向进行切分,从而定位出每个字符的左右边界,并保存在数组里。由于MATLAB 的数组可以存放不同大小的数据,为字符边界信息的存储提供了极大的便利。

(2)对每个切分出的字符进行水平投影,确定字符的具体的上下边界,保存到数组里。

(3)由于用于最后识别的字库中字符模板为40× 20像素,所以这里对切分出来的字符进行归一化处理,统一为40× 20像素。

(4)将归一化后的字符的信息保存在数组里,做为参数输入字符识别模块与模板比较进行字符识别。

分割后的字符如图4.4所示

东北大学秦皇岛分校毕业设计(论文) 第 34 页

12345图4.4 分割后的字符

67

东北大学秦皇岛分校毕业设计(论文) 第 35 页

5. 基于神经网络的车牌字符识别

5.1 常用的车牌字符识别方法

传统的字符识别算法一般可分为模板匹配法、支持向量机和神经网络的识别方法三

种[20]。其中模板匹配法应用的较为广泛,其识别的准确率相对较高。

(1)模板匹配法 模板匹配是图像识别中最常用的方法。首先,对待识别字符进行二值化处理,并规范其大小为字符数据库中模板的大小,然后与所有模板进行匹配,选择相似度最大的匹配模板作为输出结果。它的判别方法是用最小距离法判定所属类。模板匹配通常使用二值化同尺寸模板建立标准模版库,用归一化准则匹配车牌字符图像和标准模板。该类算法的优点是识别率高。缺点是对字符图像质量要求较高,计算速度慢。

(2)支持向量机 支持向量机的字符识别算法也是图像识别算法中的一种,针对我们需要识别的字符,先要分析这些字符的特征。然后将这些字符模型化,主要是对这些字符模型进行训练,类似于人学习的过程。然后利用这些字符模型相应的去和待识别的字符进行匹配。因为字符的识别过程是一个多类的问题,所以支持向量机的方法一般不单独使用。

(3)神经网络识别方法 神经识别网络识别方法一般分为学习阶段和识别阶段。首先,在学习阶段,先要设定学习的样本,也就是定义这个样本的特征。设一个阈值,利用传输函数对每一个神经元进行计算。具体的过程是从低端逐步向上方进行的。最后神经元的每一层的输出就可以作为一个输出值。然后进行识别的阶段,将每一层的输出值和理想的输出值做一个差值。然后根据这个差值对阈值进行修改,修改的过程是从最高层到最低层的。学习阶段和识别阶段两个过程重复进行,最后直到神经网络收敛为止。由此可见,神经网络的识别方法比较复杂,运算量也很高。

本文将结合模板匹配和神经网络两种方法,重点介绍BP神经网络,综合各自的有点,对车牌进行识别。 5.2 基于神经网络的字符识别

字符特征提取后,需要采用有效的分类器来对其进行分类。分类器主要有两类:基于

本文来源:https://www.bwwdw.com/article/0q56.html

Top