毕业论文1(图像分割技术研究)

更新时间:2024-07-05 16:40:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

UNIVERSITY OF TECHNOLOGY

毕业论文

题 目 图像分割技术研究

学生姓名 学 号 专业班级 通信工程 指导教师 学 院 计算机与通信 答辩日期 2012 理工大学毕业论文

图像分割技术研究

Research on Image Segmentation Technology

Xxx

I

理工大学毕业论文

摘 要

图像分割是图像特征提取和识别等图像理解的基础,对图像分割的研究一直是数字图像处理技术研究中的热点和焦点。本文介绍了数字图像处理技术中图像分割技术的基本原理和主要方法,对经典的图像分割算法进行了较全面的叙述,分别研究了基于边缘、区域和形态学分水岭法的图像分割方法,并使用MATLAB软件对各种分割方法进行了仿真,对仿真结果进行了分析。

关键词:图像分割;边缘;区域

II

理工大学毕业论文

Abstract

Image segmentation is the foundation of the understanding in image feature extraction and recognition, and the reseach on it is usually the hotspot and focus in the study of digital image processing technology. This paper introduces the basic principles of techniques and the main methods in image segmentation, which is always used in digital image processing techniques, were investigated by the law of marginal, regional and morphological, then use the MATLAB software simulating a variety of segmentation methods and the simulation results are analyzed. In this paper, the classic image segmentation algorithm has been comprehensively narratived.

Key words: image Segmentation;marginal image segmentation;regional image segmentation

III

理工大学毕业论文

目 录

第一章 图像分割技术基本现状和发展趋势 .................................................................................................. 1 1.1图像分割的意义 ............................................................................................................................................. 1 1.2图像分割技术的基本现状 .......................................................................................................................... 1 1.3图像分割技术的发展趋势 .......................................................................................................................... 2 第二章 图像分割的主要方法综述 ..................................................................................................................... 3 2.1基于边缘的分割方法 ................................................................................................................................... 4 2.2基于区域的分割方法 ................................................................................................................................... 4 2.3结合特定理论工具的分割方法 ................................................................................................................ 5 第三章 基于边缘的图像分割方法的仿真实现 ............................................................................................. 6 3.1边缘检测 ........................................................................................................................................................... 6 3.1.1梯度算子 ................................................................................................................................................... 6 3.1.2拉普拉斯算子 ......................................................................................................................................... 7 3.1.3 Canny算子 ............................................................................................................................................... 8 3.1.4结果分析 ................................................................................................................................................... 8 3.2霍夫变换 ......................................................................................................................................................... 11 3.2.1利用霍夫变换检测图像边缘的算法 ............................................................................................ 11 3.2.2结果分析 ................................................................................................................................................. 13 第四章 基于区域的图像分割方法的仿真实现 ........................................................................................... 15 4.1区域分割算法................................................................................................................................................ 15 4.1.1区域生长法 ............................................................................................................................................ 16 4.1.2区域分裂与合并法 .............................................................................................................................. 16 4.2阈值分割方法................................................................................................................................................ 18 4.2.1直方图双峰法 ....................................................................................................................................... 18 4.2.2最大类间方差法 .................................................................................................................................. 20 4.2.3迭代法 ..................................................................................................................................................... 21 第五章 基于形态学分水岭的图像分割方法的仿真实现 ........................................................................ 23 5.1 分水岭法图像分割基本原理 .................................................................................................................. 23 5.2 分水岭法图像分割算法 ........................................................................................................................... 23 5.3 分水岭法图像分割仿真及结果分析 ................................................................................................... 25

IV

理工大学毕业论文

结论 .............................................................................................................................................................................. 30 参考文献 ..................................................................................................................................................................... 31 附录Ⅰ 外文文献翻译 ........................................................................................................................................... 32 附录Ⅱ 程序清单 .................................................................................................................................................... 56 致 谢 .......................................................................................................................................................................... 66

V

理工大学毕业论文

第一章 图像分割技术基本现状和发展趋势

1.1图像分割的意义

在一副图像中,我们常常只对其中的某些目标感兴趣,对于这些我们感兴趣的目标,它们通常在要分割的图像中占据一定的区域,而且在某些特性上与周围的图像存在一定的差别。这些差别可能非常明显,也可能十分细微,以至于人眼无法觉察。

图像分割是按一定的制约规则把图像划分为若干个互不相交、具有特定性质的区域,是把我们关注的区域从需要分割的图像中提取出来,以此进行进一步研究分析和处理的技术。图像分割的结果是图像特征提取和识别等图像理解的基础,对图像分割的研究一直是数字图像处理技术的焦点和热点[1]。

图像分割把图像空间分成一些有意义的区域,与图像中各种物体目标相对应。它使得其后的图像分析和识别等处理过程中所要处理的数据量大大减少了,同时又保留了有关图像结构特征的信息。通过对分割结果的描述,能够理解图像中包含的有关信息。图像分割质量直接影响后续图像处理的效果,甚至决定其成败,因此,分割的方法和精确程度至关重要。由此可知,图像分割在图像工程中占据非常重要的位置。

图像分割在不同的领域也有其它的名称,如目标轮廓技术、目标检测技术、阈值化技术、目标跟踪技术等,这些技术本身或其核心实际上也就是图像分割技术。

1.2图像分割技术的基本现状

图像分割算法的研究已经有几十年的历史,一直都受到人们的高度重视。关于图像分割的原理和方法国内外已有不少的研究成果,但一直以来没有一种分割方法适用于所有图像分割处理[1]。

传统的图像分割方法存在着一些不足,无法满足人们的要求,给进一步的图像分析和理解过程带来了困难。随着计算机技术的发展及其相关技术的成熟,结合图像增强等图像处理技术,我们已经能够在计算机上实现图像分割处理过程。然而,到目前为止,人们还没有制定出选择合适分割算法的标准,这给图像分割技术的应用带来许多实际困难。因此,图像分割的研究还在不断深入,是目前图像处理中研究的热点之一[1]。

图像分割在图像工程中起着承上启下的作用,是介于低层次处理和高层次处理的中间层次。早在1965年就有人提出了检测边缘算子边缘检测方法,边缘检测已产生了不少经典算法

[1]。目前越来越多的学者开始将数学形态学、模糊理论、遗传算法理论、分形理论和小波变

换理论等研究成果运用到图像分割中,产生了结合特定数学方法和针对特殊图像分割的先进图像分割技术。

1

理工大学毕业论文

1.3 图像分割技术的发展趋势

由于图像分割技术在当今图像工程的发展过程中起着十分重要的作用,得到了广泛应用,促使人们致力于寻找新的理论和方法来提高图像分割的质量,以满足各方面的需求。

由于遗传算法、统计学理论、神经网络、分形理论以及小波理论等理论在图像分割中广泛应用,图像分割技术呈现出新的发展趋势:

(1)多种特征融合的分割方法。除利用图像的原始灰度特征外,我们还可以利用图像的梯度特征、几何特征(形态、坐标、距离、方向、曲率等)、变换特征(傅立叶谱、小波特征、分形特征等)及统计学特征(纹理、不变矩、灰度均值等)等高层次特征,对于每个待分割的像素,将所提取的特征值组成一个多维特征矢量,再进行多维特征分析。通过多种特征的融合,图像像素能被全面描述,从而获得更好的分割结果[2]。

(2)多种分割方法结合的分割方法。由于目标成像的不确定性以及目标的多样性,单一的分割方法很难对含复杂目标的图像取得理想的分割结果。此时,除需要利用多种特征融合外,还需将多种分割方法结合,使这些方法充分发挥各自的优势,并避免各自的缺点。采用哪种方式结合以获得良好的分割效果是这种方法研究的重点[2]。

2

理工大学毕业论文

第二章 图像分割的主要方法综述

图像分割是图像处理的一项关键技术,从20世纪70年代开始受到人们的高度重视,至今,人们已经提出了上千种分割算法,现在已经提出的分割算法大部分是针对具体问题的,并没有一种适用于所有图像的通用分割算法[3]。而且,至今还没有制定出选择合适分割算法的标准,这给图像分割技术的应用带来许多实际困难。因此,对图像分割的研究还在不断深入之中,它是目前图像处理中研究的热点之一。

图像分割在图像工程中起着承上启下的作用,可以认为是介于低层次处理和高层次处理的中间层次。最近几年又出现了许多新思路、新方法和改进算法。

多年来人们对图像分割提出了不同的解释和表述,借助集合概念对图像分割可给出如下定义:令集合R代表的整个图像区域,对R的图像分割可以看做是将R分成N个满足以下条件的非空子集R1,R2,?,RN。

(1)?Ri?R;

i?1N(2)对于所有的i和j,i?j,有Ri?Rj??; (3)对于i?1,2,?,N,有P?Ri??TRUE; (4)对于i?j,有P?Ri?Rj??FALSE; (5)对于i?1,2,?,N,Ri是连通的区域。

其中P?Ri?是对所有在集合Ri中元素的逻辑谓词,?表示空集。

N?Ri?1i?R

代表分割的所有子区域的并集即为原来的图像,它是图像处理中的每个像素都被处理的保证。

Ri?Rj??指出分割结果中的各个区域是互不重叠的。P?Ri??TRUE表明在分割结果中,每个区域都有其独特的特性。P?Ri?Rj??FALSE表明在分割结果中同一个子区域的像素应当是连通的,也就是说同一个子区域内的任意的两个像素在该子区域内是互相连通的[4]。

这些条件对分割具有一定的指导作用。但是,实际中的图像分析和处理都是针对某种特定的应用,所以条件中的各种关系也需同实际需求结合来设定的。

人们在多年的研究中积累了很多图像分割的方法。图像分割是一个将像素分类的过程,分类的依据可建立在像素间的相似性、灰度不连续性基础之上。对于相似性检测方法(即基于区域的分割方法)主要有:双峰法、区域分裂与合并和自适应阈值分割等;对于灰度不连续性检测方法(即基于边缘的分割方法)主要有:边缘检测、边缘跟踪和霍夫变换等。此外,

3

理工大学毕业论文

还有结合特定理论工具的分割方法,这些方法包括基于形态学分水岭的分割、基于统计模式识别的分割、基于神经网络的分割、基于信息论的分割、基于小波变换的分割等。

2.1 基于边缘的分割方法

基于边缘的分割方法是一种利用图像不同区域间的像素灰度不连续的特点检测出区域间的边缘,从而实现图像分割的方法。

边缘检测是所有基于边缘分割方法的第一步。边缘检测可以根据处理的顺序分为并行边缘检测和串行边缘检测。图像中相邻的不同区域间总是存在边缘,边缘处像素的灰度值是不连续的,可通过求导数的方法检测到,因此,我们常用灰度的一阶或二阶微分算子来进行边缘检测。这种利用常用的微分算子进行边缘检测的方法是一种并行边界技术。而串行边界查找法是一种先检测到边缘再串行连接成闭合边界的方法,这种方法受起始点的影响的程度较大?2?。

这种分割方法实现的难点就在于边缘检测时抗噪性和检测精度之间的矛盾。若提高了检测精度,噪声产生的伪边缘会导致不合理的轮廓;若提高了抗噪性,则会产生轮廓漏检和位置偏差。因此,人们提出了多尺度边缘检测方法,根据实际问题设计多尺度边缘信息的结合方案,以便更好地兼顾抗噪性和检测精度。

2.2基于区域的分割方法

基于区域的分割方法主要包括阈值法和区域分割算法两种。

对于阈值法,首先需要确定一个处于图像灰度取值范围之中的灰度阈值,然后将图像中各个像素的灰度值与之相比较,灰度值大于阈值的像素为一类,灰度值小于阈值的像素为另一类。这两类像素一般分属图像的两类区域,从而达到分割的目的?2?。

常用的阈值选取法有利用图像灰度直方图的双峰法、最大类间方差法、迭代法、灰度拉伸法、最小误差法等。现有的大部分算法的关键都集中在阈值确定的研究上。

这种算法的优点是计算方法简单、运算效率较高、计算速度快。全局阈值法对于灰度相差很大的不同目标和背景能进行有效的分割。当图像的目标和北京的灰度差异不明显或不同目标的灰度值范围有所重叠时,可以采用局部阈值发或动态阈值法。另一方面,这种方法只考虑了像素本身的灰度值,通常不考虑它的空间特征,因而对噪声很敏感。在实际应用中,阈值法常与其他方法结合使用?2?。

而对于区域分割算法,其实质就是把具有某种相似性质的像素连通,从而构成最终的分割区域。它利用了图像的局部空间信息,可以有效地克服其他方法存在的图像分割空间小连续的缺点?2?。

在此类方法中,如果从全图出发,按照区域属性特征一致的准则决定每个像元的区域归

4

理工大学毕业论文

属,形成区域图,称之为区域生长的分割方法;如果从像元出发,按照区域属性特征一致的准则,将属性接近的连通像元聚集为区域,则是区域增长的分割方法。若是综合利用上述两种方法,就是区域分裂与合并的方法。它是先将图像分割成很多的一致性较强的小区域,再按一定的规则将小区域融合成大区域,达到分割图像的目的。

基于区域的分割方法往往会造成图像的过度分割,而单纯的基于边缘检测方法有时不能提供较好的区域结构,为此可将基于区域的方法和边缘检测的方法结合起来,发挥各自的优势以获得更好的分割效果。

2.3 结合特定理论工具的分割方法

近年来,随着各学科许多新理论和新方法的提出,人们也提出了许多与一些特定理论、方法和工具相结合的分割技术?2?。

基于人工神经网络的分割方法的基本思想是用训练样本集对神经网络进行训练,以确定节点间的连接和权值,再用训练好的神经网络分割新的图像数据。目前,由于这种方法较复杂,计算量较大,还有待进一步实用化。

基于小波分析和变换的分割方法是借助数学工具小波变换来分割图像的一种方法。小波变换是一种多尺度、多通道的分析工具 它是空域和频域的局域变换,因而能有效地从信号中提取信息,通过伸缩和平移等运算功能对函数或信号进行多尺度分析,解决了傅立叶变换不能解决的许多问题。

基于数学形态学的分割技术的基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状,以达到对图像分析和识别的目的。由于形态学对图像分割具有优异的特性,使其在未来的图像分割中起主导作用。但该方法还不能很好地解决耗时问题,将其与一些节约时间的方法结合起来,是图像分割的一种趋势。

遗传算法是基于进化论自然选择机制的、并行的、统计的、随机化搜索的方法[2]。

5

理工大学毕业论文

第三章 基于边缘的图像分割方法的仿真实现

边缘是所要提取的目标和背景的边界线,如果能够提取出边缘就可以将目标和背景区分开来。图像的边缘中包含着有价值的边界信息,这些信息可以用于图像分析和目标识别等过程。并且通过边缘检测可以极大地降低图像分析处理的数据量。因此,边缘检测是图像分割的经典算法之一。

基于边缘的图像分割首先通过边缘检测得到在边缘上的像素点,然后在使用边缘检测算法后进行连接处理将边缘像素组合成有意义的边缘,即进行边缘跟踪。而在预先知道区域形状的条件下,也可以利用霍夫变换方便地得到边界曲线而将不连续的边缘像素点连接起来。

3.1 边缘检测

边缘检测是检测图像中有意义的不连续性的常用方法。一条边缘是一组相连的像素组合,这些像素位于两个区域的边界上。边缘总是以强度突变的形式出现,可以定义为图像局部特性的不连续性,如灰度的突变、纹理结构的突变等。边缘常常意味着一个区域的终结和另一个区域的开始?4?。

对于边缘的检测常常借助空间微分算子进行,通过将其模板与图像卷积完成。两个具有不同灰度值的相邻区域之间总存在灰度边缘,而这正是灰度值不连续的结果,这种不连续可以利用求一阶和二阶导数检测到。根据灰度变化的特点,常见的边缘可分为阶梯状、脉冲状和屋顶状。常用的空间微分算子主要包括:梯度算子、拉普拉斯算子和Canny算子等。

考核边缘算子的指标是:低误判率,即尽可能少地把边缘点误认为是非边缘点;高定位精度,即准确地把边缘点定位在灰度变化最大的像素上;抑制虚假边缘。其中,Canny算子是最优边缘检测算子。

当今的边缘检测方法中,主要有一次微分、二次微分和模板操作等。这些边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果。但对于边缘复杂的图像效果不太理想,如边缘模糊、边缘丢失、边缘不连续等。噪声的存在使基于导数的边缘检测方法效果明显降低,在噪声较大的情况下所用的边缘检测算子通常都是先对图像进行适当的平滑,抑制噪声,然后求导数,或者对图像进行局部拟合,再用拟合光滑函数的导数来代替直接的数值导数,如Canny算子等。在未来的研究中,用于提取初始边缘点的自适应阈值选取、用于图像层次分割的更大区域的选取以及如何确认重要边缘以去掉假边缘将变的非常重要。 3.1.1 梯度算子

梯度对应于一阶导数,相应的梯度算子对应于一阶导数算子。对于一个连续函数f?x,y?,

6

理工大学毕业论文

在?x,y?处的梯度定义如式3-1所示:

??f?f?T?GG ?f?? (3-1) xy???x?y?T??梯度是一个向量,其幅度和相位分别如式3-2和式3-3所示:

22?f?Gx?Gy??1/2 (3-2)

?Gy??x,y??arctan??G?x??? (3-3) ?式中的偏导数需要对每一个像素位置进行计算,在实际应用中常常采用小型模版利用卷积运算来近似,Gx和Gy各自使用一个模版?4?。常用的梯度算子主要有Roberts算子,Prewitt算子和Sobel算子。通过算子检测、二值处理后找到边界点。应用梯度算子进行边缘检测,Sobel算子的检测效果最好。 1、Roberts算子

Roberts边缘算子是一种斜向偏差分的梯度计算方法,梯度的大小代表边缘的强度,梯度的方向与边缘走向垂直。Roberts操作实际上是求旋转±45。两个方向上微分值的和。Roberts边缘算子定位精度高,在水平和垂直方向效果较好,但对噪声敏感。 2、Sobel算子

Sobel算子是一组方向算子,从不同的方向检测边缘。Sobel算子不是简单的求平均再差分,而是加强了中心像素上下左右四个方向像素的权重。运算结果是一副边缘图像。Sobel算子通常对灰度渐变和噪声较多的图像处理得较好。 3、Prewitt算子

Prewitt边缘算子是一种边缘样板算子,利用像素点上下、左右邻点灰度差,在边缘处达到极值检测边缘,对噪声具有平滑作用。由于边缘点像素的灰度值与其领域点像素的灰度值有显著不同,在实际应用中通常采用微分算子和模板匹配方法检测图像的边缘。Prewitt算子不仅能检测边缘点,而且能抑制噪声的影响,因此对灰度和噪声较多的图像处理得较好。 3.1.2 拉普拉斯算子

拉普拉斯算子(Laplacian)是一种二阶倒数算子,对于一个连续函数f?x,y?,在?x,y?处的拉普拉斯算子定义如式3-4所示:

?2f?2f?f?2?2 (3-4)

?x?y2 这里对模版的基本要求:对应中心像素的系数应该是正的,对应中心像素邻近像素的系

7

理工大学毕业论文

数应是负的,且它们的和总为零?4?。

拉普拉斯算子检测方法常常产生双像素边界,而且这个检测方法对图像中的噪声相当敏感,不能检验边缘方向。所以一般很少直接使用拉普拉斯算子进行边缘检测。 3.1.3 Canny算子

Canny算子是一类最优边缘检测算子。它在许多图像处理领域得到了广泛应用。

该算子的基本思想是:先对处理的图像选择一定的高斯滤波器进行平滑滤波,抑制图像噪声,然后采用“非极值抑制”(Nonmaxima Suppression)的技术,细化平滑后的图形梯度幅值矩阵,寻找图像中的可能边缘点;最后利用双门限检测通过双阈值递归寻找图像边缘点,实现边缘提取。

该方法与其他边缘检测方法的不同之处在于,它使用两种不同的阈值分别检测强边缘和弱边缘。并且仅当弱边缘与强边缘相连时才将弱边缘包含在输出图像中,因此这种方法容易检查出真正的弱边缘?5?。 3.1.4 结果分析

通过MATLAB软件进行仿真实验,所得分割图像如图所示,分别为梯度算子、拉普拉斯算子、Canny算子的图像分割仿真结果。针对不同的算子,分别选取分割较好的阈值进行分割。

基于各种算子的图像分割算法是比较经典的图像分割算法之一,边缘检测器对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果。但对于边缘复杂的图像效果不太理想,如边缘模糊、边缘丢失、边缘不连续等?5?。

(a) 原始图像 (b) Roberts算子

8

理工大学毕业论文

(c) Sobel算子 (d) Prewitt算子

(e) 拉普拉斯算子 (f) Canny算子

图3-1 边缘算子的边缘检测图像

从图3-1的仿真结果可以看出,对于复杂的图像,分割结果确实出现了边缘丢失和不连续的现象,而且对比发现:由图3-1(f)可以看出Canny算子的分割效果最好,能够检测到真正的弱边缘,但是会造成一定的边缘丢失。而在三个梯度算子中,由图3-1 (b)、(c)、(d)可以看出Sobel算子的分割效果最好。若针对不同的微分算子,正确选择阈值,对简单图像可以得到很好的分割效果,如图3-2(a)-(f)所示。

这是因为:Roberts对噪声较敏感;Sobel算子虽对噪声有一定的抑制能力,但检测出的边缘容易出现多像素宽度;Prewitt算子对噪声具有较好的平滑作用;Canny算子不容易受噪声的干扰,能够检测到真正的弱边缘,但由于具有较强的噪声抑制,同样也会将一些高频边缘平滑掉,造成边缘丢失。

9

理工大学毕业论文

(a) 原始图像 (b) Roberts算子

(c) Sobel算子 (d) Prewitt算子

(e) 拉普拉斯算子 (f) Canny算子

图3-2 边缘算子的边缘检测图像

10

理工大学毕业论文

3.2霍夫变换

利用上述微分算子对图像进行检测所得的边界常常会发生断裂现象,将边缘连接起来的方式主要有以下四种:曲线拟合、启发式搜索、邻域端点搜索和霍夫变换(Hough变换)?6?。

霍夫变换的主要优点是受噪声和曲线间断的影响较小,利用霍夫变换除了可以进行边界连接之外,还可以用来直接检测某些已知形状的目标。

因此,在此选择霍夫变换进行边缘连接。

霍夫变换是利用图像的全局特征将边缘像素连接起来形成封闭边界的一种连接方法。假设需要从给定图像的n个点中确定哪些点位于同一条直线上,那么可以将其看成是根据已知直线上的若干点来检测直线的问题。解决这一问题的一个直接方法就是先确定所有由任意两点决定的直线,然后从中找出接近具体直线的点集,这样大约需要进行n2?n2次运算才能完成,实际中是很难满足这样大的计算量要求的,利用霍夫变换就可以用较少的计算量来解决这一问题?6?。

3.2.1利用霍夫变换检测图像边缘的算法

Hough变换本来是应用于直线检测中的,充分体现了Hough变换具有明了的几何解析性、一定的抗干扰能力以及易于实现并行处理等优点。人们在对图像进行几何特征检测时,感兴趣的往往有直线,圆,椭圆等等。因此,对Hough变换进行改进,也可以应用于图像边缘检测。

1、利用霍夫变换检测直线

Hough变换的基本思想是利用了点与直线的对偶性的特性,在图像空间中,所有过点的直线都满足式3-5:

y?kx?b (3-5)

其中,k表示直线的斜率,b为截距,用极坐标表示式如式3-6:

??xcos??ysin? (3-6)

其中,??,??定义了一个从原点到直线上最近点的向量,该向量与直线垂直。上式就称为直线的霍夫变换。显然,x?y平面中的任意一条直线都与???空间(称为参数空间)的一个点相对应,也就是说,x?y平面中的任意直线的霍夫变换是对数空间中的一个点,在x?y平面中,过?x,y?点的直线有很多条,每一条都对应参数空间的一个点,此时可以将上式中的x和y看成是参数空间中的常数,那么x?y平面中过点?x,y?的直线所对应的点就在参数空间中形成了一条正弦曲线,也就是说x?y平面上的点对应于参数空间中的一条正弦曲线。由于

x?y平面中的直线上的各个边缘点都满足参数相同(假设为?0和?0)的等式,所以x?y空

11

理工大学毕业论文

间中所有边缘点对于的正弦曲线都相交于点??0,?0?。为了找出这些边缘点构成的直线,可以建立一个位于参数空间中的直方图,对于第一个边缘点,给参数空间中所有与这对应的正弦曲线的直方图方格一个增量。于是,当所有边缘点都经过这种处理后,包含??0,?0?的方格将具有局部最大值,通过对参数空间的直方图进行局部最大值的搜索就可以获得边界直线的参数?7?。

2、利用霍夫变换检测圆

Hough变换是通过提取分布于目标圆周上的参数及点的特征值来检测圆或圆弧的。为了检测目标外形,对图像上的每个点定义一个参数空间的映射。Hough变换通过在参数空间找寻特征值(峰值或最大值点)得到位于图像空间中的特征(目标形状)来转换问题。

对于已知半径的圆Hough变换可以检测任意已知表达形式的曲线,关键在于选择合适的参数空间。我们可以根据曲线的表达形式决定其参数空间。当检测某一已知半径的圆时,可以使用与原图像空间相同的空间作为其参数空间。则原图像空间中的一个圆对应参数空间中的一个点,参数空间的一个点对应图像空间中一个圆,原图像空间中在同一圆上的点,它们的参数相同即a,b相同,它们在参数空间对应的圆就会过同一点(a,b),因此,将原图像中的所有点变换到参数空间之后,依据参数空间中点的聚集度就可判断出原图像空间中有无近似于圆的图形。

对于未知半径的圆,在一个xy平面图像中确定一个圆至少需要三个元素,即圆心的x轴和y轴坐标,圆的半径,因此Hough变换检测圆的目的就是检测出图像中各个圆的圆心坐标以及圆的半径。其基本思想是将原图像空间中边缘点映射至参数空间中,再将参数空间中得到的全部坐标点元素所对应的累加值进行统计,并根据此累加值来判断圆的大小和圆心的位置。例如,在xy平面上的方程如式3-7所示:

?x?a?2??y?b?2?r2 (3-7)

其中点(a,b)为圆心坐标,r为圆半径,点(x,y)为圆周上的一点,将其转换为参数坐标系(a,b,r),方程如式3-8所示:

?a?x?2??b?y?2?r2 (3-8)

可看出此方程为圆锥面,对于原图像中任意确定的一个点在参数空间都有一个三维锥面与其对应。

在Hough变换检测圆时,可以利用梯度信息在很大程度上加快圆检测的速度。对圆周而言,其梯度方向只有背离圆心或者指向圆心,当梯度指向圆心,圆心就在梯度的延长线上,而当梯度背离圆心,圆心则在梯度的反向延长线上。所以,边缘梯度信息的加入可以预估圆心的位置,这样可以使算法的运算量明显减少,并且可以有效抑制虚假局部最大值。圆心位

12

理工大学毕业论文

置可以用极坐标方程形式表达如式3-9所示:

?a?x?r?cos??x,y? (3-9) ???b?y?r?sin?x,y?边缘像素?x,y?处的梯度方向为??x,y?。前一组公式是梯度方向背离圆心,后一组为梯度方向指向圆心。以前一种情况为例,边缘图像中每个边缘像素点?x,y?都可以算出其相应的梯度方向??x,y?。通过前一个公式可算出圆心坐标?a0,b0?,对于参数空间可能的半径r0,其相应的参数空间累加器单元加一,最后找到累加器的局部最大值,就得到一个圆?4?。 3.2.2 结果分析

(a) 原始图像 (b) 灰度图像

(c) 二值变换图像 (d) 霍夫变换检测边缘

图3-3霍夫变换边缘检测图像

运用MATLAB进行仿真,对于图3-3(a)中的图像,检测该图像的边缘,首先将彩色图像转换为灰度图像,如图3-3(b)所示。然后进行霍夫变换图像检测,仿真结果如图3-3所示。由图3-3(c)和图3-3(d)比较可以发现,用霍夫变换检测的边缘与通过二值图像检测出的图像边缘

13

理工大学毕业论文

效果类似,仿真结果比较理想,霍夫变换受噪声和曲线间断的影响较小?7?。但是,得到的边缘并不是连续的边缘,说明检测的效果还不算太理想。而且,这种方法的缺点是运算量太大。另外,由于不考虑各点之间的距离信息而产生了所谓的过连接现象。为了克服运算量大的缺点,可以把图像划分为小块,对各块图像利用Hough变换,然后再将各部分边缘连接起来,或者增加变换过程中的遍历步径,从而减少运算量加以改进。

14

理工大学毕业论文

4.2.2最大类间方差法

从统计意义上讲,方差是表征数据分布不均衡的统计量,可通过阈值对这类问题进行分割。最大类间方差法以图像的灰度直方图为依据,以目标和背景的类间方差最大为阈值选取准则,综合考虑了像素邻域以及图像整体灰度分布等特征关系,以经过灰度分类的像素类群之间产生最大方差时候的灰度数值作为图像的整体分割阈值。显然,适当的阈值使得两类数据间的方差越大越好,表明该阈值的确将两类不同的问题区分开了,同时希望属于同一类问题的数据之间的方差越小越好,表明同一类问题具有一定的相似性。

这种方法首先初步选定特定图像分割阈值,把待处理图像直方图分割成C0,C1(目标和背景) 两组,在分别记录两组像素值的各自的有关参数后,通过建立类间方差数学模型来确定两组像素点群体的方差,如此将分割阈值按照一定顺序进行变化,直至当分割的两组数据的类间方差与类内方差比值最大时候,便认为此阈值分割所得到的图像分组结果之间差别最大,即获得最优的图像分割阈值?10?。

2在分割阈值确定过程中,以?B?T?代表阈值为k时的类间方差,?i,?i分别为Ci组中像

素i产生的概率和组内所有像素点灰度值的均值,?为整体图像所有像素点灰度的均值。两组间的类间方差如式4-4所示:

2222?B??o??0?????1??1?????0?1??0??? (4-4)

运行结果:graythresh 计算灰度阈值:88

(a) 原始图像 (b) 分割结果

图4-4 最大类间方差法分割图像

结果分析:图4-4是最大类间方差法的仿真结果,这种方法是一种自动获取阈值的分割方法,最大类间方差方法具有算法简单,计算精确等优点。从图4-4(b)的分割结果可见,这种方法可以完整地将对象从图像背景中整齐清晰地分割出来,并充分反映出了原图像的细节。从而克服了其他普通的图像分割算法由于没有充分考虑到图像像素的整体分布和灰度特征,

20

理工大学毕业论文

而产生的误分割、图像细节无法清晰表现、图像区域紊乱以及边界模糊不清等一系列不良效果。

但是,在很多情况下,对复杂的整幅图像用单一阈值不能给出良好的分割结果。图像中某一部分的阈值能把该部分的物体和背景精确区分出,而对另一部分来说,可能把太多的背景也作为物体分割下来了。针对这种情况,使用局部阈值的方法就可以在不同的区域选择不同的阈值,将物体从背景中分割出来。 4.2.3迭代法

迭代法选取阈值的方法为:初始阈值选取为图像的平均灰度T0,然后用T0将图像的象素点分作两部分,计算两部分各自的平均灰度,小于T0的部分为TA,大于T0的部分为TB,求TA和TB的平均值T1,将T1作为新的全局阈值代替T0,重复以上过程,如此迭代,直至Tk收敛?11?。

具体实现时,首先根据初始开关函数将输入图逐个图像分为前景和背景,在第一遍对图像扫描结束后,平均两个积分器的值以确定一个阈值。用这个阈值控制开关再次将输入图分为前景和背景,并用做新的开关函数。如此反复迭带直到开关函数不在发生变化,此时得到的前景和背景即为最终分割结果。

对某些特定图像,微小数据的变化却会引起分割效果的巨大改变,两者的数据只是稍有变化,但分割效果却反差极大。对于直方图双峰明显,谷底较深的图像,迭代方法可以较快地获得满意结果,但是对于直方图双峰不明显,或图像目标和背景比例差异悬殊,迭代法所选取的阈值不如其它方法。

运行结果: 迭代后的阈值:89

(a) 原始图像 (b) 分割结果

图4-4 迭代法分割图像

21

理工大学毕业论文

结果分析:从图4-4(b)的迭代法分割仿真结果可以看出:迭代所得的阈值分割的图像效果良好。基于迭代的阈值能区分出图像的前景和背景的主要区域所在,但在图像的细微处还没有很好的区分度。由前面论述的双峰法可知,该图像有着良好的双峰性,因此,得到了较好的分割效果,但对于其它直方图双峰不明显,或图像目标和背景比例差异悬殊的图像,迭代法则不能得到很好的分割效果。

22

理工大学毕业论文

第五章 基于形态学分水岭的图像分割方法的仿真实现

5.1 分水岭法图像分割基本原理

分水岭算法是一种基于区域的图像分割方法,并建立在数学形态学的理论基础之上?12?。这种算法常被用于解决分离相连接的目标。它常将灰度图像看成是假想的地形表面,每个像素的灰度值表示该点的海拔高度,以图像的梯度作为输入,输出连续单像素宽度的边缘线?13?。它具有分割精细、便于软硬件实现的优点,是一种有效的图像分割方法?14?。

分水岭分割算法的思想源于测地学中的地膜形态模型。其原理描述如下:首先将一幅图像视为跌宕起伏的地貌模型,图像中每个像素的灰度值对应地形中的高度(即海拔),将均匀灰度值的局部极小区域视为盆地,并在其最低处穿孔,使水慢慢地均匀浸入各个孔,当水将填满盆地时,在某两个或多个盆地之间修建大坝。随着水位的不断上升,各个盆地完全被水淹没,只剩没被淹没的各个大坝,并且各个盆地也完全被大坝所包围,从而可以得到各个大坝(即分水岭)和各个被大坝分开的盆地(即目标物体),最终达到分割的目的?15?。

5.2 分水岭法图像分割算法

分水岭的计算过程是一个迭代标注过程。在该算法中,分水岭计算分两个步骤,一个是排序过程,一个是淹没过程。首先对每个像素的灰度级进行从低到高排序,然后在从低到高实现淹没过程中,对每一个局部极小值在h阶高度的影响域采用先进先出(FIFO)结构进行判断及标注。

分水岭变换得到的是输入图像的集水盆图像,集水盆之间的边界点,即为分水岭。显然,分水岭表示的是输入图像极大值点。因此,为得到图像的边缘信息,通常把梯度图像作为输入图像。

令M1,M2,?,MR为表示图像g?x,y?的局部最小值点的坐标的集合。令C?Mi?为一个点的坐标的集合,这些点位于与局部最小值M(无论哪一个汇水盆地内的点都组成一个连通分量)i相联系的汇水盆地内。符号min和max代表g?x,y?的最小值和最大值。最后,令T?n?表示?s,t?坐标的集合,其中g?s,t??n,即该集合如式5-1所示:

?s,t?g?s,t??n? (5-1) T?n???在几何上,T?n?是g?x,y?中的点的集合,集合中的点均位于平面g?x,y??n的下方。 随着水位以整数量从n?min?1到n?max?1不断增加,图像中的地形会被水漫过。在水位漫过地形的过程中的每一阶段,算法都需要知道处在水位之下的点的数目。从概念上来说,假设T?n?中的坐标处在g?x,y??n的平面之下,并被标记为黑色,所有其他的坐标被标记为白色。然后,当人们在水位以任意量n增加的时候,从上向下观察xy平面,会看到一幅二值图

23

理工大学毕业论文

像。在图像中黑色点对应于函数中低于平面g?x,y??n的点。

令Cn?Mi?表示汇水盆地中点的坐标的集合。这个盆地与在第n阶段被淹没的最小值有关。

Cn?Mi?如式5-2所示,它也可以被看作由下式给出的二值图像:

Cn?Mi??C?Mi??T?n? (5-2)

也就是说,如果?x,y??C?Mi?且?x,y??T?n?,则在位置?x,y?有Cn?Mi??1。否则

Cn?Mi??0。对于这个结果几何上的解释是很简单的,人们只需在水溢出的第n个阶段使用与运算将T?n?中的二值图像分离出来即可。T?n?是与局部最小值Mi相联系的集合。

接下来,令C?n?表示在第n个阶段汇水盆地被水淹没的部分的并集,如式5-3所示:

C?n???Cn?Mi? (5-3)

i?1R然后令C?max?1?为所有汇水盆地的并集,如式5-4所示:

C?max?1???C?Mi? (5-4)

i?1R可以看出,处于CnMi和T?n?中的元素在算法执行期间是不会被替换的,而且这两个集合中的元素的数目与n保持同步增长。因此,C?n?1?是C?n?集合的子集。根据式5-2和式5-3,

C?n?是T?n?的子集,所以,C?n?1?是T?n?的子集。从这个结论可得出重要的结果:C?n?1?中的每个连通分量都恰好是T?n?的一个连通分量。

找寻分水线的算法开始时设定C?min?1??T?min?1?。然后算法进入递归调用,假设在第n步时,已经构造了C?n?1?。根据C?n?1?求得C?n?的过程如下:令Q代表T?n?中连通分量的集合。然后,对于每个连通分量q?Q?n?,有下列三种可能性:

(1)q?C?n?1?为空。

(2)q?C?n?1?包含C?n?1?中的一个连通分量。 (3)q?C?n?1?包含C?n?1?多于一个的连通分量。

根据C?n?1?构造C?n?取决于以上三个条件,当遇到一个新的最小值符合条件(1)时,则将q并入C?n?1?构成C?n?;当q位于某些局部最小值构成的汇水盆地中时,符合条件(2),此时将q合并入C?n?1?构成C?n?;当遇到全部或部分分离两个或更多汇水盆地的山脊线的时候,符合条件(3)。进一步的注水,会导致不同盆地的水聚在一起,从而使水位趋于一致,因此,必须在q内建立一座水坝(如果涉及多个盆地就要建立多座水坝)以阻止盆地内的水溢出。当用3?3个1的结构元素膨胀q?C?n?1?并且将这种膨胀限制在q内时,一条一个像素宽度的水坝就能够被构造出来?16?。

24

理工大学毕业论文

结论

图像分割是图像特征提取和识别等图像理解的基础,对图像分割的研究一直是数字图像处理技术研究中的热点和焦点。本文首先介绍了数字图像处理技术中图像分割技术的基本原理和主要方法,然后分别研究了基于边缘、区域和形态学分水岭法的图像分割方法。基于边缘的分割方法主要论述了基于边缘算子和霍夫变换的分割方法,基于区域的分割方法主要论述了区域生长法、区域分裂与合并法和阈值法。接着使用MATLAB软件对各种分割方法进行了仿真,得到了分割图像,最后对仿真结果进行了分析。

实验结果表明,基于边缘的分割方法对边缘灰度值过渡比较尖锐且噪声较小等不太复杂的图像可以取得较好的效果,受噪声和曲线间断的影响较小;基于区域的分割方法利用了图像的局部空间信息,可有效的克服其它方法存在的图像分割空间不连续的缺点;阈值分割算法直观、实现简单,在图像分割中应用广泛;分水岭法对微弱边缘具有良好的响应,可以将目标物体连接在一起的目标图像很好的分割出来。

基于边缘的分割方法对于边缘复杂的图像效果不太理想,会产生边缘模糊、边缘丢失、边缘不连续等现象;基于区域的分割方法法若选取不好阈值,稳定性、准确性以及运算速度都会受到很大影响;阈值法能区分出图像的前景和背景的主要区域所在,但在图像的细微处还没有很好的区分度;分水岭图像分割算法易产生过分割现象。

在实际应用中,若能将基于边缘的分割方法和基于形态学的方法结合起来,或者用区域分裂与合并法代替区域生长法和区域增长法,则可以得到更好的分割效果。可以在这些方面对实验结果进行改进。

30

理工大学毕业论文

参考文献

[1] 丁亮,张永平,张雪英.图像分割方法及性能评价综述[J].国际IT传媒品牌软件,2010(12):82-87. [2] 杨合超,周雪梅.几种图像分割技术的比较[J].电子知识与技术,2009(9):2440-2441. [3] 乐宋进,武和雷,胡泳芬.图像分割方法的研究现状与展望[J].南昌水专学报,2004(2) :15-20. [4] 章霄,董艳雪,赵文娟,张彦佳.数字图像处理技术[M].北京:冶金工业出版社,2005:175-206. [5] 郑静,梁少华,王腾.基于MATLAB仿真的边缘检测算子研究[J].电脑知识与技术,2010(5):1189-1190. [6] 王坤,刘天伟,杜芳芳,常琳.MATLAB在对图像进行边缘检测方面的应用[J].沈阳师范大学学报(自然科学版),2005(2):161-165.

[7] 徐飞,施晓红.MATLAB应用图像处理[M].西安:西安电子科技大学出版社,2002:207-224. [8] 胡小丹,李 文,刘海博. 基于高斯统计模型的快速图像区域分割方法[J]. 福建师范大学学报(自然科学版),2011(2) :133-135.

[9] 刘中合,王瑞雪.数字图像处理技术现状与展望[J].计算机时代,2005(9) :25-29.

[10]朱秀昌,刘峰,胡栋.数字图像处理与图像通信[M].北京:北京邮电大学出版社,2002:142-173. [11]赵椿荣,赵忠明等.数字图像处理导论[M].西安:西北工业大学出版社,1996:212-234.

[12]冷美萍,鲍苏苏,孟祥玺,彭丰平.一种改进的分水岭分割算法[J]. 贵州师范大学学报(自然科学版),

2010(1) :62-65

[13]张兆和,杨高波,刘志等.视频对象分割提取的原理与应用[M].北京:科学出版社,2009:20-21. [14]陈婷婷,程小平.采用模糊形态学和形态学分水岭算法的图像分割[J].西南大学学报(自然科学版),2008(3):142-145. ",

[15] 孙敬飞,杨红卫.形态学分水岭算法在粘连大米图像分割中的应用[J].粮油食品科技,2010(18):4-6. [16] Rafael C.Gonzalez,Richard E.Woods.Digital Image Processing[M].Beijing:Publishing House of Electronics

Industry,2010:711-809.

[17] Vincent L,Soille P. Watershed in Digital Spaces an Efficient Algorithm Based on Immersion Simulatlon [J].

IEEE Trans PAMI, 1991, 13(6) :582-599.

31

理工大学毕业论文

附录Ⅰ 外文文献翻译

(1)外文文献原文

Robust Analysis of Feature Spaces: Color Image Segmentation

Abstract

A general technique for the recovery of significant image features is presented. The technique is based on the mean shift algorithm, a simple nonparametric procedure for estimating density gradients. Drawbacks of the current methods (including robust clustering) are avoided. Feature space of any nature can be processed, and as an example, color image segmentation is discussed. The segmentation is completely autonomous, only its class is chosen by the user. Thus, the same program can produce a high quality edge image, or provide, by extracting all the significant colors, a preprocessor for content-based query systems. A 512?512 color image is analyzed in less than 10 seconds on a standard workstation. Gray level images are handled as color images having only the lightness coordinate.

Keywords: robust pattern analysis, low-level vision, content-based indexing

1 Introduction

Feature space analysis is a widely used tool for solving low-level image understanding tasks. Given an image, feature vectors are extracted from local neighborhoods and mapped into the space spanned by their components. Significant features in the image then correspond to high density regions in this space. Feature space analysis is the procedure of recovering the centers of the high density regions, i.e., the representations of the significant image features. Histogram based techniques, Hough transform are examples of the approach.

When the number of distinct feature vectors is large, the size of the feature space is reduced by grouping nearby vectors into a single cell. A discretized feature space is called an accumulator. Whenever the size of the accumulator cell is not adequate for the data, serious artifacts can appear. The problem was extensively studied in the context of the Hough transform, e.g.. Thus, for satisfactory results a feature space should have continuous coordinate system. The content of a continuous feature space can be modeled as a sample from a multivariate, multimodal probability distribution. Note that for real images the number of modes can be very large, of the order of tens.

The highest density regions correspond to clusters centered on the modes of the underlying probability distribution. Traditional clustering techniques, can be used for feature space analysis but

32

理工大学毕业论文

they are reliable only if the number of clusters is small and known a priori. Estimating the number of clusters from the data is computationally expensive and not guaranteed to produce satisfactory result.

A much too often used assumption is that the individual clusters obey multivariate normal distributions, i.e., the feature space can be modeled as a mixture of Gaussians. The parameters of the mixture are then estimated by minimizing an error criterion. For example, a large class of thresholding algorithms are based on the Gaussian mixture model of the histogram, e.g.. However, there is no theoretical evidence that an extracted normal cluster necessarily corresponds to a significant image feature. On the contrary, a strong artifact cluster may appear when several features are mapped into partially overlapping regions.

Nonparametric density estimation avoids the use of the normality assumption. The two families of methods, Parzen window, and k-nearest neighbors, both require additional input information (type of the kernel, number of neighbors). This information must be provided by the user, and for multimodal distributions it is difficult to guess the optimal setting.

Nevertheless, a reliable general technique for feature space analysis can be developed using a simple nonparametric density estimation algorithm. In this paper we propose such a technique whose robust behavior is superior to methods employing robust estimators from statistics.

2 Requirements for Robustness

Estimation of a cluster center is called in statistics the multivariate location problem. To be robust, an estimator must tolerate a percentage of outliers, i.e., data points not obeying the underlying distribution of the cluster. Numerous robust techniques were proposed, and in computer vision the most widely used is the minimum volume ellipsoid (MVE) estimator proposed by Rousseeuw.

The MVE estimator is affine equivariant (an affine transformation of the input is passed on to the estimate) and has high breakdown point (tolerates up to half the data being outliers). The estimator finds the center of the highest density region by searching for the minimal volume ellipsoid containing at least h data points. The multivariate location estimate is the center of this ellipsoid. To avoid combinatorial explosion a probabilistic search is employed. Let the dimension of the data be p. A small number of (p+1) tuple of points are randomly chosen. For each (p+1) tuple the mean vector and covariance matrix are computed, defining an ellipsoid. The ellipsoid is inated to include h points, and the one having the minimum volume provides the MVE estimate.

33

理工大学毕业论文

Based on MVE, a robust clustering technique with applications in computer vision was proposed in. The data is analyzed under several \\resolutions\by applying the MVE estimator repeatedly with h values representing fixed percentages of the data points. The best cluster then corresponds to the h value yielding the highest density inside the minimum volume ellipsoid. The cluster is removed from the feature space, and the whole procedure is repeated till the space is not empty. The robustness of MVE should ensure that each cluster is associated with only one mode of the underlying distribution. The number of significant clusters is not needed a priori.

The robust clustering method was successfully employed for the analysis of a large variety of feature spaces, but was found to become less reliable once the number of modes exceeded ten. This is mainly due to the normality assumption embedded into the method. The ellipsoid defining a cluster can be also viewed as the high confidence region of a multivariate normal distribution. Arbitrary feature spaces are not mixtures of Gaussians and constraining the shape of the removed clusters to be elliptical can introduce serious artifacts. The effect of these artifacts propagates as more and more clusters are removed. Furthermore, the estimated covariance matrices are not reliable since are based on only p + 1 points. Subsequent post processing based on all the points declared inliers cannot fully compensate for an initial error.

To be able to correctly recover a large number of significant features, the problem of feature space analysis must be solved in context. In image understanding tasks the data to be analyzed originates in the image domain. That is, the feature vectors satisfy additional, spatial constraints. While these constraints are indeed used in the current techniques, their role is mostly limited to compensating for feature allocation errors made during the independent analysis of the feature space. To be robust the feature space analysis must fully exploit the image domain information.

As a consequence of the increased role of image domain information the burden on the feature space analysis can be reduced. First all the significant features are extracted, and only after then are the clusters containing the instances of these features recovered. The latter procedure uses image domain information and avoids the normality assumption.

Significant features correspond to high density regions and to locate these regions a search window must be employed. The number of parameters defining the shape and size of the window should be minimal, and therefore whenever it is possible the feature space should be isotropic. A space is isotropic if the distance between two points is independent on the location of the point pair. The most widely used isotropic space is the Euclidean space, where a sphere, having only one

34

本文来源:https://www.bwwdw.com/article/t8e.html

Top