三种方法实现医学图像压缩

更新时间:2023-04-13 23:42:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

中北大学2013届毕业论文

1 绪论

1.1 医学图像压缩的研究意义

随着现代医疗水平的不断进步和经济实力的增强,更多的医疗成像设备投入临床应用,数字化的医学图像在医学临床诊断中发挥的作用越来越重要,对医学图像压缩技术的研究显得尤为迫切,主要表现如下:

首先,数字医学图像的数据量急剧增加。医院里除了经常使用的x射线检查项目外,像CT, MR、核医疗(如SPELT, PET等)以及超声等也进入日常的医学检查和诊断应用中。大多数断层扫描对于感兴趣区的部位都要产生16-64幅切片图像,而且超声和血管造影等每次检查都生成3-30分钟的视频序列图像,这必然使得原来就很庞大的数字医学图像的数据量,以更快的速度增加。而且医学图像数据还要有较长的保存周期,这使它要占用更大的存储空间[1]。

其次,现代医学对医学图像信息的存储与通信提出了更高的要求[2]。全数字的存储方式,PACS( Picture Archiving and Communication System,医学图像的归档与通信系统)现在已得到广泛的应用,而在组成PACS系统的众多技术之中,压缩技术无疑是关键技术之一。另外,在远程医疗等应用环境中,要求在更窄的通信带宽条件下实现医学图像的高保真传输,如不进行有效压缩,将占用大量的存储空间,并对传输网络的带宽产生极大的压力。

医学图像作为自然图像的一种,其数据同样存在很大的冗余[3],有一定的压缩空间。然而,医学图像自身的特殊性对压缩技术提出了更高的要求。医学图像数据描述的是人体组织、器官等的解剖信息,其中包含的信息十分丰富,而这些信息是医学诊断和疾病治疗的重要根据,图像的任何细节的损失都可能导致错误的诊断,因此对医学图像的压缩应更为谨慎。目前医学图像的压缩通常只采用无损压缩技术,虽然保证了图像的质量,但只能得到很低的压缩比(一般在2.5倍以下)。因此研究有针对性的医学图像压缩技术显得尤其重要。

综述以上几点,医学图像压缩有其必要性,也有其可行性,无论在理论上还是在应用中,研究医学图像压缩技术都将有重要意义。

1.2 医学图像压缩国内外研究现状及发展趋势

图像压缩的研究起源于20世纪40年代。1948年香农的经典论文“通信的数学原理”

第 1 页共38 页

中北大学2013届毕业论文

中首次提到信息率失真函数概念,1959年他又进一步建立了率失真理论,从而奠定了信源编码的理论基础。随后伯杰(T Bergen 1971)等人又对其进行了深入的研究[4],并取得了一定的进步,为后人对该领域进一步研究打下了理论基础。随着数据压缩理论的不断发展和日益成熟,一些研究人员逐渐开始对声音、文字和图像等信号的压缩技术进行了研究。

随着图像压缩技术在相关领域中的广泛应用,医学图像压缩技术由于临床医学方面的特殊应用,成为数据压缩技术中一个新的领域,并引起了国内外学者的极大关注,如德国特里尔的“Telematik”研究所梅内尔教授、美国Center for Next Generation Video Rensselaer Polytechnic Institute的Willima A.Pearlman教授、浙江大学生物医学工程系童勤业教授和杨胜天博士后、东南大学生物医学工程系的顾适逸和罗立民教授、南京大学张福炎教授等都对医学图像无损和近无损压缩方法进行了研究,并取得了一定的成果[5]。

80年代中后期,相关学科的迅速发展和新兴学科的不断涌现为图像压缩编码的发展注入了新的活力。人们对图像信息需求的剧增也有利地促进了图像压缩技术的进步,许多学者结合模式识别、计算机图形学、计算机视觉、神经网络、小波分析和分形几何等理论,开始探索研究图像压缩的新理论和新方法。同时,关于人类的视觉生理、心理特性的研究成果也打开了人类的新视野,许多新的图像压缩编码方法相继提出:M. Kunt 于1985年提出了利用人眼视觉特性的第二代图像编码技术;1988年M. Barnsley提出了基于迭代函数系统的分形图像编码技术[6];1989年S. Mallat将小波分析用于图像编码等等。在众多的图像编码方案中,小波变换以其良好的变换特性在图像编码技术中得到了相当广泛的应用。同时,基于小波变换的图像压缩标准也在不断的发展和完善中[12],JPEG 2000就是建立在小波变换基础上的最新的静态图像压缩标准,因此成为医学图像压缩编码领域的研究热点[7]。

随着多媒体技术的快速发展,静止图像的应用越来越广泛。它的应用主要集中在图像的存储和图像的传输两方面。散余弦变换JPEG图像压缩编码算法。鉴于数字图像的噪声模型,针对含有噪声的数字图像去除相关性比较差的问题,对图像作去噪处理后再用静止图像压缩标准JPEG作图像压缩编码。通过 MATLAB仿真实验,表明先过滤再压缩的压缩方案信噪比比较高,压缩比的性能也可以达到良好[8]。

现阶段关于感兴趣区域编码技术的研究主要基于小波变换,利用小波多分辨率的特

第 2 页共38 页

中北大学2013届毕业论文

性,对编码方式进行改进。国外对ROI编码的研究主要集中在小波系数平移思想的改进和将标准中的两种方法同不同编码算法的结合。国内对ROI编码的研究只是单纯地将ROI编码思想与实际应用相结合,没有对算法本身做改进[9]。但也有个别文献进行了创新,比如郑杰等人就对小波系数移位做出了创新,采用一种结合人眼生理特性对小波系数进行非均匀化移位的方法[10]。由于图像质量总是与人类的视觉相匹配,如何在ROI编码中结合人眼的视觉特点是很多专业的学者都在进行探索的事情。张立保等人通过对整幅图像进行大幅度压缩,重构后与原图像相减得到残差图像,确定ROI区域,并且对残差图像中的ROI区域进行离散余弦变换(DCT)二次编码,将残差信号码流放在原码流后面的方法进行压缩。这些都为小波系数提升和具体产生码流方面开拓了新思路[11]。

医学图像的特性之一在于诊断区域必须满足诊断的要求。以普通的乳腺X光片为例,其图像是4096 X 4096 X 16bit约33MB,但具有诊断价值的重要区域只是其中的一部分,相当一部分是背景信息。压缩的关键是通过手工或自动方式分割出感兴趣区域和背景区域。我们可以对感兴趣区域实现低压缩比甚至是无损压缩编码[12],以求获得高质量的重建图像,而对其它区域采用较高压缩率,这可在很大程度上缩小图像大小,在高效节省存储空间的同时,保存重要的诊断信息。针对上述思想,人们对基于感兴趣区域医学图像无损压缩方法进行了大量研究工作,取得了一些成绩,并在一定范围内得到T应用。Monica Penedo ( Spain)和William A.pearlman ( USA ) [13]对一幅空间分辨率为4000 X 5000像素,像素点尺寸SOum比特深度12bit,数据量40MB的数字乳腺图进行比特率从O.lbpp到lbpp的ROI编码,在比特率0.4bpp时,背景系数置0,由PSNR值客观评估和人眼主观观察重建图像,结果表明乳腺组织区域与原图无明显变化,微钙化点簇细节保存完好,不影响医生诊断。秦安等提出了一种新颖的适合医学图像压缩的AR-EWC 算法,并将该算法应用于临床头部MR图像的压缩,实验表明该算法在保证了ROI区域无损压缩的前提下,达到了与经典的有损压缩算法相当的压缩比率[14]。

总的来说,医学图像压缩问题的关键在于怎样在保持重要的临床诊断信息无损的前提下,提高整体图像的压缩比。国内关于ROI编码的研究还处于初始阶段[15]。

1.3 主要研究内容及章节安排

本课题拟采用基于JPEG、基于小波变换、以及感兴趣区域医学图像压缩三种医学图像压缩方法来进行医学图像的压缩处理,用Matlab算法编程实现,并进行比较、得出结论。

第 3 页共38 页

中北大学2013届毕业论文

第一章:阐述研究医学图像压缩的意义,概述医学图像压缩在国内外的研究情况,介绍论文的结构安排。

第二章:介绍医学图像的基础理论,包括图像压缩的概念、医学图像压缩特点、医学图像压缩方法及评价标准。

第三章:主要介绍了JPEG医学图像压缩标准的原理及应用。

第四章:主要介绍了基于小波变换的医学图像压缩。

第五章:主要介绍了基于感兴趣区域的医学图像压缩。

第六章:对比分析。

第七章:全文总结。

第 4 页共38 页

中北大学2013届毕业论文

2 医学图像压缩的基础理论

2.1 图像压缩的概念

一幅图像可以对应一个二维函数f(x, y),这里x和y是空间坐标,在任何一对空间坐标(x, y)上的幅值f称为该点的图像强度或灰度,当x, y和幅值f为有限的,离散的数值时,称该图像为数字图像[16]。因而数字图像压缩实际是进行数据的压缩。

数据压缩指的是减少给定信息所需的数据量。数据和信息这两个概念是完全不同的。数据是信息传送的手段。对相同数量的信息可以用不同数量的数据表示。例如,对于同一个故事可以叙述得冗长啰嗦,也可以说得简明扼要。感兴趣的信息是这个故事;词句是用于表达信息的数据,两个不同的人用不同数量的词句讲述同样的故事,这个故事就有了两个不同的版本,且至少有一个版本包含了不必要的数据。这就叫包含了数据冗余。在数字图像中,可以确定三种基本的数据冗余:编码冗余、像素间冗余和心理视觉冗余。当其中的一种或多种得到减少或消除时,就实现了数字图像的压缩。消除编码冗余和像素间冗余属于无损压缩,消除心理视觉冗余属于有损压缩。

2.2 医学图像压缩的特点

医学图像属于灰度图像,它具有像素深度较大的特点,每个像素占用12:24bits。一幅原始的医学图像通常占用较大的存储空间,因此必须对其进行压缩。

为保证诊断的正确性,医学图像压缩时要求尽可能的保存与诊断相关的信息。因此,医学图像的压缩方案具备以下几大特点[17]。

1.保证与诊断有关的信息不丢失。目前,在临床实践特别是初期诊断中,有损压缩是很受限制的,这主要是由于细微的数据损失都会影响到医生的主观判断。

2.在医学图像压缩方案中,渐进编码(Progressive coding)是一个很重要的特性,因为它允许在窄带信道上传送较大尺寸的图像。它在接收端随着接收到的码字的增加由粗到细地逐步恢复一幅完整的图像。这样,医生可以在较短时间内浏览完病人的图片序列,由最先显示的粗糙的低频信息决定图像是否有用,而不需要等待图像被完全接收并显示出来。

3.压缩过程的时间限制。特别强调的是解压时间,检索指令与屏幕显示的时间间隔不应超过2秒。

4.支持感兴趣区域编码。医学图像中对诊断有帮助的往往是对象部分甚至是对象

第 5 页共38 页

中北大学2013届毕业论文

中的某一组织区域,而背景部分的信息并不重要。对此在编码时应给予特别对待,对感兴趣区域采用无损压缩,其它区域采用高压缩比的有损压缩,这样可以保证重要信息不丢失,并尽可能地提高图像的压缩比。

2.3 医学图像压缩方法

根据图像压缩过程中图像质量是否损失,可把医学图像压缩分为无损压缩和有损压缩。

2.3.1 无损压缩

无损压缩也称为可逆编码,图像经过无损压缩,解压后的图像与原图像完全相同,没有任何信息的损失。嫡编码是一类常用的无损压缩方法,它利用了信源的信息嫡冗余,是基于信号统计特性的编码技术。它包括Huffman编码、算术编码、游程编码及Lzw等编码方法。除了嫡编码外,下述的无损压缩方法也是比较高效的(除了可能的量化误差外)方法。

1.差分脉冲编码调制方法(DPCM)

DPCM方法的主要思想是采用一个线性预测公式,通过对一个特定域内的像素加权求和,得到其与该域中的待预测像素之间的差值,对此差值量化后的数据进行嫡编码而得到压缩的比特数。这里所选定的特定域是一维、二维或三维。由于没有有意识的丢弃任何信息,故可归入无损压缩,压缩比可以达到1.5到3。为了改善结果,可以采用非线性预测的方法,例如应用神经网络做非线性预测。

2.分层内插法(HINT)

HINT是针对医学图像无损压缩算法而发展起来的,因而在医学图像压缩中的影响较其它方法更大。它基于由低到高多分辨率的思想,通过对低分辨率的原始图像内插得到较高分辨率图像的估计,并产生其与实际图像之间的差值。在这种压缩算法中,实际传输的是嫡编码的最低分辨率原始图像与各较高分辨率下的差值结果[18]。由于内插的原因,可能的误差除了量化之外,还有取整。如果在嫡编码过程中采用信源统计特性的自适应模型则可以改善压缩效率。

3.差分金字塔方法(DP)

DP也是一个变分辨率方法,是一般图像压缩技术中金字塔编码方法的特例。DP一般可归入有损压缩的范畴,但在适当的约束下也可用于无损压缩。可以考虑对均值及均值与相应分辨率下的像素之间的差值进行编码。有研究证明,如果对不同分辨率下的像

第 6 页共38 页

中北大学2013届毕业论文

素引入适当的变换形式有助于提高压缩效率。

4.多重自回归法(MAR)

MAR是一种二维的压缩方法,它包括MAR与多分辨率MAR。MAR在假设图像数据局部平稳的前提下将其表示成为二维线性随机模型,先通过预测产生模型参数和图像均值的估计,再对图像数据与均值估计之差和由预测模型产生的这个差的预测值之间的差值进行嫡编码。考虑到预测性与复杂性的折衷,这里的模型参数一般选3到4个。多分辨率的MAR仅是将MAR结构与多分辨率图像表达式相适配,它包括滤波、子抽样和内插等操作。

2.3.2 有损压缩

有损压缩也称为不可逆编码,图像经过有损压缩后,解压后的图像与原图像不完全相同。常用的有损压缩方法有:预测编码、变换编码、矢量量化编码。比较流行的有损医学图像压缩方法包括以下几种:

1.离散余弦变换(DCT)

DCT方法可以在统计意义上对Markov信源达到最接近KL变换的压缩效果,因而被广泛的应用于图像压缩,其中最著名的应用就是JPEG标准。按照定义的不同,DCT可以分为四种类型,其中第二种类型的应用最为普遍[19]。现在己经有很多压缩方案采用了DCT 的方法完成了对医学图像的有损压缩。最近的研究表明手与胸部的放射成像在20:1的DCT压缩比下,其诊断准确性在统计意义上并没有明显的差别。一般地,如果图像中重要的诊断信息在一个比较窄的频率范围内,则DCT方法能达到较好的压缩效果。但是,大部分医学图像的细节都是特异并且非平稳的,其携带的信息分布在一个比较宽的频带内,当图像矩阵经DCT变换到系数矩阵上后,非零值将分布在相当大的区域上,此时如果对变换系数量化不当,在边缘处会出现明显的边界效应。因此,DCT方法并不具有很好的空间、频率定位特性,而这一点对医学图像压缩来说却是十分必要的。在这方面,离散小波变换(DWT)占有一定的优势。

2.向量量化编码(VQC)

VQ(向量量化)最初是作为量化器被提出的,但它更多的是作为编码方法而被讨论。它的量化效率随着向量维数的增大而逐渐趋于无穷,从理论上来说具有最高的量化效率,因而VQ是渐进最佳结构的块信源编码器。但是其码本空间的全搜索方案的编码是很复杂的,它随矢量个数线性变化,随矢量维数指数变化,所以,VQ往往要在量化效率

第7 页共38 页

中北大学2013届毕业论文

第 8 页 共 38 页 与量化复杂性之间按照计算机设备的能力而折衷[20]。减少计算复杂性是VQ 应用的主要问题。在量化器设计和码本设计方面人们己做了很多工作。最近又有人提出同时把量化器与码本设计相结合的设计方案。在各种方案中,树状结构的编码器在医学图像的压缩中有较深入的研究,研究者曾对12bpp 的CT 图像在9:1压缩比下进行观察,结果发现它在诊断准确性上没有什么显著变化。由于VQ 压缩相对平均的区域较边缘成分更有效,而高保真的边缘信息对于医学诊断是十分重要的,因此,VQ 对医学图像压缩比的提高与计算机复杂性的降低都受到了限制。

2.4 医学图像压缩的评价标准

对医学图像进行有损压缩,不可避免的要引入失真,因此需要对压缩后的重构图像质量给予评估。一般评估的标准可分为客观标准和主观标准。.

2.4.1 客观标准

1.压缩比。

医学图像压缩的目的就是用较少的数据表示原始图像所包含的信息,以便减少存储空间和传输时间,因此衡量图像数据压缩程度的压缩比是一个重要的方面。压缩比(Compression Ratio, CR)的定义为::

r k CR /= 式(2.1)

其中k 和厂分别代表原始图像和压缩后图像每个像素所占的位数。

2.均方差(MSE )。

它的定义为:

∑∑-===M x N

y y x f y x f

MN MSE 112)],(?),([1 式(2.2) 其中,),(y x f ,,(?y x f

分别表示原图像和重建图像的像素点的灰度值, x ,y 为图像平面的坐标,M ,N 为图像尺寸。

3.峰值信噪比(PSNR )。

它的定义为:

MSE

y x f y x f PSNR 2))]),(?max()),,((max[max(log 10= 式(2.3)

中北大学2013届毕业论文

均方差大大地依赖图像强度比例,对于同一个MSE的值,随着图像灰度深度的变大,其畸变将会变小,而峰值信噪比则可避免上述问题。一般而言,PSNR的值越高,表明压缩后恢复的图像质量越好。

2.4.2主观标准

主观评价标准采用平均判分MOS(mean opinion score)的方法。这种方法是选择一组评价者给图像进行打分,再将这些打分进行平均。表2.1是两种典型的评分标准。

表2.1 图像压缩主观评价标准

第9 页共38 页

中北大学2013届毕业论文

3 JPEG医学图像压缩

3.1 JPEG概述

JPEG标准描述了如下四种编码模式其中会用到两种基本的压缩算法以及两种数据编码方法[21]。

四种编码模式:

3.基于DCT顺序模式:对由8*8像素组成的像素块(Minimum Code Unit),按照从左到右、从上到下对图像进行扫描和编码。

2.基于DCT渐进模式处理顺序和编码方式与基于DCT顺序模式相同,但有多次扫描处理。扫描效果由模糊到清晰,逐次递进。

3.无损模式:使用二维差分脉冲调制技术,保证解码后精确复原到原始图像的采样值。

4.层次模式:以多种分辨率对图像进行编码,可根据需求只对低分辨率数据进行解码,忽略高分辨率数据。

压缩算法:

1.有损的离散余弦变换(DCT)。

2.无损(lossless)的预测技术压缩。

数据编码方法:

1.哈夫曼编码。

2.2.算术编码。

在一般情况下,JPEG图像采用基于DCT顺序模式,因此本论文主要研究基于DCT 顺序模式下,优化JPEG处理,提升多媒体网关(Multi-Service Proxy,MSP)性能及改善用户体验的问题。

3.2 JPEG编码流程

对一个原始图像信息进行JPEG编码,总体来说可分为5步:

1.二维正向离散余弦变换(Discrete Cosine Transform);

2.重排列DCT结果;

3.量化;

4.DC系数差分脉冲调制编码,AC系数Zig-Zag扫描,RLE编码;

第10 页共38 页

中北大学2013届毕业论文

5.范式Huffman编码。

3.2.1 离散余弦变化DCT

离散余弦变换(Discrete Cosine Transform)是JPEG编码标准中占有重要地位。JPEG 编码算法利用图像信号经过离散余弦变换(Discrete Cosine Transform)以后能量都集中在低频部分的特性,通过衰减高频信号的方式压缩数据。并且当信号近似马尔科夫过程(Markov Processes)时,离散余弦变换(Discrete Cosine Transform)的去相关性近似于K-L变换(Karhunen-Loeve,具有最优去相关性)的性能[22]。

在傅立叶级数展开式中,如果被展开的函数式是偶函数,那么其傅立叶级数中只包含余弦项,再将其离散化可导出余弦变换,因此称之为离散余弦变换。时间域中信号需要许多数据点表示;在x轴表示时间,在y轴表示幅度回。信号一旦用傅立叶变换转换到频率域,就只需要几点就可以表示这个相同的信号。

3.2.2 量化

在JPEG标准的基于DCT顺序编码模式中,量化这一步主要的有损过程,是图像质量下降的主要原因。

量化的目的是通过使DCT系数矩阵中的频率较高的AC分量除以一个常数,从而增加零系数的数目,而保留DC分量。这利用了人眼对高频部分不敏感的特性来实现数据的大幅简化[23]。

JPEG标准中使用线性均匀量化器,并且给出了一个参考标准量化表。如表3.1, 3.2所示。

表3.1是标准亮度量化表,表3.2是色度量化表,其特点如下:1.由于人眼对于亮度较色度更敏感,所以亮度量化表的系数大部分都比色度量化表小,因此亮度信息较色度信息衰减少。2.由于人眼对于图像的低频分量比高频分量更敏感,因此量化矩阵中频率越大的系数对应的量化系数越大(矩阵(0,0)为直流分量DC,其他为交流分量ac,频率延矩阵左对角线依次升高)。因而经常会把很多高频率的成份四舍五入而接近0,且剩下很多会变成小的正或负数。

表3.1 JPEG亮度量化表

第11 页共38 页

中北大学2013届毕业论文

第 12 页 共 38 页

3.2.3 “Z ” 字形编排(zig-zag 变换)

量化后的矩阵块有两个重要特点是1.直流分量相对于交流分量来说要大得多,如图3-1所示,直流分量(DC)为26近似交流分量的10倍。2。交流分量中含有大量的0,可以通过式中“Z ”的方式重新编排数据块。如图3.1所示zig-zag 编排[24]。

这种编排方式可以得到连续的多个0,这样有利于利用下一步的行程编码算法(RLE: Run Length Coding)对它们进行编码。

8x8矩阵块经过离散余弦变换(DCT)变换之后得到的直流分量(DC)的重要特征是直流分量(D C)系数的数值相对于交流分量(AC),并且相邻88 矩阵块的直流分量(DC)系数值变化很小。JPEG 算法充分利用了这一特征,采用了差分脉冲调制编码(DPCM 技术,对相邻图像块之间量化直流分量(DC)的差值(Delta)进行编码。即利用相邻的两个矩阵块的特性再次简化数据[25]。也就是说DC 分量-26,需要单独处理。

而对于其他63个交流分量(AC)采用zig-zag (“z “字形)行程编码,以增加连续0

中北大学2013届毕业论文

的个数。

图3.1 zig-zag编排

3.2.4 行程编码

行程编码(Run Length Coding)是一种无损压缩编码

对于如下数据:666666888888883333332222211111111。

有一个特点是有大量重复出现的数字,因此可以用一种简化的方法来记录这一串数字,如(6, 6)(8,8)(3,6)(2,5)(1,8),简化后的记录串即为上面数据的行程编码[26]。

显然行程编码记录串的位数应该远少于原始字符串的位数。

3.2.5 范式Huffman编码

在直流DC系数经过上面的DPCM编码,交流AC系数经过RLE编码后,得到的数据,还可以再进一补压缩,即使用Huffman编码来处理。传统的Huffman编码依赖于二叉树,一方面Huffman编码生成的速度不够快,另一方面在没有指针的程序设计语言中要实现二叉树结构又非常复杂[27]。JPEG标准中采用范式Huffman编码解决这一问题。

范式Huffman编码(Canonical Huffman Code)的基本思路是:并非只有使用二叉树建立的前缀编码才是Huffman编码,只要符合(1)是前缀编码(2)某一字符编码长度和使用二叉树建立的该字符的编码长度相同这两个条件的编码都可以叫做Huffman编码。现在流行的很多压缩方法都使用了范式哈夫曼编码技术,如GZIB 、ZLIB 、 PNG、 JPEG、MPEG等。

第13 页共38 页

中北大学2013届毕业论文

第 14 页 共 38 页 构造范式Huffman 编码的方法大致是:

1) 统计每个需要编码的字符的频率。

2)根据这些频率信息求出该符号在传统Huffman 编码树中的深度(也就是表示该符号所需要的位数一一编码长度)。因为我们在关心的仅仅是该符号在树中的深度,完全可以放弃构造二叉树[28]。

3)分别统计从最大编码长度Maxlength 到1的每个长度对应了多少个符号。根据这个信息从Maxlength 个。开始以递增顺序为每个符号分配编码。

4)编码、输出压缩信息,并保存按频率顺序排列的符号表,然后保存每组同样长度编码中的最前一个编码以及该组中的编码个数。

使用范式Huffman 编码表的好处就是使得出现频率高的数字小于8位,而出现频率低的数字大于8位,这样对整体而言,就会极大地减少数据量。

需要注意的是,在JPG 文件中,一般有两个Huffman 表,一个是DC 用,一个是AC 用,它们是类似的。

对DC 编码的部分是单独来处理的,并且是放在上面这个串的最前面。

3.3 基于DCT 系数的空间尺度变换

3.3.1 DCT 系数块及其子块的空间关系

目前常用的图像尺度变换算法主要是在空间域对像素点进行插值运算,比如双线性插值,最近邻插值等。这些算法应用具有应用时间较长,效果较稳定等优点,但是应用于多媒体网关(Multi-Service Proxy)时,必须将己经被压缩的JPEG 文件转换到空间域进行插值运算,然后重新编码发送出去。

本章在研究Jiang [26]所提出的块DCT 和其子块DCT 的线性关系的基础上,设计并实现了基于频率域(DCT)的尺度变换方法。使得尺度变换在频率域(DCT)就可以完成。

Jiang 等提出了块与其子块DCT 系数的空间关系的概念,并详细论证了可以由块的DCT 系数通过一定的矩阵运算直接等效算出构成它的子块的DCT 系数.该过程可以描述为:给定一个块B ,它有M L ?行,N M ?列,则可将块B 分解为M L ?个大小为N M ?的子块ij SB ( i=0,1,...,L-1 ; j=0,1,...,M-1 ),那么己知块B 的(M L ?)(N M ?)的DCT 变换的系数矩阵,可以直接在DCT 域通过矩阵运算构造出由这M L ?个子块组成的N M ?的DCT 变换系数,这个过程称为块分解;反之,同样可以通过M L ?个子块SB 。的N N ?的DCT 系数矩阵,求出块B 的(M L ?)(N M ?)DCT 变换的系数矩阵,称为子块

中北大学2013届毕业论文

第 15 页 共 38 页 合并。

ij C 为块的(N L ?)(N M ?)的DCT 系数矩阵;ij C (i=0,1,...,L-1;j=0,1,...,M-1)

,为子块SB 。的DCT 系数矩阵,它们的大小为N N ?;1A 和2A 为稀疏的可逆变换矩阵,变换矩阵中的每个元素只与基函数相关,可以事先确定。同时,因为变换矩阵可逆[29]。

3.3.2 基于DCT 域的下采样

上一小节中论证了DCT 块及其子块的线性关系,如同在像素域下采样,是原始图像中几个相邻像素的线性组合。对于大小为16x16的像素块下采样成素块可以按下面公式计算:

i i i i i W B H B ∑===4

1 式(3.1)

其中i H 是垂直方向的下采样矩阵,i W 是水平方向的下采样矩阵。

由于式3-2是线性的,所以可直接应用于DCT 域。

)()()()(4

1i i i i i W DCT B DCT H DCT B DCT ∑=== 式(3.2)

3.4 matlab 仿真结果图

图3.2 JPEG 仿真结果图1

中北大学2013届毕业论文

图3.3 JPEG仿真结果图2

图3.4 JPEG仿真结果图3

第16 页共38 页

中北大学2013届毕业论文

4 基于小波变换的医学图像压缩

4.1 小波变换用于图像压缩的基本思想

小波变换用于图像编码的基本思想是:首先选择小波基对原始图像进行小波变换,得到一系列小波系数,然后对这些系数进行量化编码,利用小波系数同一子带中相邻元素间具有一定相关性的特点和在小波系数的量化上采取的方法来达到图像数据压缩的目的[30]。

4.2 影响小波编码效果的因素

4.2.1 小波基的选择

在对图像进行压缩编码时最重要的一个环节就是小波基的选取,选择合适的小波基对压缩编码后的图像效果十分有利,反之,就会大大影响压缩后图像的效果,也不利于对压缩后的图像进行研究。选择小波基时,要兼顾小波的紧支性和正则性(光滑性),还要考虑其相位特性。一般说来,小波的紧支集越紧越好,但是这样一来就会影响小波正则性,因此要多方面考虑。尽管在最优小波基的选择上存在一定的难度,但通过研究发现还是有一些参考标准可以用来作为我们选择的依据,因此应该综合考虑这些特征来选择适合我们需要的小波基[31]。

Daubechies给出了一种方法,构造了实的紧支小波基,紧支小波基意味着有限一长的共轨镜像滤波器,能够很好的满足小波基的要求。因此,本文中采用Daubechies(9/7)小波来构造滤波器。

大量研究表明,一般选择具有紧支性和正则性较好的小波,这样的小波比较适合于图像的压缩编码,基本不会对图像压缩效果造成影响。

4.2.2 边界延拓

顾名思义,边界延拓主要针对的是图像的边界信息图像的编码效果也会因为图像的边界受到影响。在对有限长度的图像数据进行小波变换时,会使得图像子带信号的数据点增加,而为了减少这些不必要的数据点,必须将其去掉,这就会造成图像信息的丢失。为了减少这种失真,在对图像进行小波变换的时候,必须对原始图像信号进行边界扩展,使其成为一个无限信号。

4.2.3 小波系数的量化

量化根据不同的标准可以分为下面四种方法,按照量化级的划分方式可分为均匀量

第17 页共38 页

中北大学2013届毕业论文

化和非均匀量化,按照量化的维数可分为标量量化和矢量量化[32]。

均匀量化是指对输入信号均匀划分其动态范围,在某个区间内输入信号与输出值一一对应。而非均匀量化是相对均匀量化而言的,是对输入信号的动态范围不均匀划分。因为一般的图像信号中,人眼所关注的主要是图像的低频信息,相应地对图像的高频信息的关注度较低,为了保证所关心的信号被精确还原,因此对不同频域信息的量化就需要采用不一样的步长。

标量量化是一维的量化,一个幅值对应一个量化结果。矢量量化的出现是将其作为压缩编码方法来研究的,其基本思想是:将输入数据分组,将每组作为一个矢量,到事先建好的码书中找与之最相近的矢量作为量化结果输出[33]。

一般的小波系数的量化都采用标量量化,这样使得量化过程比较简单,矢量量化也是人们研究的一个热门方向,量化效果要优于标量量化,但其量化算法比较复杂,需要对其深入进行研究。

4.2.4 小波分解/重构级数

小波分解/重构级数的级数要根据具体的情况而定,并不是分解/重构级数越高越好,虽然这样对编码有好处,但是级数越高会使得小波变换中的滤波器增多,对信号造成一定的影响。而且分解/重构级数越高,也会对信号的边界延拓造成严重的失真。4.3 小波变换实现图像压缩的步骤

基于小波变换的图像压缩编码的一般步骤是:先对二维图像进行多级离散小波分解,将原图像分解成低频分量和分别对应不同方向(水平、垂直、对角线)的高频分量;再对所得到的高、低频分量分别作不同策略的量化与量化数据的编码处理[34],如图4.1所示。

图4.1 小波变换压缩编码示意图

4.4 本文采用的量化编码方法

文章中对小波变换后的图像进行压缩时可以选择两种编码压缩方法:只区分不重要、正重要、负重要小波系数的逐次量化编码法和只区分不重要、重要小波系数的一次量化编码法。

第18 页共38 页

中北大学2013届毕业论文

4.4.1 逐次量化编码

对于逐次量化编码法来说,该方法在扫描小波高频分量的系数时只区分正重要系数POS、负重要系数NEG和不重要系数NMP,用逐次扫描之后的编码长度代替扫描结束码。对于几不重要系数首先记录其游程长度,然后对其游程长度进行霍夫曼编码。对J几正重要系数和负重要系数两个符号,可以给这两个符号分配一个比特的码字;小波低频分量LL的系数采用结合霍夫曼编码的二维DPCM预测编码[35]。总的编码步骤可以分为下面四步:

1)进行高频小波系数扫描,绝对值小于阈值T的为不重要系数NMP并记录其游程长度,大于闭值T的正数为正重要系数POS,大于闭值T的负数为负重要系数NEG}逐次扫描完成后用特定符号标示,然后对初始闭值进行修改继续进行本次操作直到初始值T 减小到所给定的预定值[36]。

2)对不重要系数的游程长度进行霍夫曼编码,然后对正重要系数和负重要系数两个符号进行编码。

3)算出POS } NEG和NMP的编码总长度,将其一记录到这次扫描编码的开头,代替END,然后返回第二步,进行下一次扫描的编码。

4)对小波低频分量采取结合霍夫曼编码的二维DPCM预测编码。

4.4.2 一次量化编码

在描述一次量化编码方法之前,对利用人眼视觉特性进行量化的方法作一个简单的介绍。

利用人眼视觉特性进行量化的方法是基于人眼视觉系统对不同频带、不同方向和不同背景亮度下的噪声敏感程度不一样的特性来进行量化的。由于人眼观察图像存在可见度阈值,因此只要量化误差控制在可见度阈值范围内,就不会影响视觉感受。由人眼的空间频率特性可知,人眼对平滑区的亮度变化敏感,而对边缘区的亮度变化相对不敏感,因此在对低频系数量化时,量化级数大一些,对高频系数进行量化时,量化级数小一些。

对一于压缩时采用的只区分不重要、重要小波系数的一次量化编码法来说,其编码步骤可以分为以下四步[37]:

1)相对于逐次逼近量化而言,一次量化就显得比较简单。首先将小于给定初始值的小波系数当作不重要系数零值处理,剩下的小波系数即为大于初始值的重要系数。

2)对量化后的小波系数进行记录,不重要系数的实际值量化为零值后不作考虑,

第19 页共38 页

中北大学2013届毕业论文

记录游程长度,重要系数记录量化后的实际值。

3)对不重要系数的游程长度和重要系数的值分别进行霍夫曼编码,由于只对小波系数扫描一次,所以不需要记录每次扫描的编码比特数。

4)对小波低频分量进行结合霍夫曼编码的二维DPCM预测编码。

图4.2是采用一次量化编码方法所形成的比特流的方框图。

图4.2一次量化编码示意图

4.5 小波图像解码

图像的解码过程是相对于图像的编码过程而一言,图像编码之后,为了某种需要,我们必须将编码后的图像通过某种技术手段还原出来,观察还原之后的图像与原始图像之间的差别。图像解码过程实际上就是将编码过程颠倒过来。由于嵌入式零树编码具有极高的压缩率,所以图像的解码过程便是要十分准确地将原始图像恢复出来[38]。

EZW编码可以是有损编码,也可以实现无损编码。因为在设计编码器的时候将全部的编码数据流均输出了,所以解码器端的设计关系着图像压缩质量的好坏。压缩图像的质量可以通过PSNR(峰值信噪比)来描述。

4.5.1 小波解码

小波解码过程,和编码过程一样,都需要经历主扫描过程和从属扫描过程。主扫描过程的功能是得到主编码过程中的数据,并将这些数据进行重新扫描构成小波系数。为了能够很好的还原编码后的图像,对小波系数扫描所运用的方法也必须和编码过程中扫描小波系数的方法保持一致,将扫描过程中获得的正重要系数和负重要系数从主编码列表中放入从属编码列表中。对放入从属列表中的小波系数分配一个比特,并对这些系数与初始闭值相比较,如果达到给定的初始值则扫描停止[39],否则将继续进行系数扫描直到系数满足设定的初始值即可。

图4-13说明了EZW的解码流程,可以观察得到解码过程与编码过程是互为可逆的。此外,在解码器端可以实现解码图像的质量控制,即可以控制有效解码比特的数量。如果解码出来的图像和原图像的大小相同,那么就实现了无损压缩解码;若解码后图像大小不一样,则是有损压缩[40]。

第20 页共38 页

中北大学2013届毕业论文

4.6 matlab仿真结果图

图4.3 小波变换仿真结果图1

图4.4 小波变换仿真结果图2

第21 页共38 页

本文来源:https://www.bwwdw.com/article/69yq.html

Top