分布式视频编码技术研究进展

更新时间:2023-05-24 03:26:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

信息论与编码有关实验

5502010,31(3)计算机工程与设计ComputerEngineeringandDesign

多媒体技术

0引言

随着诸如数字电视、DVD、网络视频通信等视频应用的飞速发展,视频压缩编码的研究取得了重大进展,出现了以ITU-T和MPEG系列标准为代表的先进的视频压缩编解码框架。这一类编解码框架可以实现高效的视频压缩主要是基于两方面的技术:一方面是通过基于宏块的混合变换算法以去除视频序列的空间冗余度;另一方面是通过先进的运动估计运动补偿算法来进行帧间预测编码以去除视频序列的时间冗余度。在这类编解码框架中编码器承担了包括变换、量化、熵编码以及运动补偿和运动估计等大量的计算,这就使得编码端复杂度远高于解码器。这种编解码复杂度的不对称使其适用于具有一对多拓扑结构的视频应用系统,这类系统一般需要一次编码多次解码,例如广播、VOD流媒体点播等。然而近几年来出现的无线摄像头、移动可视电话、无线视频监控等新的视频应用,通常需要视频采集终端体积小、重量轻、采用电池供电同时生产成本也要尽可能低。这些限制使得编码终

收稿日期:2009-02-18;修订日期:2009-04-02。

端仅能具有有限的处理能力而不可能过于复杂,因此在对视频压缩编码框架可提供较高的压缩性能的基础上又对其编码复杂度提出了新的要求。分布式视频编码框架的研究就是在这一背景下展开的。文献[1]专门对分布式视频编码的特点及最有潜力的应用场景进行了研究,该文将分布式视频编码的优点归纳为以下4点:复杂度可在编解码端灵活分配、容错性能优良、编码器可独立进行不同层级的可伸缩编码以及便于利用多视角视频的相关性。基于这些特点该文分析指出的分布式视频编码最有潜力的4个应用场景分别是:分布式视频流和网络型便携摄像机、无线低功耗视频监控系统、无线视频摄像机、可视传感器网络。

分布式视频编码是分布式信源编码技术在视频编码领域的应用,其理论基础是Slepian和Wolf建立的分布式无损编码理论[2]以及Wyner和Ziv建立的使用解码端辅助信息的有损编码理论[3]。分布式视频编码框架可以使算法复杂度灵活的在编码端和解码端进行分配并且对信道衰落有强的鲁棒性。Slepian-Wolf和Wyner-Ziv理论在分布式视频编解码框架的研

信息论与编码有关实验

王尊亮,李学俊:分布式视频编码技术研究进展

究开始于2002年,文献[4-5]曾对当时的分布式视频编解码算法进行了系统的总结。但近几年来随着研究的深入对分布式视频编解码算法认识也更全面深刻,并在不少环节取得了新的进展。本文将在简要介绍分布式视频编码基本原理的基础上,对目前主流的分布式视频编解码框架进行阐述,并重点分析影响分布式视频编码性能的几个关键问题及研究现状,最后对分布式视频编解码的其它应用进行介绍及展望。

1分布式视频编码基本原理

本节简要介绍分布式视频编码的理论基础Slepian-Wolf

理论和Wyner-Ziv理论,更详细的论述请参见文献[2-4]。Slepian-Wolf理论可简单描述如下:考虑两个统计相关的i.i.d(独立同分分布)随机序列X、Y。假设要利用Y做参考信息来对X进行无损编码,如果在编码端和解码端都可以得到参考信息Y,即采用联合编码联合译码时,根据香农信息论可知对X无损编码所能达到的最小理论编码速率为已知Y的情况下X

的条件熵

,

2010,31(3)551

信息论与编码有关实验

5522010,31(3)计算机工程与设计ComputerEngineeringandDesign

率来达到高的压缩性能,但是在某些应用场景是不可能建立反馈信道的,这是上述方案的一个缺点。Ramchandran在文献[10-11]中提出了不需要反馈信道的分布式视频编码方案PRIS-M,该方案基本思想是首先在编码端按照WZ帧与关键帧对应宏块之间的相关性的强弱进行分类,按照预先设定好的参数来确定每类宏块需要传输的比特数,然后再在解码端联合解码。该方案虽然不需要反馈信道进行编码率控制,但相应的就存在对于每一类的WZ编码宏块都有一个固定长度的输出比特,故而某种程度上影响了编码压缩效率。由欧盟委员会信息社会技术第6框架计划(ISTFP6)资助的研究组在文献[12]中提出了一个更细化的编解码框架。该框架基于BerndGirod的带反馈信道的方案,在和图1所示的框图相似的主要流程基础上,采用了增强的参考帧宏块生成、在线自适应参数学习等技术进一步提高了系统性能。实验结果显示该系统的率失真性能比H.263+只参用帧内编码时高约2dB,但和H.263+参用运动补偿的帧间编码的性能相比尚有较大距离[12]

3分布式视频编码关键问题

目前的分布式视频编码框架基本上遵循图1所示的结构。

在这一结构中有几个环节影响着分布式视频编解码的性能,是分布式视频编码技术研究的关键点。本节依次说明这些关键点各自起到的作用和目前的研究进展。

3.1高效的Wyner-Ziv编解码器

Slepian-Wolf编码理论及其在有损编码上的扩展Wyner-

Ziv编码理论是分布式视频编码的理论基础,故一个性能优良的Wyner-Ziv编解码器对分布式视频编解码的实现至关重要。虽然Slepian-Wolf及Wyner-Ziv理论仅是给出了理论上的编码极限并没有指出达到编码极限的方法,但Wyner在文献[13]中指出了分布式编码和信道编码存在着密切的关系。分布式编码涉及的两个相关信源之一可以被认为是由另一个信源在经过一个虚拟的“相关信道”的传输后产生的,所以目前主要的分布式信源编码技术都是发源自信道编码的思想。1999年Pardhan和Ramchandran在文献[14]中提出了基于栅格构造的名为DISCUS的分布式信源编码算法,其后基于性能更优良的信道编码技术Turbo码、LDPC码、IRA码、Raptor码的分布式信源编码方法也依次被提出

[15-18]

。随着采用的信道编码方法

可以逼近虚拟的“相关信道”的信道容量,分布式信源编码的压缩效率也可逐渐逼近Wyner-Ziv限。

以上文献方法集中在解决对相关的二进制信源的分布式编码问题,而在实际应用场景中存在更广泛的是相关多进制信源。如在分布式视频编码框架中,WZ帧和辅助边信息帧无论是在像素域还是在采用离散余弦变换、整数变换、小波变换等之后的变换系数都是相关的多进制信源。对于此类情况最初的解决方法主要集中于先通过采用如标准的二进制表达式、格雷码或者其它类似方法将多进制信源的采样点转换成二进制,然后再使用前面提到的方法进行分布式编码。但是这类方法效率并不是很高,因为从多进制到二进制的转换过程导

致了信源相关性的弱化。文献[19]提出了基于多进制LDPC码的方案对高斯相关的非二进制信源进行分布式信源编码,实验结果表明该方法在对相关多进制信源进行分布式编码时

优于传统的基于二进制的方法。

在分布式视频编码框架中,随着视频内容的不同视频帧之间的相关性是时变的。例如对于新闻谈话类的视频节目,由于视频内容运动较慢,视频帧之间的相关性就会比较强,也就意味着可以压缩到一个较小的码率。而对于足球比赛、动作影片等运动较快的视频节目,视频帧之间的相关性就会较弱,同样条件下压缩得到的码率会大于运动较慢的场景。因此为了和视频帧之间这种时变的相关性相匹配,就必然要求核心的Wyner-Ziv编码能提供灵活可变的编码速率,而不是采用一个恒定速率的编码器或者必须同时用多套编码器进行编码。文献[20-21]中分别采用打孔的Turbo码和打孔的LDPC码来实现了这一要求。但是文献[22]中D.Varodayan指出LDPC码在经过一定程度的打孔之后性能会变的很差,因为打孔之后LDPC的Tanner图会出现无连接或者单连接的结点。D.Va-rodayan提出了一种新的性能不会下降的构造基于LDPC的分布式信源编码方法,称之为累积的LDPC码。在此基础上文献[23]提出了基于多进制累积LDPC码的方案,来对相关性不平稳的相关非二进制信源进行可变速率的分布式信源编码。

3.2准确的辅助边信息

辅助边信息是指在解码端用来和WZ帧编码信息联合解

码的信息。如上一节所述,在分布式视频编码框架中,对于视频帧间相关性的利用由编码端转移到了解码端,故而对当前帧和其参考帧之间的运动估计也只能在解码端进行。这就必然造成某些情况下特别是运动剧烈的视频区域会出现运动矢量估计不准确的现象,这一弱点影响了分布式视频编码性能的进一步提升。只有当建立的辅助边信息和编码的WZ数据距离最小,也即两者之间的虚拟“相关信道”的“噪声”最小时,重建WZ帧所需要的校验信息最少,也就是说可以获得更高的压缩比,因此如何生成更准确的辅助边信息也是影响分布式视频编码整体性能的一个重要环节。辅助边信息类似于在传统预测编码体系中的对预测帧宏块通过运动估计在其相邻的参考帧中找到的参考宏块。但由于辅助边信息只能在解码端生成,因此其不同于在预测编码中可以通过整像素运动估计甚至半像素、1/4像素运动估计,在单个参考帧甚至多个参考帧中搜索和当前宏块距离最小最匹配的宏块使残差值最小。生成辅助边信息时可以利用的只有一系列独立解码的关键帧以及已解码的WZ帧。A.Aaron等在文献[7]中采用了基于运动一致性假设的插值方法(MC-I),由前后已解码的关键帧来构造辅助边信息帧。之后文献[24]采用新的插值策略和包括双向运动估计等多个估计模式对这种方法进行了改进进一步提高了性能,但这种方法在帧的运动剧烈区域会造成宏块的互相遮盖和宏块连接处的不连续,文献[25]采用通过前向和后向外推的方法构造多个参考宏块来解决这一问题。在文献[26]中作者通过提取WZ帧的特征点并作为附加信息传输到解码端,从而在对某些便于建立3-D模型的特殊应用场合,如移动摄像机拍摄静态场景等,对未对准区域进行校正,该方法显著提高了生成的辅助边信息帧的准确性。此外为了解码端可以找到更好的辅助边信息,也可由编码器提供更多的额外辅助信息,文献[10,27]就是基于这一思想,分别通过在编码端对WZ帧采用CRC及hash码等手段提取校验信息,进而传送到解码

信息论与编码有关实验

王尊亮,李学俊:分布式视频编码技术研究进展

端来辅助选择更准确的边信息。

2010,31(3)553

selectingthemostpromisingapplicationscenarios[J].ElsevierJournalSignalProcessing:ImageCommunication,2008,23(1):339-352.[2]

SlepianJD,WolfJK.Noiselesscodingofcorrelatedinformationsources[J].IEEETransactionsonInformationTheory,1973,19:471-480.[3]

WynerAD,ZivJ.Therate-distortionfunctionforsourcecodingwithsideinformationatthedecoder[J].IEEETransactionsonInformationTheory,1975,22(1):1-10.[4]

GirodB,AaronA,RaneS,etal.Distributedvideocoding[J].Pro-ceedingsoftheIEEE(SpecialIssueonAdvancesinVideoCo-dingandDelivery),2005,93(1):71-83.[5][6]

房胜,钟玉琢.分布式视频编解码技术的研究进展[J].计算机工程与应用,2005,41(21):45-48.

AaronA,RaneS,ZhangR,etal.Wyner-Zivcodingforvideo:ap-plicationstocompressionanderrorresilience[C].ProceedingsoftheIEEEDataCompressionConference.Snowbird,UT,USA:IEEEComputerSocietyPress,2003:93-102.[7]

AaronA,SettonE,GirodB.TowardpracticalWyner-Zivcodingofvideo[C].ProceedingsoftheIEEEInternationalConferenceonImageProcessing.Barcelona,Spain:IEEEComputerSocietyPress,2003:869-972.[8]

AaronA,RaneS,SettonE,etal.Transform-domainWyner-Zivcodecforvideo[C].ProceedingsofSPIEVisualCommunicationsandImageProcessing.SanJose,CA:IEEEPress,2004:520-528.[9]

WuB,JiXY,ZhaoDB,etal.Waveletbaseddistributedvideocodingwithspatialscalability[C].IEEEInternationalSympo-siumonCircuitsandSystems.Seattle,Washington,USA:IEEEPress,2008:3458-3461.

[10]PuritR,RamchandranK.PRISM:Anewrobustvideocoding

architecturebasedondistributedcompressionprinciples[C].Allerton,IL:ProceedingsofAllertonConferenceonCommuni-cation,Control,Computation,2002.

[11]PuritR,RamchandranK.PRISM:A“reversed”multimediaco-dingparadigm[C].ProceedingsoftheIEEEInternationalConfe-renceonImageProcessing.Barcelona,Spain:IEEEPress,2003:617-620.

[12]ArtigasX,AscensoJ,DalaiM,etal.Thediscovercodec:architec-ture,techniquesandevaluation[C].Lisbon,Portugal:PictureCodingSymposium,2007.

[13]WynerAD.RecentresultsintheShannontheory[J].IEEETran-sactionsonInformationTheory,1974,20(1):2-10.

[14]PradhanSS,RamchandranK.Distributedsourcecodingusing

syndromes(DISCUS):designandconstruction[C].ProceedingsoftheIEEEDataCompressionConference.Snowbird,UT,USA:IEEEComputerSocietyPress,1999:158-167.

[15]AaronA,pressionwithsideinformationusing

turbocodes[C].ProceedingsoftheIEEEDataCompressionCon-ference.Snowbird,UT,USA:IEEEComputerSocietyPress,2002:

3.3准确的虚拟“相关信道”模型

如前所述边信息是通过对已解码帧进行时间预测所得到

的,它与待编码的WZ帧之间的相关性就可以被认为是一个虚拟的“相关信道”。而分布式视频编码的理论基础Slepian-Wolf编码理论及Wyner-Ziv编码理论给出的分布式编码性能极限是建立在信源间统计特性是完全准确可知的基础上的。因此在分布式视频编码框架中,准确的估计WZ帧与辅助边信息之间的统计特性,也即对它们之间的虚拟“相关信道”准确设计模型并估计其参数对于提高编码压缩效率进而准确进行码率控制十分重要。在早期的研究

[28]

中采用了加性高斯

白噪声信道作为这一虚拟“相关信道”的模型,而进一步的实验表明,待编码的WZ帧数据与辅助边信息数据的残差的分布和高斯白噪声的概率密度函数相比更接近于拉普拉斯分布,文献[29]即采用了式(2)所表示的拉普拉斯分布模型来描述残差数据分布,也就是所谓的虚拟“相关信道”。式(2)中的拉普拉斯系数据的方差。

=

(2)

2

为残差数

之后的研究主要以两大改进方向为主:一方面是采用更复杂的模型来更精确的描述虚拟“相关信道”,文献[30]即提出了一种拉普拉斯分布与均匀分布相混合的模型来描述虚拟“相关信道”取得了较好的效果;另一方面是采用在线更新模型参数的方式更精确的描述虚拟“相关信道”,文献[12]即采用了在解码端即时估计视频帧间相关性的变化,动态改变虚拟“相关信道”的模型参数使其更接近于真实情况,从而提高了分布式视频编码的效率。

4结束语

目前分布式视频编码的编码效率仍与传统的视频压缩编

码存在不小的差距,其主要原因可归纳为如上文所述的3个关键点的性能都有待提高。而其中对编码性能影响最大的应该是如何在解码端生成最佳的辅助边信息与如何对虚拟“相关信道”建立准确的模型并估计其参数。尽管目前性能仍不理想,但分布式视频编码所具有的编码复杂度低、容错性能好等特点仍使其具有众多的潜在应用,值得继续进行研究。在视频编码领域,除本文所述的利用其编码复杂度低这一特点的应用方式以外还有多种应用。由于分布式视频编码本质上来说属于信源信道联合编码技术,因此它对信道传输噪声有着内在的鲁棒性,故它可以解决传统视频编码后输出码流抗噪声能力差的问题,文献[31]即提出了利用分布式编码对传统视频编码方式增强抗误差能力的方案。此外由于分布式编码可便捷地实现在不同相关性强弱程度下切换码率,故可方便的实现基于分布式编码的可分级视频编码方案[32]。除上述应用外,分布式视频编码还可应用于近年来兴起的多视角视频编码等场合。

[33]

参考文献:

[1]

PereiraF,TorresL,GuillemotC,etal.Distributedvideocoding:

信息论与编码有关实验

5542010,31(3)

计算机工程与设计ComputerEngineeringandDesign

252-261.

[16]LiverisA,XiongZX,pressionofbinary

sourceswithsideinformationatthedecoderusingLDPCcodes[J].IEEECommunicationLetters,2002,6(10):440-442.[17]LiverisA,XiongZX,GeorghiadesC.Jointsource-channelco-dingofbinarysourceswithsideinformationatthedecoderusingIRAcodes[C].St.Thomas,US:MultimediaSignalProcessingWorkshop,2002.

[18]FresiaM,VandendorpeL,PoorHV.Distributedsourcecoding

usingraptorcodesforhiddenMarkovsources[C].ProceedingsoftheIEEEDataCompressionConference.Snowbird,UT,USA:IEEEComputerSocietyPress,2008:517.

[19]WangZL,LiXM,ZhaoM.DistributedcodingofGaussiancor-relatedsourcesusingnon-binaryLDPC[C].ProceedingsoftheIEEEInternationalCongressonImageandSignalProcessing.Sanya,China:IEEEComputerSocietyPress,2008:214-218.[20]RowitchDN,MilsteinLB.OntheperformanceofhybridFEC/

ARQsystemsusingratecompatiblepuncturedturbo(RCPT)codes[J].IEEETransactionsonCommunication,2000,48(6):948-959.

[21]PISHROHN,FEKRIF.ResultsonpuncturedLDPCcodes[C].

SanAntonio,TX:IEEEInformTheoryWorkshop,2004.[22]VarodayanD,AaronA,GirodB.Rate-adaptivedistributedsource

codingusinglow-densityparity-checkcodes[J].EURASIPSig-nalProcessingJournal,SpecialIssueonDistributedSourceCo-ding,2006,86:3123-3130.

[23]WangZL,LiXM,LiJ.Q-LDPCAbaseddistributedcodingfor

asymmetricalcorrelatednon-binarysources[C].Proceedingsofthe9thInternationalConferenceonSignalProcessing.Beijing,China:IEEEComputerSocietyPress,2008:1842-1845.[24]WEIL,ZHAOY,WANGAH.Improvedside-informationindis-tributedvideocoding[C].ProceedingsoftheFirstInternationalConferenceonInnovationComputing,InformationandControl.Beijing,China:IEEEComputerSocietyPress,2006.

(上接第513页)

4结束语

叙述了存储管理设计的细节。为了减少映射表对SRAM

的占用,研究并实现了区域映射技术,使得设计的存储管理可以兼容任何容量的NANDFlash,并实现了连续写技术,极大地提高了写操作的性能。

本文设计的存储管理,把物理块按区域划分,各个区域是绝对隔离的,这就导致了各个区域之间无法做到擦写均衡,只能保证同一区域里的擦写均衡,下一步,将各个区域的边界设置成动态可变的,从而保证整个器件达到擦写均衡,最大限度地延长闪存的寿命。

参考文献:

[1]

刘洲洲,张捷.基于嵌入式系统的NANDFlash坏块处理和

[25]MisraKM,KarandeS,RadhaH.Multi-hypothesisbaseddistri-butedvideocodingusingLDPCcodes[C].ProceedingsoftheAllertonConferenceonCommunication,Control,andCompu-ting.Monticello,Illinois:CurranAssociatesPress,2005.[26]MaitreM,GuillemotC,MorinL.3-Dmodel-basedframeinter-polationfordistributedvideocodingofstaticscenes[J].IEEETransactionsonImageProcessing,2007,16(5):1246-1257.[27]AaronA,RaneS,GirodB.Wyner-Zivvideocodingwithhash-basedmotion-compensationatthereceiver[C].ProceedingsoftheIEEEInternationalConferenceonImageProcessing.Singa-pore:IEEEComputerSocietyPress,2004:3097-3100.

[28]IshwarP,PrabhakaranV,RamchandranK.Towardsatheoryfor

videocodingusingdistributedcompressionprinciples[C].Pro-ceedingsoftheIEEEInternationalConferenceonImagePro-cessing.Barcelona,Spain:IEEEComputerSocietyPress,2003:687-690.

[29]AscensoJ,BritesC,PereiraF.Motioncompensatedrefinement

forlowcomplexitypixelbaseddistributedvideocoding[C]o,Italy:IEEEPress,2005:593-598.

[30]WesterlakenaRP,GunnewiekRK,LagendijkaRL.Theroleof

thevirtualchannelindistributedsourcecodingofvideo[C].Pro-ceedingsoftheIEEEInternationalConferenceonImagePro-cessing.Genova,Italy:IEEEComputerSocietyPress,2005:581-584.

[31]SehgalA,JagmohanA,AhujaN.Wyner-Zivcodingofvideo:an

errorresilientcompressionframework[J].IEEETransactionsonMultimedia,2004,6(2):249-258.

[32]XuQ,yeredWyner-Zivvideocoding[J].IEEETran-sactionsonImageProcessing,2006,15(2):3791-3802.

[33]GUOX,LUY.Wyner-Ziv-Basedmultiviewvideocoding[J].

IEEETransactionsonCircuitsandSystemsforVideoTechno-logy,2008,18(6):713-724.

FMM实现[J].计算机技术与应用,2006,26(6):42-44.[2]沈建华,罗悦怿.Flash文件系统的研究与设计[J].计算机应用研究,2004,21(12):246-248.

[3]张雷.基于闪存的嵌入式文件系统的研究与实现[D].成都:电子科技大学,2004:19-21.

[4]阎航.Flash存储卡文件系统的研究[D].北京:北京交通大学,2006:5-7.

[5]余婷婷.嵌入式文件系统的研究与设计[D].武汉:武汉理工大学,2007:12-19.

[6]成巍.嵌入式文件系统的设计与实现[D].成都:电子科技大学,2006:2-3.

[7]姚紫阳.嵌入式文件系统的研究[D].无锡:江南大学,2005.[8]

熊光晖.嵌入式文件系统的设计与实现[D].成都:电子科技大学,2003:4-5.

本文来源:https://www.bwwdw.com/article/e3f4.html

Top