多媒体技术原理及应用(第二版马华东)

更新时间:2023-10-19 21:23:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

·简答题 1.什么是媒体?

信息的载体。可以分为视觉类媒体,听觉类媒体, 触觉类媒体,活动媒体,抽象事实媒体。

2.什么是多媒体信息?

·文本

·图形和图像 ·音频 ·动画和视频

3.什么是多媒体技术?

利用计算机技术把文本、图像、图形、动画、音频及视频等多种媒体综合一体化,使之建立起逻辑上的联系,并能够对它们获取,编码,编辑,处理,存储,传输和再现。

4.它有什么特点?

·多样性:信息媒体的多样性,即能综合处理文本、图形、图像、动画、音频及视频等多种信息。

·交互性:指用户可以与计算机的多种信息媒体进行交互操作,从而为用户提供更加有效地控制和使用信息的手段。

·集成性: 集成性是指以计算机为中心综合处理多种媒体,它包括信息媒体的集成和这些媒体设备的集成。

·实时性:多媒体系统对声音和视频等时基媒体提供实时处理的能力。

第五章思考练习题——参考答案

1.自适应脉冲编码调制(APCM)和差分脉冲编码调制(DPCM)的基本思想是什么?

答:APCM:根据输入信号幅度大小改变量化阶大小的一种波形编码技术。 DPCM:对预测的样本值与原始的样本值之间的差值进行编码。

2.对信源

X=[x1=0.25,x2=0.25,x3=0.2,x4=0.15,x5=0.10,x6=0.05]进行Huffman编码

答:

(1) 将信源符号按概率递减顺序排列 ;

(2) 把两个最小的概率加起来 , 作为新符号的概率 ; (3) 重复步骤 (1) 、 (2), 直到概率和达到 1 为止 ; (4) 在每次合并消息时,将被合并的消息赋以1和0或0和1; (5) 寻找从每个信源符号到概率为1处的路径,记录下路径上的1和0; (6) 对每个符号写出\、\序列(从码数的根到终节点)。

3.已知信源X=[x1=1/4,x2=3/4],若x1=1,x2=0,试对1011进行算术编码。

答:

由题意知:编码的数据串为 x1x2x1x1。令 high 为编码间隔的高端 ,low 为编码间隔的低端 , range 为编码间隔的长度 ,rangelow 为编码字符分配的间隔低端 ,rangehigh 为编码字符分配的间隔高端。则得出范围:

字符 x1 x2 概率 1/4 3/4 范围 [0,1/4) [1/4,1) 初始 high=1,low=0,range=high-low=1, 一个字符编码后新的 low 和 high 按下式计算 : ·low =low+range × rangelow ·high =low+range×rangehigh (1) 在第一个字符 x1被编码时,range=1 ,x1 的 rangelow=0,rangehigh=1/4, 因此 : low=0 + 1 × 0 = 0 high=0 + 1 × 1/4 =1/4 range=high-low=1/4-0=1/4 此时分配给 x1 的范围为 [0,1/4] 。 (2)第二个字符 x2编码时使用新生成范围 [0,1/4],range=1/4,x2 的 rangelow=1/4, rangehigh=1, 因此: low=0 十 1/4×1/4=1/16 high=0 + 1/4×1=1/4 range=3/16 范围变成 [1/16,1/4] 。 (3) 对下一个字符 x1编号,x1 的 rangelow=0,,rangehigh=1/4, 则: low=1/16 + 3/16×0=1/16 high=1/16 + 3/16×1/4=7/64 range=3/64 范围变成 [1/16,7/64] (3) 对最后一个字符 x1编号,x1的 rangelow=0,,rangehigh=1/4, 则: low=1/16 + 3/64×0=1/16 high=1/16 + 3/64×1/4=19/256 范围变成 [1/16,19/256] 即用[1/16,19/256] 表示数据1011。 4.简述JEPG算法的主要计算步骤,并详细说明每个步骤。

答:JPEG算法 的基本思想:

a. 分块:按序分块,将图像分成 8 * 8 的子块。

b. DCT变换(离散余弦变换):对每一个子块,进行DCT变换,得到DCT系数矩阵。DCT变换,即离散余弦变化。DCT(x,y)= f(像素(x,y))。为了压缩RGB彩色图像,这项工作必须进行3遍,因为JPEG分别处理每个颜色成分。

c. 量化:量化说起来很简单,是一种降低整数精度的过程,因此就减少了存储整数所需的位数。量化的过程:试图确定什么信息可以安全地消去,而没有任何明显的视觉保真度损失。DCT系数矩阵被量化以减少系数的精度,因此提高了压缩率。 d. 对量化后的值进行Z扫描:

量化后的矩阵,右下角的部分接近0,把这个矩阵中的值重新排列游程,可以使游程中0值的长度增加,以此进一步提高压缩率。JPEG提出用之字形序列的方法为量化后的DCT系数排序。 e. Huffman算法或算术编码: 对扫描后的数列进行Huffman编码。

算术编码:对于算术编码,JPEG没有要求编码表。当它对图像编码时,它能随图像的统计特性进行调整。对量化后的系数矩阵,矩阵(0,0)位置上的系数称为DC系数,矩阵中其他63个系数称为AC系数。DC系数与AC系数分别进行压缩。

DC系数编码:在DC系数被压缩之前,首先处理DC预测。 差分DC系数= DCx-DCx-1

AC系数编码:游程或长度 , 值。

5.游程编码的思想和方法

答:游程编码(简写为RLE或RLC)是一种十分简单的压缩方法 ,它将数据流中连续出现的字符 ( 称为游程 ) 用单一的记号来表示。例如,字符串

a b a C CC b b a aaa 可以压缩为 a b a 3c 2b 4a

6,MPEG-Video图像压缩技术的依据是什么?MPEG采用了哪三种运动图像类型?简述它们之间的关系和含义。

答:MPEG-Video图像压缩技术的依据:因为数据存在冗余,包括: ·空间冗余:空间上占据位置,但不载有有效信息;

·时间冗余:动态媒体信息,视频,音频等和时间相关的媒体信息,不同时刻的信息内容相同或相似; ·编码冗余:不合理的编码。 ·结构冗余:如对称的内容; MPEG采用了哪三种运动图像类型:

·I帧:(Intra pictures )帧内图:不用以任何图片为参考就可以对这种类型的帧编码。帧内图片可以放在序列中的任何位置,并可用于对序列的随机访问。帧内图片由于是独立编码的,所以它的压缩率相对来说要小一些。

预测图片:预测图片分为两种,单向预测图片和双向预测图片。预测图片的编码要参考以前的图片,被参考的图片可以是帧内图片也可以是单向预测图片。双向预测图片永远也不能作为参考图片。我们通常把帧内图片和单向预测图片称为锚图片。

·P帧:(Predicted Pictures):称为单向预测图片。对某一个P帧进行编码时,在它之前(可以是相邻的也可以不相邻)的帧内图片或单向预测图片就作为参考,P帧就被对照着参考图片进行编码,提高P帧压缩率的方法我们B帧:(Bi_directional Predicted Picures)称为运动补偿。 ·B帧:(Bi_directional Predicted Picures):双向预测图片。被放在锚图片之间。双向预测图片通过对前面和后面的锚图片的运动补偿方法来编码。它可以使用3种运动补偿技术:正向运动补偿,反向运动补偿和内插补偿。正向运动补偿使用前面锚图片的信息,反向运动补偿使用为了锚图片的信息。内插补偿使用过去和将来锚图片信息的平均。

本文来源:https://www.bwwdw.com/article/mawf.html

Top