第08讲 语音编码(参数编码+混合编码)

更新时间:2023-09-04 02:57:01 阅读量: 教育文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

语音信号处理

§7.3.5 自适应变换编码(ATC)自适应变换编码利用正交变换将信号由时域变换 到另外一个域,使变换域系数密集化,从而使信号相

邻样本间冗余度得到降低。对此变换域系数进行量化编码,可以降低数码率。

语音信号处理

1. 自适应变换编码的具体方法: 按短时平稳的原则对语音信号分帧 每帧语音信号由正交矩阵A进行变换,对变换值

进行编码和传输在接收端由反变换A-1来恢复原来语音。 同时使变换域系数的量化字长自适应于每帧语

音信号的短时统计特性,这就是自适应变换编码。

语音信号处理

设一帧语音信号s(n),0 n N 1 帧长为N,可以形成一个矢量X s 0 , s 1 , , s N 1 Y AXT

该矢量通过一个正交变换矩阵A,作一个线性变换 式中正交变换矩阵A满足A-1=AT,Y中的元素就是变换域系数, 它们被量化后形成矢量 ,在接收端通过逆变换重 Y 构出信号矢量 X X A 1Y AT Y

自适应变换编码的任务就是设计一个最佳量化器去量化Y 中的各个元素,使得重构的语音失真最小;或者说,使

信号量化信噪比最大。可以证明,ATC的增益是变换域 系数方差的算术平均与其几何平均值比

语音信号处理

I ATC

1 N 1 2 i N i 0

i2 i 0

N 1

1 N

这个值反映了变换域系数的能量集中程度,当变换域系数 方差均相等,即能量均匀分布时, I ATC 1 即相对于PCM没有信噪比增益。一般说来,合适的正交变换 使变换域系数能量集中分布,所以其几何平均值总是小于

算术平均值,即IATC总是大于1的。因此变换编码必须选择一种合适的正交变换。 DFT、沃尔什-哈达马变换、离散余弦变换DCT、KLT变换。

目前,自适应变换编码的正交变换都是采用DCT。原因?

语音信号处理

2. 正交变换DCT基于DCT的种种优势,当今自适应变换编码的正交变换普遍采用 DCT。 ① DCT与KLT相比,频域变换明确,且与人的听觉频率分析机 理相对应,较易控制量化噪声频率范围。 ② 兼顾性能与计算量。DTC提供的性能一般在KLT的1~2dB之 内,其它变换则相当差。而KLT的计算量太大。 ③ DCT只需在每帧采用FFT运算即可,因此运算量小、数据量 少,也不需要传输特征矢量。 ④ DCT统计地近似于长时间最佳正交变换和特征矢量,所以 DCT与DFT相比,变换效率高于DFT。 ⑤ DCT与DFT相比,在端点取出波形的影响较小,在频域区的 畸变更小。

语音信号处理

N点DCT的正变换为:

(2n 1)k X c (k ) x(n)c(k ) cos[ ](0 k N 1) 2N n 0N 1

反变换为:

2n 1 k 1 N 1 x n X c k c k cos N k 0 2N 式中

1 c k 2

k 0 1 k N 1

可以证明,DCT与用N个零点填充矢量X而得到的2N点函数的 DFT有关。

语音信号处理

y (n) 为X的填充形式,

Y k y n Wn 0

N 1

nk

式中,W e n 1 k

j / N

由于填零的原因,求和计算到N-1为止

Y k W

k

2

y n Wn 0

N 1

2

对实数y来说,和的实数部分为:

y n n 0

N 1

2n 1 k cos2Nk/2

最终可得X的DCT为:

X c (k ) c(k ) Re[W

Y (k )]

语音信号处理

分帧的语 音信号

每一帧的语音信 号DCT变换域系 数划分为20个左 右的频带,求各 频带的平均功率, 作为边带信息

用估计的频 谱值代替方 差,计算出 各系数的码 位分配

估计谱应能正 确反映变换域 系数的能量分 布,所占的比 特数要受到限 制

语音信号处理

§ 7.4 语音信号的参数编码参数编码也称为模型编码。它是对语音信号建

立模型,然后对模型参数或是语音的特征参数进行编码,力图使重建语音信号在听觉上具有尽可能高 的清晰度和可懂度。

语音信号处理

§7.4.1 线性预测声码器 线性预测声码器:应用最成功的低速率参数语音编码器。线性预测 分析器s(n)

信道编码器 解码器

线性预测 合成器

s(n)

音调 检测器

LPC声码器框图

与利用线性预测的波形编码不同的是它的接收端不再利用残 差,即不具体恢复输入语音的波形,而是直接利用预测系数 等参数合成传输语音。 LPC有作为预测器和作为模型的双重作用。

语音信号处理

1. LPC参数的变换和量化

语音信号处理

语音信号处理

2. 变帧率LPC声码器 充分利用了语音信号在时域上的冗余度,尤其是元音和擦音 在发音过程中都有缓变的区间,描述这部分区间的语音不必 像一些快变语音那样用很多比特的信息量。 语音信号是非平稳的时变信号,波形变化随时间而不同。 (清音至浊音的过渡段,语音特性变化剧烈,理论上应用较 短的分析帧,要求LPC声码器至少每隔10ms就发送一帧新的 LPC参数;而对于浊音部分,在发音过程中有缓变的区间, 语音信号的频谱特性变化很小,分析帧就可以取长些;在语 音活动停顿情况下更是如此。) 因而可以采用变帧速率的编码技术来降低声码器的平均传输 码率。

语音信号处理

实现思路:帧长可保持恒定,不必将每帧LPC参数都去编码和传送,合成部分所需的参数可以通过重复使用其前帧参 数或内插的方法获得,可降低平均传码率。

关键问题:需要一种度量方法来确定当前帧参数和上一帧参数之间的差异(距离)。

语音信号处理

§7.4.2 LPC-10编码器

语音信号处理

语音信号处理

语音信号处理

语音信号处理

本文来源:https://www.bwwdw.com/article/pqgi.html

Top