第08讲语音编码(参数编码+混合编码)

更新时间：2023-09-04 02:57:01 阅读量：教育文库文档下载

说明：文章内容仅供预览，部分内容可能不全。下载后的文档，内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的，是否完整无缺。

第08讲补气剂推荐度：
相关推荐

语音信号处理

§7.3.5 自适应变换编码(ATC)自适应变换编码利用正交变换将信号由时域变换到另外一个域，使变换域系数密集化，从而使信号相

邻样本间冗余度得到降低。对此变换域系数进行量化编码，可以降低数码率。

语音信号处理

1. 自适应变换编码的具体方法：按短时平稳的原则对语音信号分帧每帧语音信号由正交矩阵A进行变换，对变换值

进行编码和传输在接收端由反变换A-1来恢复原来语音。同时使变换域系数的量化字长自适应于每帧语

音信号的短时统计特性，这就是自适应变换编码。

语音信号处理

设一帧语音信号s(n),0 n N 1 帧长为N,可以形成一个矢量X s 0 , s 1 , , s N 1 Y AXT

该矢量通过一个正交变换矩阵A,作一个线性变换式中正交变换矩阵A满足A-1=AT,Y中的元素就是变换域系数，它们被量化后形成矢量，在接收端通过逆变换重 Y 构出信号矢量 X X A 1Y AT Y

自适应变换编码的任务就是设计一个最佳量化器去量化Y 中的各个元素，使得重构的语音失真最小；或者说，使

信号量化信噪比最大。可以证明，ATC的增益是变换域系数方差的算术平均与其几何平均值比

语音信号处理

I ATC

1 N 1 2 i N i 0

i2 i 0

N 1

1 N

这个值反映了变换域系数的能量集中程度，当变换域系数方差均相等，即能量均匀分布时， I ATC 1 即相对于PCM没有信噪比增益。一般说来，合适的正交变换使变换域系数能量集中分布，所以其几何平均值总是小于

算术平均值，即IATC总是大于1的。因此变换编码必须选择一种合适的正交变换。 DFT、沃尔什-哈达马变换、离散余弦变换DCT、KLT变换。

目前，自适应变换编码的正交变换都是采用DCT。原因？

语音信号处理

2. 正交变换DCT基于DCT的种种优势，当今自适应变换编码的正交变换普遍采用 DCT。 ① DCT与KLT相比，频域变换明确，且与人的听觉频率分析机理相对应，较易控制量化噪声频率范围。 ② 兼顾性能与计算量。DTC提供的性能一般在KLT的1~2dB之内，其它变换则相当差。而KLT的计算量太大。 ③ DCT只需在每帧采用FFT运算即可，因此运算量小、数据量少，也不需要传输特征矢量。 ④ DCT统计地近似于长时间最佳正交变换和特征矢量，所以 DCT与DFT相比，变换效率高于DFT。 ⑤ DCT与DFT相比，在端点取出波形的影响较小，在频域区的畸变更小。

语音信号处理

N点DCT的正变换为：

(2n 1)k X c (k ) x(n)c(k ) cos[ ](0 k N 1) 2N n 0N 1

反变换为：

2n 1 k 1 N 1 x n X c k c k cos N k 0 2N 式中

1 c k 2

k 0 1 k N 1

可以证明，DCT与用N个零点填充矢量X而得到的2N点函数的 DFT有关。

语音信号处理

令

y (n) 为X的填充形式，

Y k y n Wn 0

N 1

式中,W e n 1 k

j / N

由于填零的原因，求和计算到N-1为止

Y k W

y n Wn 0

N 1

对实数y来说，和的实数部分为：

y n n 0

N 1

2n 1 k cos2Nk/2

最终可得X的DCT为：

X c (k ) c(k ) Re[W

Y (k )]

语音信号处理

分帧的语音信号

每一帧的语音信号DCT变换域系数划分为20个左右的频带，求各频带的平均功率，作为边带信息

用估计的频谱值代替方差，计算出各系数的码位分配

估计谱应能正确反映变换域系数的能量分布，所占的比特数要受到限制

语音信号处理

§ 7.4 语音信号的参数编码参数编码也称为模型编码。它是对语音信号建

立模型，然后对模型参数或是语音的特征参数进行编码，力图使重建语音信号在听觉上具有尽可能高的清晰度和可懂度。

语音信号处理

§7.4.1 线性预测声码器线性预测声码器：应用最成功的低速率参数语音编码器。线性预测分析器s(n)

信道编码器解码器

线性预测合成器

s(n)

音调检测器

LPC声码器框图

与利用线性预测的波形编码不同的是它的接收端不再利用残差，即不具体恢复输入语音的波形，而是直接利用预测系数等参数合成传输语音。 LPC有作为预测器和作为模型的双重作用。

语音信号处理

1. LPC参数的变换和量化

语音信号处理

2. 变帧率LPC声码器充分利用了语音信号在时域上的冗余度，尤其是元音和擦音在发音过程中都有缓变的区间，描述这部分区间的语音不必像一些快变语音那样用很多比特的信息量。语音信号是非平稳的时变信号，波形变化随时间而不同。 (清音至浊音的过渡段，语音特性变化剧烈，理论上应用较短的分析帧，要求LPC声码器至少每隔10ms就发送一帧新的 LPC参数；而对于浊音部分，在发音过程中有缓变的区间，语音信号的频谱特性变化很小，分析帧就可以取长些；在语音活动停顿情况下更是如此。) 因而可以采用变帧速率的编码技术来降低声码器的平均传输码率。

语音信号处理

实现思路：帧长可保持恒定，不必将每帧LPC参数都去编码和传送，合成部分所需的参数可以通过重复使用其前帧参数或内插的方法获得，可降低平均传码率。

关键问题：需要一种度量方法来确定当前帧参数和上一帧参数之间的差异(距离)。

语音信号处理

§7.4.2 LPC-10编码器

语音信号处理

本文来源：https://www.bwwdw.com/article/pqgi.html

相关文章：