第08讲 语音编码(参数编码+混合编码)
更新时间:2023-09-04 02:57:01 阅读量: 教育文库 文档下载
- 第08讲补气剂推荐度:
- 相关推荐
语音信号处理
§7.3.5 自适应变换编码(ATC)自适应变换编码利用正交变换将信号由时域变换 到另外一个域,使变换域系数密集化,从而使信号相
邻样本间冗余度得到降低。对此变换域系数进行量化编码,可以降低数码率。
语音信号处理
1. 自适应变换编码的具体方法: 按短时平稳的原则对语音信号分帧 每帧语音信号由正交矩阵A进行变换,对变换值
进行编码和传输在接收端由反变换A-1来恢复原来语音。 同时使变换域系数的量化字长自适应于每帧语
音信号的短时统计特性,这就是自适应变换编码。
语音信号处理
设一帧语音信号s(n),0 n N 1 帧长为N,可以形成一个矢量X s 0 , s 1 , , s N 1 Y AXT
该矢量通过一个正交变换矩阵A,作一个线性变换 式中正交变换矩阵A满足A-1=AT,Y中的元素就是变换域系数, 它们被量化后形成矢量 ,在接收端通过逆变换重 Y 构出信号矢量 X X A 1Y AT Y
自适应变换编码的任务就是设计一个最佳量化器去量化Y 中的各个元素,使得重构的语音失真最小;或者说,使
信号量化信噪比最大。可以证明,ATC的增益是变换域 系数方差的算术平均与其几何平均值比
语音信号处理
I ATC
1 N 1 2 i N i 0
i2 i 0
N 1
1 N
这个值反映了变换域系数的能量集中程度,当变换域系数 方差均相等,即能量均匀分布时, I ATC 1 即相对于PCM没有信噪比增益。一般说来,合适的正交变换 使变换域系数能量集中分布,所以其几何平均值总是小于
算术平均值,即IATC总是大于1的。因此变换编码必须选择一种合适的正交变换。 DFT、沃尔什-哈达马变换、离散余弦变换DCT、KLT变换。
目前,自适应变换编码的正交变换都是采用DCT。原因?
语音信号处理
2. 正交变换DCT基于DCT的种种优势,当今自适应变换编码的正交变换普遍采用 DCT。 ① DCT与KLT相比,频域变换明确,且与人的听觉频率分析机 理相对应,较易控制量化噪声频率范围。 ② 兼顾性能与计算量。DTC提供的性能一般在KLT的1~2dB之 内,其它变换则相当差。而KLT的计算量太大。 ③ DCT只需在每帧采用FFT运算即可,因此运算量小、数据量 少,也不需要传输特征矢量。 ④ DCT统计地近似于长时间最佳正交变换和特征矢量,所以 DCT与DFT相比,变换效率高于DFT。 ⑤ DCT与DFT相比,在端点取出波形的影响较小,在频域区的 畸变更小。
语音信号处理
N点DCT的正变换为:
(2n 1)k X c (k ) x(n)c(k ) cos[ ](0 k N 1) 2N n 0N 1
反变换为:
2n 1 k 1 N 1 x n X c k c k cos N k 0 2N 式中
1 c k 2
k 0 1 k N 1
可以证明,DCT与用N个零点填充矢量X而得到的2N点函数的 DFT有关。
语音信号处理
令
y (n) 为X的填充形式,
Y k y n Wn 0
N 1
nk
式中,W e n 1 k
j / N
由于填零的原因,求和计算到N-1为止
Y k W
k
2
y n Wn 0
N 1
2
对实数y来说,和的实数部分为:
y n n 0
N 1
2n 1 k cos2Nk/2
最终可得X的DCT为:
X c (k ) c(k ) Re[W
Y (k )]
语音信号处理
分帧的语 音信号
每一帧的语音信 号DCT变换域系 数划分为20个左 右的频带,求各 频带的平均功率, 作为边带信息
用估计的频 谱值代替方 差,计算出 各系数的码 位分配
估计谱应能正 确反映变换域 系数的能量分 布,所占的比 特数要受到限 制
语音信号处理
§ 7.4 语音信号的参数编码参数编码也称为模型编码。它是对语音信号建
立模型,然后对模型参数或是语音的特征参数进行编码,力图使重建语音信号在听觉上具有尽可能高 的清晰度和可懂度。
语音信号处理
§7.4.1 线性预测声码器 线性预测声码器:应用最成功的低速率参数语音编码器。线性预测 分析器s(n)
信道编码器 解码器
线性预测 合成器
s(n)
音调 检测器
LPC声码器框图
与利用线性预测的波形编码不同的是它的接收端不再利用残 差,即不具体恢复输入语音的波形,而是直接利用预测系数 等参数合成传输语音。 LPC有作为预测器和作为模型的双重作用。
语音信号处理
1. LPC参数的变换和量化
语音信号处理
语音信号处理
2. 变帧率LPC声码器 充分利用了语音信号在时域上的冗余度,尤其是元音和擦音 在发音过程中都有缓变的区间,描述这部分区间的语音不必 像一些快变语音那样用很多比特的信息量。 语音信号是非平稳的时变信号,波形变化随时间而不同。 (清音至浊音的过渡段,语音特性变化剧烈,理论上应用较 短的分析帧,要求LPC声码器至少每隔10ms就发送一帧新的 LPC参数;而对于浊音部分,在发音过程中有缓变的区间, 语音信号的频谱特性变化很小,分析帧就可以取长些;在语 音活动停顿情况下更是如此。) 因而可以采用变帧速率的编码技术来降低声码器的平均传输 码率。
语音信号处理
实现思路:帧长可保持恒定,不必将每帧LPC参数都去编码和传送,合成部分所需的参数可以通过重复使用其前帧参 数或内插的方法获得,可降低平均传码率。
关键问题:需要一种度量方法来确定当前帧参数和上一帧参数之间的差异(距离)。
语音信号处理
§7.4.2 LPC-10编码器
语音信号处理
语音信号处理
语音信号处理
语音信号处理
正在阅读:
第08讲 语音编码(参数编码+混合编码)09-04
内部控制交流提纲09-13
农村小学开展综合实践活动的有效性研究11-22
内经选读名词解释(山东中医药考试重点)01-18
秋天的作文200字02-05
有志者事竟成作文600字06-21
2018学年第二学期温州十五校联合体期末联考高二历史(附答案) -04-13
《药物分析》毕业考试题库12-03
我家门前的一条街作文600字07-07
- exercise2
- 铅锌矿详查地质设计 - 图文
- 厨余垃圾、餐厨垃圾堆肥系统设计方案
- 陈明珠开题报告
- 化工原理精选例题
- 政府形象宣传册营销案例
- 小学一至三年级语文阅读专项练习题
- 2014.民诉 期末考试 复习题
- 巅峰智业 - 做好顶层设计对建设城市的重要意义
- (三起)冀教版三年级英语上册Unit4 Lesson24练习题及答案
- 2017年实心轮胎现状及发展趋势分析(目录)
- 基于GIS的农用地定级技术研究定稿
- 2017-2022年中国医疗保健市场调查与市场前景预测报告(目录) - 图文
- 作业
- OFDM技术仿真(MATLAB代码) - 图文
- Android工程师笔试题及答案
- 生命密码联合密码
- 空间地上权若干法律问题探究
- 江苏学业水平测试《机械基础》模拟试题
- 选课走班实施方案
- 编码
- 语音
- 混合
- 参数
- 常用监护仪及相关监测指标意义
- 甘肃产地葡萄酒的酿造研究
- Unit 1 The King of the Spiders
- 人教版数学五年级上册全套练习册(含答案)
- 用于银行贷款2013年高活性生物发酵饲料项目可行性研究报告(甲级资质+专家答疑)编制方案
- 出口贸易业务模拟操作实践报告
- 气体密封性能检测原理及设备基本知识
- 罗兰贝格-德国汉高公司进入中国市场策略项目建议书
- 9Photoshop+CorelDRAW平面设计创作实例教程
- 产品可靠性设计方法概述
- 绍兴市外滩3-1地块总体规划设计深化方案
- 食品工厂设计_年产10万吨饼干厂工艺设计
- 乡村学校少年宫辅导员培训方案
- 2016咨询工程师继续教育教发展规划试题及答案(88分)
- 电动力学习题及答案-1
- 高一数学竞赛函数例题
- 着装礼仪-女士
- 中国传统节日英语作文五年级
- 家长对孩子的寄语
- 第六章 财产损失保险(保险学-吉林大学 池晶)