基于Matlab编写的语音端点检测
更新时间:2023-10-03 22:05:01 阅读量: 综合文库 文档下载
基于Matlab编写的语音端点检测
专 业:班 级:姓 名:指导教师:
2011 年 6月 18 日
一、实验目的
1.学会MATLAB的使用,掌握MATLAB的程序设计方法; 3.掌握语音处理的基本概念、基本理论和基本方法; 4.掌握基于MATLAB编程实现带噪语音信号端点检测; 5.学会用MATLAB对信号进行分析和处理。
二、实验内容简介:
(1) 采集一段语音信号,采样率为8KHZ,量化精度为16比特线性码; (2) 分析帧长30ms(或10ms~50ms);
(3) 利用公式分别计算这段语音信号的短时能量、短时平均幅度、短时
过零率曲线;
(4) 利用(3)中的结果画出短时零能比曲线;(零能比: 即同一时间段内
的过零率和能量的比值)
(5) 根据上述结果判断找出其中的一帧浊音信号和一帧清音信号,分别
计算他们的短时自相关函数和平均幅度差函数;
(6) 调整能量门限,设置参数。实现语音端点的检测。
三,实验心得
这次的实验,,给我最大的收获就是培养了独立思考和动手的能力,还有就
是实验的灵活性,总得来说就是在独立与创新这二个环节,我更加掌握MATLAB的程序设计方法,进一步的了解了掌握基于MATLAB编程实现带噪语音信号端点检测的原理,这充分锻炼了我们独立的动手能力和独立的解决所遇到的问题,让我对这门课程又有了新的理解。
四.课程设计原理
端点检测是语音信号处理过程中非常重要的一步,它的准确性直接影响到语音信号处理的速度和结果,因此端点检测方法的研究一直是语音信号处理中的热点。本设计使用传统的短时能量和过零率相结合的语音端点检测算法利用短时过
零率来检测清音.用短时能量来检测浊音,两者相配合便实现了信号信噪比较大情况下的端点检测。
算法对于输入信号的检测过程可分为短时能量检测和短时过零率检测两个部分。算法以短时能量检测为主,短时过零率检测为辅。根据语音的统计特性,可以把语音段分为清音、浊音以及静音(包括背景噪声)三种。在本算法中,短时能量检测可以较好地区分出浊音和静音。对于清音,由于其能量较小,在短时能量检测中会因为低于能量门限而被误判为静音;短时过零率则可以从语音中区分出静音和清音。将两种检测结合起来,就可以检测出语音段(清音和浊音)及静音段
1、短时能量计算
定义n时刻某语音信号的短时平均能量En为:
En?m????[x(m)w(n?m)]?2??m?n?(N?1)2 [x(m)w(n?m)]?n式中N为窗长,可见短时平均能量为为一帧样点值的甲醛平方和。特殊
地,当窗函数为矩形窗时,有
En?m?n?(N?1)?xn2(m)
2、短时过零率
过零就是指信号通过零值。过零率就是每秒内信号值通过零值的次数。 对于离散时间序列,过零则是指序列取样值改变符号,过零率则是每个样本的改变符号的次数。对于语音信号,则是指在一帧语音中语音信号波形穿过横轴(零电平)的次数。可以用相邻两个取样改变符号的次数来计算。 如果窗的起点是n=0,短时过零率Z为
波形穿过横轴(零电平)的次数
x?0?1,
sgn(x)?? ??1,x?0短时过零可以看作信号频率的简单度量
1N?1Z0??Sgn(Sw(n))?Sgn(Sw(n?1))2n?0浊音的短时平均幅度最大,无声的短时平均幅度最小,清音的短时过零率最大,无声居中,浊音的短时过零率最小。 3、短时自相关函数
N?k?1 Rw(k)??sw(n)sw(n?k)n?0
1、是偶函数;
2、s(n)是周期的,那么R(k)也是周期的; 3、可用于基音周期估计和线性预测分析
4、判断语音信号的起点和终点
利用短时平均幅度和短时过零率可以判断语音信号的起点和终点。语音端点检测方法可采用测试信号的短时能量或短时对数能量、联合过零率等特征参数,并采用双门限判定法来检测语音端点,即利用过零率检测清音,用短时能量检测浊音,两者 配合。首先为短时能量和过零率分别确定两个门限,一个是较低的门限数值较小,对信号的 变化比较敏感,很容易超过;另一个是比较高的门限,数值较大。低门限被超过未必是语音 的开始,有可能是很短的噪声引起的,高门限被超过并且接下来的自定义时间段内的语音超
首先,可根据浊语音情况下短时平均幅度M的概率密度函数P(M/V)确定一个阈值参数MH, MH的值定得比较高。当一帧输入信号的M值超过MH时,就可以十分肯定该帧语音信号不是无声,而有相当大的可能性是浊音由N1’向前和N2’向后继续用短时过零率Z进行搜索。根据无声情况下短时过零率Z的均值,设置一个参数Z0,如果由N1’向前搜索时Z始终大于Z0的3倍,则认为这些信号仍属于语音段,直至Z突然下降到低于3Z0值时,这时可以确定语音的精确起点(为了保证可靠,由N1’ 向前搜索时间不超过25ms)。对终点做同样的处理。采取这一算法的原因在于, N1’以前可能是一段清辅音段(如f,s),它的能量相当弱,依靠能量不可能把他们与无声段区别开,而他们的过零率明显高于无声,因而能用这个参数来精确的判断二者的分割点,也就是语音真正的起点。
四、实验步骤:
(1) 用cooledit录了一段音,是我自己说的。采样率为8KHZ,量化精
度为16比特线性码。
(2) 利用滤波器对信号进行带通滤波,这样可除去大部分共振峰的影响 (3) 利用公式分别编程计算这段语音信号的短时能量、短时平均幅度、
短时过零率,然后分别画出它们的曲线;
(4) 然后画出短时零能比曲线。
(5)
根据上述结果判断找出其中的一帧浊音信号和一帧清音信号。判断依据是,浊音:短时能量大、短时平均幅度大、短时过零率低;清音:短时能量小、短时平均幅度小、短时过零率高。浊音,取13270--13510个点,清音,取12120--12360个点。分别计算他们的短时自相关函数和平均幅度差函数;
(6) 调整能量门限,设置参数,实现语音端点的检测。
五、实验结论分析:
正在阅读:
基于Matlab编写的语音端点检测10-03
什么叫科学发展观02-17
高尔夫概论10-07
天气开始变凉了,你家的露台阳光房做了吗?09-15
聚氨酯硬泡生产工艺05-04
五一劳动节作文03-12
综合实验报告LTE仿真实验05-30
春夏秋冬作文500字07-11
高尔夫6-自动挡驾驶技巧04-27
- 多层物业服务方案
- (审判实务)习惯法与少数民族地区民间纠纷解决问题(孙 潋)
- 人教版新课标六年级下册语文全册教案
- 词语打卡
- photoshop实习报告
- 钢结构设计原理综合测试2
- 2014年期末练习题
- 高中数学中的逆向思维解题方法探讨
- 名师原创 全国通用2014-2015学年高二寒假作业 政治(一)Word版
- 北航《建筑结构检测鉴定与加固》在线作业三
- XX县卫生监督所工程建设项目可行性研究报告
- 小学四年级观察作文经典评语
- 浅谈110KV变电站电气一次设计-程泉焱(1)
- 安全员考试题库
- 国家电网公司变电运维管理规定(试行)
- 义务教育课程标准稿征求意见提纲
- 教学秘书面试技巧
- 钢结构工程施工组织设计
- 水利工程概论论文
- 09届九年级数学第四次模拟试卷
- 端点
- 编写
- 语音
- 基于
- 检测
- Matlab
- 中小企业流动资金紧张的原因及解决对策
- 2018-2024年中国路标漆市场供需预测及战略咨询报告(目录) - 图文
- 2506专科《学前儿童艺术教育(美术)》试题答案及评分标准
- 张子让《当代新闻编辑》笔记
- 高中政治第2单元第6课第2框股票债券和保险教案新人教版必修1
- 苏教版小学三年级下册体育教案
- 各省规费费率
- 广东电信市场营销、信息网络真题库
- 网站运营推广计划及方案
- 写景专题训练
- 寒号鸟说课稿
- 留守儿童之家简介2
- 搜索引擎需求分析
- 语文研究课题立项农村小学生课外阅读兴趣培养的实践与研究申报书 精品 - 图文
- 武汉理工大学RFID复习简答题六道 - 图文
- 2014年6月3日浙江省军转干考试国内时事政治
- 北京航空航天大学北航电路分析试题三
- 2018年二级建造师《水利水电》知识点讲解:2F311013混凝土坝的构造及作用
- 市场营销增设专业申请表 - 图文
- 模拟电子技术实验II指导书(2017版) - 图文