孤立词语音识别系统设计

更新时间:2023-05-30 05:53:01 阅读量: 实用文档 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

深圳大学本科毕业论文(设计)开题报告

别时可供参加训练的发音人(圈内人)使用,也可供未参加训练的同一范畴的发音人(圈 外人)使用。 孤立词语音识别的基本原理:特征提取,训练,识别,失真测度。主要识别框架:基 于模板匹配的动态时间规整法 DTW 和基于统计模型的隐马尔柯夫模型法 HMM。特征提取就 是通过数字信号处理技术从语音波形中提取最能表征语音的语意信息的特征参数。镁倒谱 系数 MFCC:是在语音识别过程当中最常用的倒谱特征参数,它将一般的频谱转换到基于 Mel 尺度(基于人耳的听觉特性而设计的,具有很好的识别性能和抗噪声能力)的非线性 频谱上,然后再进过一组滤波器,最后转换到倒谱域中。训练是预先分析出语音特征参数, 制作语音模板或其它(统计)模型并存放在语音模型库中。识别是待识语音经过与训练时相 同的分析,得到语音参数,将它与库中的参考模板型一一比较,并采用判决的方法找出最 接近语音特征的模型,得出识别结果。失真测度是计量语音特征参数矢量之间的“失真(距 离)测度” 。隐马尔柯夫模型法 HMM 为当前语音识别的主流算法,它将将语音模拟成一对时 域与频域上并存的随机过程(时域:状态转移过程,频域:混合高斯分布) 。其优点是训 练和识别过程都有很完备的理论框架,跟高层次的语言学模型可以很好地结合。

研究方法、手段及步骤:非特定人语音识别系统设计分为系统定义,训练和识别三个阶段。在系统定义阶段, 要根据系统

具体应用范围定义系统的词汇库,即系统的识别词汇。在训练阶段,通过麦克 风输入定义的语音命令,然后对模拟语音信号进行预处理,对处理后得到的数字语音信号 进行语音特征提取,为不同用户的不同语音特征参数建立一个相应的语音特征模型库。训 练完成后,进入语音识别阶段,麦克风输入定义的词汇中的一个或若干个词汇(任意组合 任意次序) ,然后进行预处理,对处理后得到的数字语音信号进行特征参数提取,紧接着 用概率密度函数计算语音参数对 HMM 模型的输出概率,通过搜索最佳状态序列,以最大后 验概率为准则找到识别结果。系统采用 C 语言编程实现,大致具体步骤: 预处理:包括语音信号采样、反混叠带通滤波、语音识别基元的选取、端点检测、语 音分帧加窗以及预加重等处理工作。 特征提取:提取语音中反映本质特征的声学参数,如平均能量、平均过零率、共振峰 等;并提取特征参数,如线性预测倒谱系数(LPCC)与 Mel 倒谱系数(MFCC) 。 模型训练:在识别之前通过让讲话者多次重复语音,从原始语音样本中去除冗余信息, 保留关键数据,再按照一定规则对数据加以聚类,形成模式库。 模式匹配:根据一定规则(如某种距离测度),计算输入特征与库存模式之间的相似度 (如匹配距离、似然概率),判断出输入语音的语义信息。

参考文献:《语音识别基础》上海交通大学计算机系 吴亚栋 《基于 HMM 的孤立词语音识别系统的研究》硕士论文 王明奇 《语音识别技术研究及实现》高宏涛 张德贤

《基于 DSP 的机器人语音识别及控制系统设计》 硕士论文 刘京诚 《小词汇量非特定人连续语音识别系统的研究》 硕士论文 范长青 学生签名:

指导教师意见:

签名: 院系领导意见:

签名: 年

本文来源:https://www.bwwdw.com/article/ft74.html

Top