(强烈推荐)毕业论文设计基于虚拟仪器的语音识别算法研究 - 图

更新时间:2024-05-22 03:38:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

本科生毕业设计说明书(毕业论

文)

题 目:基于虚拟仪器的语音

识别 算法研究

毕业设计(论文)原创性声明和使用授权说明

原创性声明

本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。

作 者 签 名: 日 期: -

指导教师签名: 日 期:

使用授权说明

本人完全了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前

提下,学校可以公布论文的部分或全部内容。

作者签名: 日 期:

学位论文原创性声明

本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。

作者签名: 日期: 年 月 日

学位论文版权使用授权书

本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。

涉密论文按学校规定处理。

作者签名: 日期: 年 月 日

导师签名: 日期: 年 月 日

指导教师评阅书

指导教师评价: 一、撰写(设计)过程 1、学生在论文(设计)过程中的治学态度、工作精神 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、学生掌握专业知识、技能的扎实程度 □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、学生综合运用所学知识和专业技能分析和解决问题的能力 □ 优 □ 良 □ 中 □ 及格 □ 不及格 4、研究方法的科学性;技术线路的可行性;设计方案的合理性 □ 优 □ 良 □ 中 □ 及格 □ 不及格 5、完成毕业论文(设计)期间的出勤情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 三、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格

建议成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 指导教师: (签名) 单位: (盖章) 年 月 日

评阅教师评阅书

评阅教师评价: 一、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格

建议成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 评阅教师: (签名) 单位: (盖章) 年 月 日

教研室(或答辩小组)及教学系意见

教研室(或答辩小组)评价: 一、答辩过程 1、毕业论文(设计)的基本要点和见解的叙述情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、对答辩问题的反应、理解、表达情况 □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、学生答辩过程中的精神状态 □ 优 □ 良 □ 中 □ 及格 □ 不及格 二、论文(设计)质量 1、论文(设计)的整体结构是否符合撰写规范? □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、是否完成指定的论文(设计)任务(包括装订及附件)? □ 优 □ 良 □ 中 □ 及格 □ 不及格 三、论文(设计)水平 1、论文(设计)的理论意义或对解决实际问题的指导意义 □ 优 □ 良 □ 中 □ 及格 □ 不及格 2、论文的观念是否有新意?设计是否有创意? □ 优 □ 良 □ 中 □ 及格 □ 不及格 3、论文(设计说明书)所体现的整体水平 □ 优 □ 良 □ 中 □ 及格 □ 不及格

评定成绩:□ 优 □ 良 □ 中 □ 及格 □ 不及格 (在所选等级前的□内画“√”) 教研室主任(或答辩小组组长): (签名) 年 月 日 教学系意见: 系主任: (签名) 年 月 日

基于虚拟仪器的语音识别算法研究

摘 要

随着信息技术的快速发展,智能人机交互通信逐渐渗透到人们的日常生活之中,在许多电器的控制面板中,都加入了利用声音信息进行的人机交互功能,其中多数都具备语音提示的功能,这就使人机交互的效率得到了更大的提高。

本次设计将虚拟仪器技术用于语音识别系统,实现了仪器的软件化,真正体现了“软件就是仪器”的思想。利用笔记本自带的声卡进行语音信号的采集,接着对语音信号进行数字化的转换后再做进一步的处理。利用MATLAB中的小波工具包对采集到的语音信号进行小波消噪处理,并借助 LABVIEW 中提供的Script Node 子VI连接主流算法即仿真分析软件MATLAB ,充分发挥 MATLAB 强大的数据处理能力,虽然 LABVIEW中提供了一些信息处理功能函数,但其毕竟功能有限,仍然无法满足部分用户对数值进行各种各样的计算和分析的需求。而 MATLAB 尤其擅长数值分析和图像处理。在这里我们利用MATLAB 中的小波工具包,实现了利用小波的方法对含有杂声的语音信号进行噪声消除的工作。由于小波具有多尺度,多分辨的特点,应用小波进行信号消噪处理是小波分析的一项重要应用。

文中首先介绍了语音识别技术的基本原理,分析了经常使用的线性预测倒谱系数和美尔频率倒谱系数,并选定美尔频率倒谱系数作为本系统中采用的语音特征参数;其次系统能够实现语音信号的自动采集;然后针对语音特征参数提取,结合 LABVIEW的编程特点,利用多线程对特征参数进行提取并运算,将计算时间缩短了 14;最后在分析语音识别系统主要需求的基础上,对识别系统的软硬件进行了设计,并对语音信号做噪声消除以

及预处理后进行特征提取,利用不同语音独特的特征和模式匹配算法,实现说话人语音信号的最终识别。

关键词 :语音识别;LABVIEW;声卡;小波消噪;特征提取

The speech recognition algorithm based on virtual

instrument

Abstract

With the rapid development of technology, intelligent and machine interfaces are used in appliances in people's normal life. Currently, a lot of appliances that can give warning messages to the user in sound which improves the efficiency of and machine interaction.

This design is a use of virtual instrument and do speech recognition system design. Will the virtual instrument technology used in speech recognition system, realized the instrument of the software, and reflect the \is instrument\thought. Use notes itself with sound card for voice signal collection, the speech signal digital conversion and further processing. MATLAB wavelet in the toolkit of collected a voice signal wavelet denoising treatment, and with the the Script Node sub. vi connect the mainstream algorithm simulation analysis software MATLAB, make full use of MATLAB powerful data processing capabilities, even though the LABVIEW provides some information processing functions, but limited after all, still can't meet some user demand for various kinds of numerical calculation and analysis. And MATLAB is especially good at numerical analysis and image processing. Here we use of MATLAB wavelet toolkit, realized by using wavelet method to contain the short speech signal noise elimination of work. Due to the small wave characteristics, application of wavelet de-noising signals when processing

of wavelet analysis is a kind of important applications.

This paper introduces the basic principle of speech recognition technology, and then analyses some feature parameters such as Linear Prediction Coefficients,Linear Prediction Cepstral Coefficients and Mel Frequency Cepstral Coefficients and chooses the MFCC used in this system; Followed, this paper realizes automatically speech signal acquisition , and uses multi-thread of LABVIEW to calculate the feature parameters in aparallel way and short 14 of the calculating time which improve the efficiency of the feature functional testing; At last, this paper analyses the main requirements of this system, designs the detail and chooses the graphic programming language LABVIEW as the software development platform and then the use of different speech unique feature and pattern matching algorithm, realize voice signal to the final recognition.

Keywords: Speech Recognition;Virtual instrument;Sound card;Wavelet Denoising and feature extractio

目录

摘 要 ...................................................................

Abstract ............................................................... I

目录 ................................................................... I

第一章 绪论 ............................................................

1.1 本文的应用背景和研究意义 .........................................

1.2 语音识别发展历史及现状 ...........................................

1.3虚拟仪器简介 ......................................................

1.4 MATLAB语言.......................................................

1.5论文的主要内容及其结构 ........................................... 1

第二章 语音识别基本技术 ................................................ 1

2.1 语音信号的采集 .................................................. 1

2.1.1 语音识别系统基本框架 ....................................... 1

2.1.2 语音信号的采集 ............................................. 1

2.1.3 语音信号的数字化 ........................................... 1

2.2 语音信号预处理 .................................................. 1

2.2.1 预加重处理 ................................................. 1

2.2.2 分帧、加窗 ................................................. 1

2.2.3 端点检测 ................................................... 1

2.3 语音信号的特征参数提取 .......................................... 2

2.3.1 美尔频率倒谱参数及提取方法 ................................. 2

2.3.2 差分倒谱系数提取方法 ....................................... 2

第三章 语音识别算法 .................................................... 2

3.1 模板匹配的方法 .................................................. 2

3.1.1 动态时间规整算法 DTW ....................................... 2

3.1.2 隐马尔可夫模型法 HMM ....................................... 2

3.1.3 高斯混合模型法 GMM ......................................... 2

3.1.4 矢量量化 VQ ................................................ 2

3.1.5 混合型算法 ................................................. 2

3.2 基于声学和语音学的方法 .......................................... 2

3.3 神经网络的方法 .................................................. 2

第四章 非特定人连续语音识别系统的实现 .................................. 3

4.1 概述 ............................................................ 3

4.2 非特定人连续语音识别系统设计与实现 .............................. 3

4.2.1 语音信号的实时采集与小波消噪处理 ........................... 3

4.2.2 语音信号的预处理 ........................................... 3

4.2.3 语音信号的特征提取 ......................................... 3

4.3 模板的建立与读取 ................................................ 3

4.3.1 建立模板 ................................................... 3

4.3.2 读取模板 ................................................... 4

第五章 结 论 .......................................................... 4

第六章 总结与展望 ...................................................... 4

6.1 总结 ............................................................ 4

6.2 展望 ............................................................ 4

参考文献 ............................................................... 4

致 谢 .................................................................. 4

第一章 绪论

语言是人类进行信息交流的最常用、最重要的手段,人类的语言和人的心理活动密切相关,是人们进行思想交流的重要方式,既高效又便捷。随着现代社会的不断发展,科学技术的日益成熟,全自动机器逐渐被运用于各个领域,取代了很多原本依靠人来完成的工作,人们对机器的智能要求也越来越高,人机进行信息交互的手段也越来越便捷和迅速,因此语言交流自然而然的成为了首选。人与机器的语言交流总体可分为三部分,(1)让机器听懂人的语言(2)进行语言组织(3)文字转化为声音输出。语音识别研究的就是如何让机器听懂人的语音内容,同时辨别是否是主人所发出的指令,执行相应的操作。

1.1 本文的应用背景和研究意义

语音识别技术是现代高科技信息领域的研究热点,对于信号处理的研究,从理论的产生到专业产品的系统开发应用已经经历了数十年,终于获得了极大的突破。经过二十年的研究探索,语音识别技术取得了很大的发展。就目前来说,该技术从实验室的实验性设计开发,逐渐进入到工厂的应用,估计在不远的将来,语音识别技术将遍布通讯行业,家电行业,医疗保健行业,家庭服务行业,汽车电子行业,消费性电子产品等各大领域。它与自动拨号,健康和福利,生命支持系统和其他实际应用相互衔接,直接控制商业,制造业,金融业,运输业,旅游业,公安消防等工业生产部门和应用领域,该技术的日益成熟有望成为下一代的操作系统和应用程序的用户界面。以下介绍语音识别技术的几大应用领域:

(1)查询语言的语音识别应用

语音识别可用于查询航班时间表,电话号码,巴士时间查询,火车车次查询,自动导游,天气预报,股票行情系统等。目前在国际上的各大旅游景区已经开始逐步采用语音识别查询系统,其中最具代表性的是日本丰桥大学设计研发的“富士山旅游咨询系统”,该系统是一个比较实用的语音查询系统,此外它还可以采用问卷调查等方式,集成了自动语言的语音导览系统。只要游客对该系统说话,标示清楚他们当前的所在位置和感兴趣的风景名称,系统会自动显示出最佳路线,实物图片和旅游计划等人性化的信息。该系统不仅能提供英语和汉语查询,而且可以用其它语言来查询。另一个例子是,利用语音识别的自动订票系统,只要站在预订系统前,说出搭乘的时间和地点,系统便会自动显示出符合要求的车费、班次和车票销售的记录,根据实际情况,用户可以做出最佳的选择。1996 年,美国卡内基梅隆大学计算机科学系开发的语言语音机票预订系统,在实践方面,就做出了有益的尝试[6]。

(2)语音识别技术在工业生产上的应用

在一些对人身有极大伤害(如地下,水深,辐射,高温环境下)、环境比较恶劣的地方,还有无人时难以实现工作的地方都可以运用相应的语音命令加以控制,通过远程,使用专门的语言,也就是语音控制系统,控制设备去完成工作,这就能用各种指令和命令,对作业现场进行实时控制和处理。

(3)语音识别技术在扶残扶弱方面的应用

为了帮助残疾人士由于肢体功能方面的缺陷而引起的动作不便,运用语音识别系统,则能对其给予一定的方便。例如:对于身体残疾的人或盲人,能够既准确又灵活地使用现代化设备是比较困难的,但是,如果有了语音控制系统,便能为其提供一些很好的生活辅助设施,给他们带来方便。

一些带有语音功能的办公设备,甚至可以帮助残疾人士在家里或在工作岗位上,开辟出一个新的生存空间。

(4)语音识别技术对各生产领域的应用

汽车工业带来的经济收入对一个国家来说是至关重要的,最新的语音识别技术已经应用到汽车领域,并且仍在不断开发和添加新的功能。一些国内外知名的汽车制造公司,很早就预见了语音技术在汽车行业的发展前景,他们已经提出了无需操控的、在后座说话就可以驾驶的智能汽车,完全告别了手动驾驶车辆的模式。当车在开启时,只要告诉它继续行驶和目前的位置,就能够顺利地行使到目的地。目前,这种智能汽车已经进入了研究阶段,相信过不了多久,这个构想将很快成为现实。

(5)语音识别技术在辅助教学方面的应用

在教育领域,已经运用了多媒体语音识别应用类双向教学软件,客户包含清华大学复旦大学等在内的多个高等院校,此语音识别教学系统用来帮助学生在语言学习的过程中,引导学生正确发音,及时的纠正外语口语的发音。该系统也可称为家庭幼儿辅导老师及中小学教育不可或缺的辅助工具。

(6)语言语音玩具

在对孩子进行启蒙教育的时候,你可以用带有语音说话功能的娃娃与孩子交谈,让孩子操作服从语音命令的玩具,在孩子们幼小的心灵就播下科学的种子,让这些玩具引导孩子们探索科技,发现科学的伟大力量。据外国有关媒体报道,语音玩具的销售远远超出了预期水平 [7]。

(7)语音识别技术在军事方面,刑事调查方面的应用

由于每个人的发音都有其独特的特点,就像人的指纹一样,具有独特性和唯一性,是非常有特点的识别标志,科学上可以运用它来判断一个特定的人。比如,在外国科幻电影中,我们经常会看到高精密发射的核设施

本文来源:https://www.bwwdw.com/article/kr27.html

Top