1DSP 论文 1

更新时间:2024-06-13 21:17:01 阅读量: 综合文库 文档下载

说明:文章内容仅供预览,部分内容可能不全。下载后的文档,内容与下面显示的完全一致。下载之前请确认下面内容是否您想要的,是否完整无缺。

题 目:基于院 系:专 业:班级学号:学生姓名:成 绩:

DSP的语音识别系统

在智能楼宇中的应用

目 录

目录 ............................................................................................................. 1 摘要 ............................................................................................................. 2 1 概述 ....................................................................................................... 3 2 语音识别的原理 .................................................................................. 4 3 系统的硬件设计 .................................................................................. 6 4 软件设计............................................................................................... 8 5 语音识别在智能楼宇系统中的具体应用 .......................................... 9 6 总结 ..................................................................................................... 10

1

摘要

随着DSP技术的发展,中小词汇量连续语音的实时识别已经被广泛应用到日常生活中,本文提出了一种基于TMS320VC5410的小词汇量的语音识别实时系统,对以TMS320VC5410为核心的系统硬件设计进行了研究,阐述了系统的结构。文章分析了系统的工作过程,引用已有的算法进行软件系统设计,软件模块包括预处理、端点检测、特征提取、模式匹配等。最后把此系统应用到智能楼宇系统中去,实现了对智能楼宇更加及时、方便的控制。

2

1 概述

语音识别是近二十几年发展起来的信息学科,语音识别具有自然、快速、方便等优点。始于二十世纪六十年代的语音识别研究,识别率有了很大的提高,基本可达实用水平。但是因为语音识别的计算量非常大,难以实时实现,因此一直制约着它的应用。随着DSP和专用集成电路技术的发展,语音识别尤其是小词汇量的说话人实时成为可能。

进入90年代以来,随着通信技术与网络技术的发展,楼宇控制网络也得到了很大的发展,并形成了以BACnet协议标准,构建在此标准上的智能楼宇已得到了广泛的应用。我们知道,智能楼宇的控制和管理的命令基本上是由很少数量的特定的词组和数字串构成,并且利用语音识别技术来进行智能楼宇中的某些控制也更加的实时、方便、有效。因此,把语音识别系统应用在智能楼宇控制网络中,是可实现并且有前途的。

目前的人机“交流”大多数是通过操作繁琐的键盘实现的,这就要求操作人员具备一定技能。语音识别技术的出现,使人们和机器通过自然语言交流成为可能,不仅解决了人机“交流”大众化中的障碍,提高了人机交互的效率,而且给人体无法接触或不便接触来实现操作控制的场合带来了极大的方便。虽然人们早已在实验室环境下突破了大诃汇量、连续语音和非特定人这三大障碍,但做此类研究需要一定的技术设备,并且难度较大。目前很多语音识别系统的识别率都很高,特别是中小词汇量非特定人语音识别系统识别精度已大于98%,特定人语音识别系统的识别精度就更高,这些技术已经能够满足通常应用的要求。本设计根据自身实际情况,选择特定人、小词汇量、孤立词来进行语音识别系统的研究。 DTW算法计算量较小,无需前期的长期训练,容易满足嵌入式应用要求,易于移植到DSP上实现语音识别 且能满足实时性要求,在特定场合可以得到较高的识别率,本设计以TMS320VC5410作为处理芯片系统利用DTW算法能够完成对特定人、小词汇量、孤立词的识别,并且能发出相应的控制信号,达到设计的要求。

3

2 语音识别的原理

语言是人类特有的功能,声音是人类常用的工具,是相互传递信息最重要也是最基本的手段,如何让计算机听懂人说的话,实现计算机与人之间的沟通和通信,这就涉及到语音识别的问题。语音识别本质上是一种模式识别的过程,主要包括语音信号预处理、特征提取、特征建模、相似性度量和后处理等几个功能模块。一个语音识别系统主要包括训练和识别两个阶段。无论哪个阶段,都需要首先对输人的原始语音进行预处理并进行特征提取。其基本的原理框图如图2.1所示。

图2.1 语音识别的原理图

(1)预处理:就是对输入的原始语音信号进行处理,滤除其中不必要的信息及噪声等,并进行语音信号的端点检测,即判定语音有效范围的开始和结束位置,并进行语音分帧和预加重处理等工作。 预处理主要有以下几步: ①A/D转换 ②量化编码 ③反混叠处理 ④预加重 ⑤短时过零率

(2)特征参数提取方法:语言信号完成分帧处理和端点检测后,下一步就是特征参数的提取,在语音识别中我们不能将原始波形直接用于识别,必须通过一定的变换。语音特征参数可以是能量、基因频率、共振峰值等语音参数,目前在语音识别中较为常用的特征参数为线性预测倒谱参数(LPCC)与Mel倒谱参数(MFCC)。本文采用基于LPC 的倒谱参数(LPCC)的特征提取方法,它是将语音从时域变换到倒谱域上,从人的发声模型角度出发,利用线性预测编码(LPC)技术求倒谱系数。 在说话人识别中采用倒谱系数(LPCC)和基音周期参数,而在控制命令的语音识别

4

中仅采用倒谱系数,倒谱系数采用线性预测倒谱系数。

(3)语音训练:模式匹配中需要用到参考模板,这些模板通过模板训练获得。模板训练就是指按照一定的准则,从大量已知模式中获取表征该模式本质特征的模型参数。训练单元可分为:对说话人识别的训练和对识别词的训练。训练单元的功能是把事先收集到的语音利用一定的算法为每一个待识别的说话人训练出与之相匹配的参数。

(4)语音识别:语音识别中的模式匹配和模型训练技术主要有动态时间弯折技术、隐马尔科夫模型和人工神经元网络。DTW 应用动态规划方法,解决了语音信号特征参数序列比较时时长不等的问题,对于非特定、连续语音的语音识别系统,用的比较多的是HMM模型和ANN。本文采用的是基于隐含马尔科夫模型HMM的识别算法。

(5)后处理单元:充分利用每个说话人的声道参数和词条中各状态持续时间的概率分布来改进系统的识别率。

5

3 系统的硬件设计

该语音识别系统是以TI公司的TMS320VC5410为核心的,其硬件结构如图3.1所示。

图3.1 语音识别系统的硬件结构图

各硬件模块功能如下:

(1)TMS320C5410DSP是整个硬件系统的信号处理中心,完成语音识别、训练、编解码,进行片内RAM及外部FLASH存储芯片的数据管理与调度。其主要功能是接收MCU 8013发送来的命令,并根据其命令完成语音训练及语音识别。TMS320C5410是TI公司TMS320C54x系列的产品,为16位定点DSP,采用改进的哈佛结构,供电电压3.3V,提供了64Kb的片内RAM,6Kb的片内ROM;有一个时分复用串口TDM和2个带缓冲区的标准串口BSP;具有HPI(主机接口)是实现DSP与MCU接口的应用;指令周期为10ns, 即运算速度高达IOOMIPS;具有管理中断、循环运算和功能调用 的控制结构。

(2)运算放大器是采用Tl公司的TLC2272,它的主要作用是调节放大器和抑制共 模噪声,并且把麦克风输入进来的单端信号转换成A/D转换器TLC320AD535所需要的差分信号。

(3)TLC320AD535把输入进来的模拟信号转换成数字信号(芯片集语音A/D、D/A及抗混叠滤波于一体,性能价格比较高),并将转换完的数据传给TMS320C5410进行处理。

(4)EPROM是用来存放DSP程序和初始化所需的数据;RAM用于程序执行和数据的暂 存。FLASH存储器用于存放训练样本库。

(5)键盘和显示部分则有单片机8013来控制,8013把键盘操作转换为控制信号再

6

传给TMS320VC5410,控制的工作是训练还有识别。TMS320VC5410把要显示的系统状态通讯给8013,以实现LCD显示。8013可一次性编程,被广泛地应用于家用电器的控制,性能优越,保证了系统的主控能力,具有强大的I/O功能,能够提供灵活的外部接口,适于做进一步的改进和改造。计算器等附加功能可以直接由MCU完成。

7

4 软件设计

本设计采用C语言和汇编语言混合方式编程。在编写程序之前,首先用高级语言对每个模块进行算法仿真,在此基础上再进行汇编程序的编写。

在调试时,可以采用高级语言与汇编语言对比的调试方式,这样可以通过跟踪高级语言与汇编语言的中间状态,来验证汇编语言的正确性,并及时的发现和修改错误,缩短编程周期。另外,在程序的编写过程中,应在关键的部分加上必要的注释与说明,以增强程序的可读性。程序流程如图4.1所示。

图4.1 程序流程图

8

5 语音识别在智能楼宇系统中的具体应用

我们知道,智能楼宇的控制和管理的命令基本上是由很少数量的特定的词组和数字串构成,并且利用语音识别技术来进行智能楼宇中的某些控制也更加的实时、方便、有效。因此,把语音识别系统应用在智能楼宇控制网络中,是可实现并且有前途的。

由于智能大厦和智能小区的管理或控制命令是有限的词条和数字串的组合,对这些语音命令的识别属于特定人中小词汇量的连接词的识别,而以目前的DSP技术,不论是从运算速度还是存储空间,对于实现这些实时语音命令的识别都是完全可能的。如果用DSP来完成对语音命令识别,并把此识别系统设计成一个嵌 入式子系统,嵌入到BACnet设备中,由BAC—net设备接人BACnet网,就可以实现对语音识别技术的应用了,同时作为BACnet网络上的一个接点,也能够实现楼宇控制系统对语音识别装置的检测与控制。系统结构如图4所示。图4 语音识别系统在BACnet网的结构框图。

根据语音识别技术的特点可知,语音识别技术在智能楼宇中有多种应用,例如:语音的身份识别功能:运用语音识别的语音确认功能,能方便地指定用户使用某些功能,同时禁止非指定用户使用。另外语音直接控制功能:可对电梯、消防报警开关等直接通过语音控制,在紧急、黑暗的恶劣环境下可进行实时控制,也可方便残疾人士。下面看一个具体应用——利用语音识别技术对智能建筑各类大门的控制。例如智能楼宇某些办公室的大门可采用语音电子门禁(特定人的语音识别技术),工作人员可通过语音密码进人,而非法用户则被语音密码阻挡无法进入。首先把收集到的语音利用一定的算法为每一个待识别的说话人训练出与之相匹配的参数,并建立一个HMM模型,利用已经获得的HMM模型参数 和测得的说话人的基音周期在一定的判决条件下辨认出带识别的说话人并估计出待识别的控制命令词串。而对于居民楼的大门,可采用非特定人的语音识别,即提取特征参数时不带有说话人的特征,只要求能说出密码即可,这样智能楼宇里的居民在忘带钥匙或是黑夜的情况下也可以通过语音识别直接进人大楼,同时也防止了其他可疑人士出人住宅区。可见采用了语音识别技术的智能楼宇系统在实施某些控制功能时能更及时、方便、有效,并且节约很多的人力,因此把语音识别系统应用在智能楼宇控制网络中,是非常有前景和价值的。

9

6 总结

通过半学期的DSP课程的学习,了解了和掌握的更多这方面的知识,经过本次设计让我对DSP的软件控制编程和硬件仿真与应用更加了解了,它是用C语言和汇编语言混合方式编程,实现语音采集、模数转换等一系列功能的,在编写程序时要严格遵循计算机的C语言规则,否则计算机不会识别并会报错。程序编写中特别是对LED灯的控制,对它是改了又改,特别繁琐。但我也乐此不疲,最终得到了所要的结果,这也都给以后的学习留下了经验和教训。这些也都说明了我在实际动手能力方面还有待加强。总之,通过本次设计我收获颇丰。

语音识别技术(特别是小词汇量的识别)已经达到可以应用到实际的水平,本设计结合智能楼宇控制系统的特点,提出把语音识别技术应用到此控制系统中,丰富了智能楼宇控制系统的协议,也推广了语音识别的应用范围。本系统实现了语音的实时识别,但与仿真识别率仍有一定的差距,产生这种差距的原因有:由于所采用的DSP是定点机,在定标后数据的精度下降;DSP的限制不能采用鲁棒性更强的识别算法在实际应用中,应注意根据DSP芯片的特点,对算法进行优化,使得DSP芯片的性能得到充分的发挥。

专心做自己的事,是一种乐趣,互相交流,是大家一起进步的必要过程。书本上的知识是死的,只有通过实践和具体的实例运用,才能真正掌握知识,取得进步。我想,这些练习和经验都将是我一种宝贵的财富!我会在以后的学习中更加努力,朝着自己的目标不断奋进。

10

6 总结

通过半学期的DSP课程的学习,了解了和掌握的更多这方面的知识,经过本次设计让我对DSP的软件控制编程和硬件仿真与应用更加了解了,它是用C语言和汇编语言混合方式编程,实现语音采集、模数转换等一系列功能的,在编写程序时要严格遵循计算机的C语言规则,否则计算机不会识别并会报错。程序编写中特别是对LED灯的控制,对它是改了又改,特别繁琐。但我也乐此不疲,最终得到了所要的结果,这也都给以后的学习留下了经验和教训。这些也都说明了我在实际动手能力方面还有待加强。总之,通过本次设计我收获颇丰。

语音识别技术(特别是小词汇量的识别)已经达到可以应用到实际的水平,本设计结合智能楼宇控制系统的特点,提出把语音识别技术应用到此控制系统中,丰富了智能楼宇控制系统的协议,也推广了语音识别的应用范围。本系统实现了语音的实时识别,但与仿真识别率仍有一定的差距,产生这种差距的原因有:由于所采用的DSP是定点机,在定标后数据的精度下降;DSP的限制不能采用鲁棒性更强的识别算法在实际应用中,应注意根据DSP芯片的特点,对算法进行优化,使得DSP芯片的性能得到充分的发挥。

专心做自己的事,是一种乐趣,互相交流,是大家一起进步的必要过程。书本上的知识是死的,只有通过实践和具体的实例运用,才能真正掌握知识,取得进步。我想,这些练习和经验都将是我一种宝贵的财富!我会在以后的学习中更加努力,朝着自己的目标不断奋进。

10

本文来源:https://www.bwwdw.com/article/u436.html

Top