语音识别与合成入门4(内有matlab源码)
更新时间:2023-04-24 14:30:01 阅读量: 实用文档 文档下载
- 语音识别与合成技术推荐度:
- 相关推荐
语音识别与合成入门
「音色」(Timber)是一個很模糊的名詞,泛指音訊的內容,例如「天書」這兩個字的發音,雖然都是第一聲,因此它們的音高應該是蠻接近的,但是由於音色的不同,我們可以分辨這兩個音。直覺來看,音色的不同,代表基本週期的波形不同,因此我們可以使用基本週期的波形來代表音色。
若要從基本週期的波形來直接分析音色,是一件很困難的事。通常我們的作法,是將每一個音框進行頻譜分析(Spectral Analysis),算出一個音框訊號如何可以拆解成在不同頻率的分量,然後才能進行比對或分析。在頻譜分析時,最常用的方法就是「快速傅立葉轉換」(Fast Fourier Transform),簡稱 FFT,這是一個相當實用的方法,可以將在時域(Time Domain)的訊號轉換成在頻域(Frequency Domain)的訊號,並進而知道每個頻率的訊號強度。 若要看看 FFT 的實際展示,可以輸入下列指令:
dspstfft_nt (MATLAB 5) dspstfft_win32 (MATLAB 6)
開啟的 Simulink 系統如下:
语音识别与合成入门
當你啟動程式並開始對麥克風說話時,就會出現下列動態的「頻譜圖」(Spectrum),隨時間而呈現急遽的變化:
若將頻譜圖「立」起來,並用不同的顏色代表頻譜圖的高低,就可以得到頻譜對時間所產生的影像,稱為「光譜圖」(Spectrogram),如下:
Spectrogram 代表了音色隨時間變化的資料,因此有些厲害的人,可以由
语音识别与合成入门
Specgrogram 直接看出語音的內容,這種技術稱為 Specgrogram Reading,有興趣的同學,可以在搜尋引擎上找到很多相關的網頁,也可以試試自己的功力。
正在阅读:
高级财务管理期末复习资料11-25
大学生的责任与担当09-24
2022公立黉舍能复读初三吗03-30
旅游地生命周期理论——巴特勒07-23
三相电压型PWM整流器设计发言稿10-28
居住区的人性化设计07-19
2016京考常识-李建英07-30
《推拿手法学》试题及答案11-10
- 教学能力大赛决赛获奖-教学实施报告-(完整图文版)
- 互联网+数据中心行业分析报告
- 2017上海杨浦区高三一模数学试题及答案
- 招商部差旅接待管理制度(4-25)
- 学生游玩安全注意事项
- 学生信息管理系统(文档模板供参考)
- 叉车门架有限元分析及系统设计
- 2014帮助残疾人志愿者服务情况记录
- 叶绿体中色素的提取和分离实验
- 中国食物成分表2020年最新权威完整改进版
- 推动国土资源领域生态文明建设
- 给水管道冲洗和消毒记录
- 计算机软件专业自我评价
- 高中数学必修1-5知识点归纳
- 2018-2022年中国第五代移动通信技术(5G)产业深度分析及发展前景研究报告发展趋势(目录)
- 生产车间巡查制度
- 2018版中国光热发电行业深度研究报告目录
- (通用)2019年中考数学总复习 第一章 第四节 数的开方与二次根式课件
- 2017_2018学年高中语文第二单元第4课说数课件粤教版
- 上市新药Lumateperone(卢美哌隆)合成检索总结报告
- 源码
- 合成
- 语音
- 识别
- 入门
- matlab
- “十三五”重点项目-汽车装饰用品项目节能评估报告(节能专篇)
- 审计跟进经济发展路径
- 福建地税新版金税三期网上申报简要指南
- 孟子卷十一 告子上 原文 译文
- 2014高考政治文化部分一轮复习第三课文化的多样性与文化传播
- 新世纪高等院校英语专业本科生系列教材(修订版)第2版 综合教程3
- 幼儿园中班母亲节教案:《妈妈我永远爱您》-廖小华老师
- 网上商城管理系统需求规格说明书
- 岩土边坡稳定性的刚体有限元上限分析法
- 初中体育实心球教案
- PS鼠绘美女教程实例:绘制漂亮的古典美女
- 银行考试金融专业知识
- 2022部编语文八年级下册期末测试卷(附带答案详解、答题卡、作文
- 玄关处适合挂什么画 玄关装饰画推荐
- 发展经济学期末复习提纲
- 大学生报社实习暑期社会实践报告
- 管家婆手机版-物联管家产品方案
- 无锡市饮用水水源保护办法
- 定子永磁型混合励磁双凸极电机设计、分析与控制
- 郑州伟复环保科技有限公司