简单语音信号的时频特征提取及识别开题报告

 2022-12-07 11:24:27

1. 研究目的与意义

语音信号的发展和研究一直以来都和计算机科学领域密不可分,随着电子技术和计算机的进一步飞跃发展,模拟的语音信号能够实现通过模拟—数字转换器(A/D)进行采样和量化编码,并能在计算机上实现数字信号处理,接下来实现了语音信号的加工和数字化处理,渐渐形成了语音信号的时域分析处理和频域分析处理两大方法。在这些基础上,语音信号处理这门新的学科就应运而生了。

语音信号处理技术的发展体现在生活中的各个方面,其重要性和现实意义也早已超乎大众的想象。目前,语音信号处理技术已经取得了非常大的进展,在计算机接口与人机交互方面应用得最为广泛[1]。其中,最富 前景和挑战性的就是语音识别的技术,该技术在现实生活中已经有了具体的实际应用,其在车载导航、视频监控、网络视讯等人机交互领域有着非常广泛的应用[2]。而其中高性能的连续语音、大词汇量语音识别系统是当前语音识别技术的前沿代表[3];同时,语音信号的准确性识别也是亟待解决的主要任务。

在我国,汉语语音识别研究近年来取得了很大进展。目前清华、北大等各大高校以及中科院等研究单位在大词汇连续语音识别系统上的研究水平已基本接近国际先进指标。同时,国外很多国家也非常重视汉语语音识别的研究。苹果、IBM、微软、摩托罗拉等公司也相继开始研发汉语语音的识别的软件程序,欧美、日本等发达国家地区聚集了一批来自世界各地的顶尖科研人员,在中国设立了专门研究汉语语音的机构,大大推动了汉语的国际地位。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 研究内容与预期目标

主要研究内容:

本课题研究语音信号的典型特征参数提取方法,并利用合适的模式识别或机器学习算法对简单的语音信号进行分类和识别。目前,主流的特征参数有时域特征参数和频域特征参数等,训练模型主要有高斯混合模型(Gaussian Mixture Model, GMM)和隐马尔可夫模型(Hidden Markov Model),即GMM-HMM 模型。

我们可以采用MATLAB软件或者Python语言来编写程序,从而对语音信号进行特征提取,达到简单的语音识别的目的。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 研究方法与步骤

研究方法:

MFCC[9](Mel 倒谱系数)很形象地模拟了人的听觉特性,是一种符合人类听觉特性的语音特征参数。在对语音信号的预处理之后,我们将提取语音信号的特征参数,一般情况下,我们将语音信号的特征参数分为两类:第一类是时域特征参数,通常情况下,一帧语音信号中的各个时域采样将直接构成一个参数矢量,第二类是变化域特征参数,目前,最常用的特征参数是为频域。

针对各使用者对规定语句或关键词的发音进行特征分析,提取说话人语音特征矢量的时间序列。然后利用从左到右HMM建立这些时间序列的声学模型。

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 参考文献

[1]赵力. 语音信号处理.北京:机械电子工业出版, 2003.

[2]韩志艳, 伦淑娴, 王健. 语音信号鲁棒特征提取及可视化技术研究. 沈阳:东北大学出版社, 2012.

[3]Olson H,Belar H,Phonetic Typewriter[J].Acoust.Soc.Am,1956,28(6),1072-1081

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

5. 工作计划

序号起讫日期 工作内容

1、2022.3.5-2022.4.5:充分查阅相关资料,撰写并修改完成开题报告;

2、2022.4.6-2022.4.25:深入研究无线局域网协议的相关内容,利用C语言编程或者抓包软件实现RSS强度信息获取的基本功能;

剩余内容已隐藏,您需要先支付 1元 才能查看该篇文章全部内容!立即支付

以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。