语音的清浊静音判决算法研究

语音的清浊静音判决算法研究 原文链接:http://www.51jrft.com/dzxx/dzkxyjs/584.html
,端点检测在语音信号处理中占有十分重要的地位,直接影响着系统的性能。因此本文在系统分析多种端点检测算法的优劣性的前提下,对其中两种经典方法进行了深入研究和系统对比。具体而言,本文首先对语音信号进行了时域分析,提炼其中的基本信息—短时能量、短时过零率、短时自相关系数、线性预测系数以及预测误差系数,并在此基础上利用双门限法和基于Bayes后验统计估计的方法对其进行端点检测;其次,结合大量数据对两种方法进行了实验对比,并从实验结果和理论特性两个方面进行评判分析。最终结果表明:基于Bayes的统计方法的效果比双门限法更加优异,特别是对原始较差音质的语音也有很好的区分和判决能力。 HM000091
关键词 语音端点检测;语音信号处理;双门限;Bayes
1.3 MATLAB软件平台介绍
MATLAB是由美国mathworks公司发布的主要面对科学计算、可视化以及交互式程序设计的高科技计算环境。它将数值分析、矩阵计算、科学数据可视化以及非线性动态系统的建模和仿真等诸多强大功能集成在一个易于使用的视窗环境中,为科学研究、工程设计以及必须进行有效数值计算的众多科学领域提供了一种全面的解决方案,并在很大程度上摆脱了传统非交互式程序设计语言(如C、Fortran)的编辑模式,代表了当今国际科学计算软件的先进水平。MATLAB强大的数值分析和计算结果可视化功能使MATLAB表现出出色的信号处理能力[7]。
1.3.1 MATLAB开发环境
MATLAB开发环境是一套方便用户使用的MATLAB函数和文件工具集,其中许多工具是图形化用户接口。它是一个集成的用户工作空间,允许用户输入输出数据,并提供了M文件的集成编译和调试环境,包括MATLAB桌面、命令窗口、M文件编辑调试器、MATLAB工作空间和在线帮助文档[22]。
随着MATLAB的商业化以及软件本身的不断升级,MATLAB的用户界面也越来越精致,更加接近Windows的标准界面,人机交换很强,操作更简单。而且新版本的MATLAB提供了完整的联机查询、帮助系统,极大的方便了用户的使用。简单的编程环境提供了比较完备的调试系统,程序不必经过编译就可以直接运行,而且能够及时地报告出现的错误及进行出错原因分析。
1.3.2语音信号处理常用函数
(1) wavread()函数:读取语音文件(文件头为.wav)
(2) abs()函数:求绝对值
(3) size()函数:求数组的尺寸
(4) max()函数:求最大值
(5) regress()函数:求线性回归的各种参数
(6) fft()函数:对变量进行傅里叶变换
(7)length()函数:求变量长度
(8)zeros()函数:产生全零矩阵
(9)enframe()函数:对语音信号分帧
3.2.2语音数据训练部分
在这部分我们将描述一个通过对语音的每一帧进行判断其清浊静音的算法,这个算法的讨论是建立在一个五维的高斯分布的基础上的,并且X=[x1,x2,x3,x4,x5]五个参数可以通过短时分析提取,其中x1是语音信号的短时能量,x2是语音信号的短时过零率,x3是短时子相关系数,x4是p阶线性预测器的第一个预测系数,x5是归一化的预测误差。X被称为特征向量,用来对语音的每一帧进行清浊静音判定。这五个参数的选择取决于在不同语音录制环境下他们对清浊静音的辨别能力,这五个参数通过对语音加帧长L=400,帧移R=100的矩形窗求得。这五个参数的求解公式在之前已经介绍过,通过其求解每一帧的各个参数即可。
语音数据训练的基本步骤如下:
1、用人耳辨别和观察语音波形将这些语音的清浊静音部分分别保存,形成三类语音数据。
2、通过训练模型对这三类声音分别求它们的x1,x2,x3,x4,x5五个参数各自的柱状分布图
3、然后再用MATLAB的curve fitting工具中的cftool函数高斯函数模拟这些柱状分布图,分别记录它们的高斯分布平均值和方差。
3.2.3语音数据检测部分
对于语音三种判断结果我们分别用w1,w2,w3表示,其中w1表示浊音,,w2表示清音,w3表示静音。之前已经通过高斯模型求出了三种语音的高斯密度分布,均值用Mi表示,方差用Wi表示,则有[4]

摘要 I
ABSTRACT II
第1章 绪论 - 1 -
1.1 引言 - 1 -
1.2 课题简介 - 1 -
1.2.1课题研究背景与发展现状 - 1 -
1.2.2课题的主要内容 - 3 -
1.3 MATLAB软件平台介绍 - 3 -
1.3.1 MATLAB开发环境 - 3 -
1.3.2语音信号处理常用函数 - 4 -
第2章 语音基本知识 - 5 -
2.1语音信号的数学模型 - 5 -
2.2语音信号的预处理 - 6 -
2.3语音信号的滤波处理 - 7 -
2.4语音信号的短时分析 - 8 -
第3章 语音的清浊静音判决理论分析 - 12 -
3.1 双门限法实现的语音端点检测 - 12 -
3.2 Bayes法实现的语音端点检测 - 13 -
3.2.1 Bayes基本理论部分 - 13 -
3.2.2语音数据训练部分 - 17 -
3.2.3语音数据检测部分 - 17 -
第4章 编程实现与仿真结果 - 19 -
4.1 双门限法的变成实现与仿真结果 - 19 -
4.1.1具体实现 - 19 -
4.1.2仿真结果 - 22 -
4.2 Bayes法的编程实现与仿真结果 - 24 -
4.2.1具体实现 - 25 -
4.2.2仿真结果 - 29 -
4.3两种语音端点检测算法的结果比较 - 36 -
总结 - 37 -
参考文献 - 38 -
致 谢 - 40 -
附录:MATLAB程序源代码 - 41 -
一、双门限法语音端点检测程序部分源代码 - 41 -
二、Bayes法语音端点检测中数据训练程序部分源代码 - 42 -
三、Bayes法语音端点检测中端点检测程序部分源代码 - 45 -

上一篇:朴素贝叶斯(Naive Bayes)


下一篇:Naive Bayes(朴素贝叶斯)