1. 研究目的与意义
随着科学技术的不断发展,语音识别技术的出现,使人类的这一理想得以实现。
语音识别技术就是让机器通过识别和理解把语音信号转变为相应的文本或命令的高技术。
语音识别正逐步成为信息技术中人机接口的关键技术,语音识别技术与语音合成技术的结合,语音技术的应用已经成为一个具有竞争性的新兴高技术产业。
2. 课题关键问题和重难点
本课题主要是对语言种类进行检测,将检测结果报告出来。
具体工作内容安排如下:语言种类数据的分类及前期特征提取。
语言种类相关语料的收集;语言种类相关语料的分类;语言种类相关语料的标注;根据标注语料对语音语料进行语音激活检测(voice activity detection ,VAD);对语料进行预加重、分帧及加窗处理;将每一帧数据进行相关特征提取;提取每一帧的能量作为特征参数;对数据进行特征选取;对相关特征进行组合。
3. 国内外研究现状(文献综述)
近年来,隐马尔可夫模型(HMM)在语音信号处理上得到了广泛应用。
由于HMM既能用短时模型状态解决声学特性相对稳定段的描述,又能用状态转移规律刻画稳定段之间的时变过程,所以能统计地吸收人声的发音特性和时间上的变动。
因此,在现有多种不同的说话人识别模型中,HMM已成为目前最佳的说话人识别处理模型。
4. 研究方案
语言种类识别系统一般由预处理、特征提取、建立模型、模式匹配、判决等部分组成,其系统组成框图如图所示:1.预处理:预处理,包括采样、量化、去掉无声段和噪声、归一化、预加重、加窗等。
经过预处理滤除掉各种噪声和干扰,提升信号中的高频部分,并进行端点检测,去掉非语音帧,为特征参数提取提供有效的语音段。
2.特征提取:特征提取就是提取能够有效表征语言种类特征的参数。
5. 工作计划
第一周:查找文献资料,对基于HMM法的语言种类识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于HMM法的语言种类识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于HMM法的语言种类识别软件部分;第八周:实现基于HMM法的语言种类识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;
