1. 研究目的与意义
现代社会的发展十分迅速,日新月异,我们的生活随着科技的改变发展也变得越来越便捷。
随着我国人口红利的消失,劳动人口及劳动成本的增加,需要更多的机器来替代本属于人的工作,不仅可以节约劳动成本,而且也可以提高工作的效率。
现在手机上也有很多语音识别的功能;比如说:苹果的siri,小米的小爱同学等等,这些都是人工智能,它们是属于语言类的人工智能;人工智能在当今社会扮演有着很重要的角色,未来的发展方向也朝着人工智能的方向迈进。
2. 课题关键问题和重难点
1数字资源缺乏:数字资源相对缺乏,没有公认的标准数据库,各方面的研究都属于初级阶段。
2误识率比较高:在部分研究中,语种的识别误识率很高,特别是在嘈杂的环境中,在无噪的理想环境下取得了令人满意的识别效果;然而在噪声的环境中其性能急剧降低,严重限制了这项识别技术走向现实的应用。
3鲁棒性不是很好:目前音频数据的规模庞大且呈指数增长趋势,,人工无法完成接近海量的识别和标注任务;并且没有办法完成灵活的个性化识别和检索任务,一些个性化检索任务无法通过简单的文字检索来实现。
3. 国内外研究现状(文献综述)
语音情感识别方面的研究工作今年得到了较大的发展,在很多的领域得到了广泛的运用;比如说在极限的环境下,在儿童孤独症的治疗中,汉语语音识别方面,语音情感价值都有着很大的科研价值。
核方法模式识别领域得到了广泛的运用,本文基于单核的思想,对高斯径向核函数的参数进行优化,得到较为合理的核函数,用于多核学习中基核的构造,进而采取多核学习的思想,对于语音情感分类器进行优化,得到合适的核矩阵的组合,用在情感识别中。
方法分为两种1根据语音情感特征样本使用高斯径向基核函数,并得到最优高斯核函数的参数a。
4. 研究方案
随着隐马尔科夫模型与高斯混合模型的理论成熟,其应用于语音信号处理成为了可能。
随着语音识别技术的实用化,隐马尔科夫模型和高斯混合模型得到不断改进与完善,因此,在语种识别领域使用HMM与GMM更是如虎添翼。
在语种识别处理中,研究人员通常用高斯混合模型或者拉普拉斯混合模型(Laplacian Mixture Model)等复杂模型对语音信号的分布进行拟合。
5. 工作计划
第一周:查找文献资料,对基于GMM法的语言种类识别技术有个大体的了解;第二周:对课题中涉及的知识作深入掌握,掌握参数分析方法、基于高斯混合模型(GMM)法的语言种类识别技术等;第三周:制定研究计划,写开题报告;第四周:学习程序语言以及编程方法;第五周:练习编程;第六周:实现参数分析方法软件部分;第七周:实现基于GMM法的语言种类识别软件部分;第八周:实现基于GMM法的语言种类识别方法软件部分;第九周:实现系统软件联调的主要功能;第十周:实现软件的可视化界面;第十一周:程序修改和完善,结果分析;第十二周:写论文以及准备答辩;第十三周:写论文以及准备答辩;第十四周:验收程序,进行毕业设计答辩;
