收藏到会员中心

文档题目:

基于CNN模型的语音识别方法研究

基于CNN模型的语音识别方法研究
上传会员: AH0de16
提交日期: 2023-02-07 20:40:25
文档分类: 计算机设计
浏览次数: 9
下载次数: 0
下载地址: 点击标题下载 基于CNN模型的语音识别方法研究 (需要:40 积分)  如何获取积分?
下载提示: 不支持迅雷等下载工具,请右键另存为下载,或用浏览器下载。不退出登录1小时内重复下载不扣积分。
文档介绍: 以下为文档部分内容,全文可通过注册成本站会员下载获取。也可加管理员微信/QQ:17304545代下载。
文档字数: 9745
摘要
语言是人类之间交流信息的主要手段之一,自电脑发明以来,人们就一直致力于电脑能够理解自然语言。语音识别技术是集声学、语音学、语言学、计算机、信息处理和人工智能等诸领域的一项综合技术,应用需求十分广阔,长期以来一直是人们研究的热点。
神经网络是现代科学研究成果的基础上提出来的模拟人脑结构机制的一门新兴科学,它模拟了人类神经元活动的原理,具有自学习、联想、对比、推理和概括能力,为很好地解决语音识别这样一个复杂的模式分类问题提供了新的途径。
近年来,随着社会生活水平的不断提高,人们对机器智能人声识别的要求越来越高。高斯混合—隐马尔可夫模型(Gaussian of mixture-hidden Markov model,GMM-HMM)是说话人识别研究领域中重要的模型。由于该模型对于大语音数据的建模能力不是很好,对噪声的顽健性也比较差,模型的发展遇到了瓶颈。为了解决该问题,研究者开始关注深度学习技术。引入了CNN深度学习模型研究连续语音说话人识别的问题,并提出了CNN连续说话人识别(continuous speaker recognition of convolutional neural network,CSR-CNN)算法。模型提取固定长度、符合语序的语音片段,形成时间线上的有序语谱图,通过CNN提取特征序列,经过奖惩函数对特征组合进行连续测量。实验结果表明,CSR-CNN算法在连续一片段说话人识别领域取得了比GMM-HMM更好的识别效果。

关键词 连续语音;语谱图;CSR-CNN;深度学习

目录
摘要 I
引言 4
第1章 绪论 5
1.1研究背景和意义 5
1.2国内外研究现状 5
第2章 语音识别技术难点 7
2.1适应性 7
2.2建模 7
2.3语义识别 7
2.4商品化 7
第3章 卷积神经网络理论 8
3.1CNN(卷积神经网络) 8
3.1.1卷积层 8
3.1.2线性整流层 10
3.1.3池化层 11
3.1.4全连接层 11
3.2语音识别的基本原理 11
3.2.1特征提取 11
3.2.2模式匹配 12
第4章  CNN在智能语音中的实现 13
4.1CNN在智能语音中的实现 13
4.2实验与结果分析 13
4.2.1 实验数据准备 13
4.2.2 训练测试数据安排 14
4.2.3 特征提取 14
4.2.4 声学模型训练 14
4.2.4.1 深度神经网络结构 14
4.2.4.2 卷积神经网络结构 14
4.2.5 系统评价 14
4.2.6 实验结果 14
4.2.7 实验分析 15
4.2.8 结论 15
4.3 CNN的优势 15
参考文献 17


(本文由word文档网(www.wordocx.com)会员上传,如需要全文请注册成本站会员下载)

热门文档下载

相关文档下载

上一篇基于android的手机安全管家App 下一篇基于Cocos2dx的《2048》游戏开发

相关栏目

最新文档下载

推荐文档下载