基于时域建模的自动语音识别被引量：6

Automatic speech recognition based on time domain modeling

下载PDF

导出

摘要端到端神经网络能够根据特定的任务自动学习从原始数据到特征的变换,解决人工设计的特征与任务不匹配的问题。以往语音识别的端到端网络采用一层时域卷积网络作为特征提取模型,递归神经网络和全连接前馈深度神经网络作为声学模型的方式,在效果和效率两个方面具有一定的局限性。从特征提取模块的效果以及声学模型的训练效率角度,提出多时间频率分辨率卷积网络与带记忆模块的前馈神经网络相结合的端到端语音识别模型。实验结果表明,所提方法语音识别在真实录制数据集上较传统方法字错误率下降10%,训练时间减少80%。 End-to-end neural networks can automatically learn feature transformation from original data,which can solvethe mismatch between hand designed features and specific tasks.The traditional end-to-end neural network for speech recognitionuses a time domain convolution network as the feature extraction model,recurrent neural network and full connectedfeed-forwarddeep neural network as the acoustic model,which has some limitations in performance and efficiency.From the aspects of the performanceof thefeature extraction module and the training efficiency of the acoustic model,anend-to-end speech recognition model combining the multi-time and frequency resolution convolution and the feedforwardneural network with memory modules is proposed.On the real recording test dataset,the proposed method reducesthe word error rate by10%,training time by80%compared with the traditional method.

作者王海坤伍大勇刘江王士进胡国平胡郁 WANG Haikun;WU Dayong;LIU Jiang;WANG Shijin;HU Guoping;HU Yu(Research of IFLYTEK CO., LTD, Hefei 230088, China)

机构地区科大讯飞股份有限公司研究院

出处《计算机工程与应用》 CSCD 北大核心 2017年第20期243-248,共6页 Computer Engineering and Applications

基金国家重点研发计划(No.2016YFC0800806)

关键词卷积神经网络递归神经网络声学模型端到端模型 convolution neural network recurrent neural network acoustic model end-to-end neural network

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献39

1张晴晴,刘勇,潘接林,颜永红.基于卷积神经网络的连续语音识别[J].工程科学学报,2015,37(9):1212-1217. 被引量：70
2潘丽杰,徐本亮,朱琪,王利峰,缪惠根.基于双麦克风降噪技术的语音识别系统[J].现代电子技术,2016,39(2):137-139. 被引量：11
3黄婷,周萍,景新幸,杨青.改进型Mel混合参数应用于说话人识别[J].微电子学与计算机,2016,33(4):60-63. 被引量：2
4陈斌,胡平舸,屈丹.子空间域相关特征变换与融合的语音识别方法[J].西安交通大学学报,2016,50(4):60-67. 被引量：4
5赵彩光,张树群,雷兆宜.基于并行回火改进的GRBM的语音识别[J].计算机工程与应用,2016,52(8):125-129. 被引量：1
6刘丽静.论《普通话培训与测试》教材中朗读作品的句型分析[J].学术论坛,2016,38(4):176-180. 被引量：3
7宋青松,田正鑫,孙文磊,吴小杰,安毅生.用于孤立数字语音识别的一种组合降维方法[J].西安交通大学学报,2016,50(6):42-46. 被引量：9
8邓侃,欧智坚.深层神经网络语音识别自适应方法研究[J].计算机应用研究,2016,33(7):1966-1970. 被引量：15
9周梅.技术视角下普通话水平测试发展研究[J].语言科学,2016,15(3):332-336. 被引量：2
10刘长征,张磊.语音识别中卷积神经网络优化算法[J].哈尔滨理工大学学报,2016,21(3):34-38. 被引量：20

引证文献6

1李山.智能家具语音识别精准度优化仿真[J].计算机仿真,2018,35(11):281-284. 被引量：5
2郑晓琼,汪晓,江海升,樊培培,张超.基于RNN和WFST译码的自动语音识别研究[J].信息技术,2019,43(6):115-120. 被引量：3
3王彦哲,张立民,张兵强,李振宇.改进卷积输入的端到端普通话语音识别[J].计算机工程与应用,2019,55(17):143-149. 被引量：4
4王彦哲,张立民,张兵强,李振宇.基于LFMMI准则的低资源普通话识别改进[J].计算机工程与设计,2019,40(9):2638-2642.
5史晓琴,王晓媛.云平台网络数字化信息自适应识别仿真[J].计算机仿真,2019,36(12):387-390. 被引量：2
6马艳荣.复杂环境下的计算机辅助普通话测试系统设计[J].电子测量技术,2020,43(20):26-30. 被引量：2

二级引证文献16

1胡希颖,王大东,陈佳欣.基于NAO机器人的BLSTM-CTC的声学模型研究[J].智能计算机与应用,2021,11(3):76-79. 被引量：1
2王云霞,董正超.铁磁-d波超导结中的自旋极化隧道谱[J].低温与超导,2000,28(2):58-62. 被引量：1
3李山.智能家居的现状和发展趋势研究[J].工业设计,2019,0(4):152-153. 被引量：8
4田启川,王满丽.深度学习算法研究进展[J].计算机工程与应用,2019,55(22):25-33. 被引量：57
5陈颖,汪功明,杨磊,辛礼兵.语音识别技术在智能家居的应用技术浅析[J].科学技术创新,2019(31):60-61. 被引量：7
6赵康.改进SVM结合决策树的情感语音识别[J].信息技术,2020,44(8):17-22. 被引量：2
7熊先青,李荣荣,白洪涛.中国智能家具产业现状与发展趋势[J].林业工程学报,2021,6(1):21-28. 被引量：59
8于柯远,张立民,闫文君,金堃.基于深度学习的多STBC盲识别算法[J].系统工程与电子技术,2021,43(4):1110-1118. 被引量：3
9潘红丽.基于RNN弱监督网络的英语语义分析技术研究[J].电子设计工程,2021,29(15):97-101. 被引量：4
10王晨霞.普通话计算机智能测试替代人工测试的思考[J].电子技术与软件工程,2021(13):144-145. 被引量：1

1罗东华.浅谈如何提高少儿网球训练效率[J].当代体育科技,2017,7(25):59-60. 被引量：1
2汪璐.深度学习在高能物理领域中的应用[J].物理,2017,46(9):597-605. 被引量：5
3王程,周婉,何军.面向自动音乐生成的深度递归神经网络方法[J].小型微型计算机系统,2017,38(10):2412-2416. 被引量：14
4杨忠鹏,李家悦,韩瑞.利用人工智能技术助力广告风险控制[J].工商行政管理,2017,0(19):23-24.
5张晋芳.改进的带有时滞的耦合神经网络的稳定性分析[J].科技创新导报,2017,14(22):161-162.
6郭腾腾,王丽丹,周梦哲,段书凯.一种基于忆阻激活函数的递归神经网络及其联想记忆[J].中国科学：信息科学,2017,47(9):1226-1241. 被引量：2
7葛瑞,王朝晖,徐鑫,季怡,刘纯平,龚声蓉.基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文）[J].控制理论与应用,2017,34(6):790-796. 被引量：12
8刘再茂.提高小学乒乓球课堂有效性的研究[J].山东教育（小学刊）,2017,0(7):110-111.
9柯海丰,卢诚波,徐卉慧.不平衡超限学习机的全局惩罚参数选择方法[J].哈尔滨工程大学学报,2017,38(9):1444-1449. 被引量：1
10京东智能音箱“叮咚”联手雀巢打造人工智能家庭营养健康助手[J].电脑爱好者,2017,0(20):65-65.

计算机工程与应用

2017年第20期

浏览历史

内容加载中请稍等...

基于时域建模的自动语音识别被引量：6

同被引文献39

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于时域建模的自动语音识别 被引量：6

同被引文献39

引证文献6

二级引证文献16

相关作者

相关机构

相关主题

浏览历史

基于时域建模的自动语音识别被引量：6