基于循环神经网络的汉语语言模型建模方法被引量：5

Recurrent neural network based Chinese language modeling method

下载PDF

导出

摘要语言模型是语音识别系统的重要组成部分,目前的主流是n-gram模型。然而n-gram模型存在一些不足,对语句中长距信息描述差、数据稀疏是影响模型性能的两个重要因素。针对不足,研究者提出循环神经网络(Recurrent Neural Network,RNN)建模技术,在英语语言模型建模上取得了较好的效果。根据汉语特点将RNN建模方法应用于汉语语言建模,并结合两种模型的优点,提出了模型融合构建方法。实验结果表明:相比传统的n-gram语言模型,采用RNN训练的汉语语言模型困惑度(Per PLexity,PPL)有了下降,在对汉语电话信道的语音识别上,系统错误率也有下降,将两种语言模型融合后,系统识别错误率更低。 Language model is an important part in the speech recognition system, the current mainstream technique is n-gram model. However, n-gram language model still has some shortcomings： the first is poorly to describe the long-distance information of a sentence, and the second is to arise the serious data sparse phenomenon; essentially they are the two important factors influencing the performances of the model. Aiming at these defects of n-gram language model, the researchers put forward a recurrent neural network（RNN） modeling technique, with which, the training for the English language model has achieved good results. According to the characteristics of the Chinese language, the RNN method is used for training the Chinese language model; also a model combination method to combine the advantages of the two models is proposed. The experimental results show that： the perplexity of RNN model has a certain decline, there is also a certain decline on the system recognition error rate,and after model combination, the recognition error rate reduces much more on the Chinese phone speech recognition, compared with the n-gram language model.

作者王龙杨俊安陈雷林伟

机构地区中国人民解放军电子工程学院安徽省电子制约技术重点实验室安徽科大讯飞公司

出处《声学技术》 CSCD 北大核心 2015年第5期431-436,共6页 Technical Acoustics

基金国家自然科学基金(60872113) 安徽省自然科学基金(1208085MF94 1308085QF99)资助项目

关键词语音识别循环神经网络语言模型模型融合 speech recognition recurrent neural network language model model combination

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献15

1倪崇嘉,刘文举,徐波.汉语大词汇量连续语音识别系统研究进展[J].中文信息学报,2009,23(1):112-123. 被引量：39
2杨云升,温晓杨,吕敏.一种基于BP神经网络的语音相空间客观干扰效果评估模型[J].声学技术,2009,28(4):507-511. 被引量：1
3陈存宝,赵力.嵌入时延神经网络的高斯混合模型说话人辨认[J].声学技术,2010,29(3):292-296. 被引量：4
4XU Wei, AlexRudnicky. Can artificial neural networks learn lan- guage modelsT[C]// Proceedings of International Conference on Spoken Language Processing. 2000. 被引量：1
5Bengio Yoshua. A neural probabilisfic language model[J]. Journal of Machine Learning Research, 2003, 10(3): 1137-1155. 被引量：1
6Tom'aVs Mikolov. Statistical language models based on neural networks[D]. Brno University of Technology, Czech Republic, 2012. 被引量：1
7甘海波..语音识别系统中声学层模型的研究[D].哈尔滨工业大学,2008:
8张强..大词汇量连续语音识别系统的统计语言模型应用研究[D].西南交通大学,2009:
9邢永康,马少平.统计语言模型综述[J].计算机科学,2003,30(9):22-26. 被引量：37
10Mikolov T, Karafi'at M, Burget L, et al. Recurrent neural network based language model[C]// Proceedings of Interspeech, 2010: 1045-1048. 被引量：1

二级参考文献118

1蔡镜,陈晓,包元晖.基于模糊神经网络的单兵装备效能评估专家系统[J].计算机工程与科学,2005,27(6):98-101. 被引量：4
2钱跃良,林守勋,刘群,刘宏.2005年度863计划中文信息处理与智能人机接口技术评测回顾[J].中文信息学报,2006,20(B03):1-6. 被引量：4
3Zhang, B., S. Matsoukas and R. Schwartz. Discrimina tively trained region dependent teature transforms for speech recognition [C]// Proc. ICASSP, Vol. 1-13, 2006: 313-316. 被引量：1
4Beyerlein, P., et al., Large vocabulary continuous speech recognition of Broadcast News - The Philips/ RWTH approach[J]. Speech Communication, 2002, 37(1-2): 109- 131. 被引量：1
5Hain, T., et al., Automatic transcription of conversational telephone speech [C]// IEEE Transactions on Speech and Audio Processing, 2005, 13(6): 1173-1185. 被引量：1
6Zhang, B. and S. Matsoukas, Minimum phoneme error based heteroscedastic linear discriminant analy sis for speech recognition[C]// Proc. ICASSP, Vol. 1-5, 2005: 1925-1928. 被引量：1
7Hirsimaki, T., et al., Unlimited vocabulary speech recognition with morph language models applied to Finnish[J]. Computer Speech and Language, 2006, 20(4) : 515-541. 被引量：1
8Odell, J.J., The Use of Context in Large Vocabulary Speech Recognition[D]. 1995, University of Cambridge :Cambridge 被引量：1
9Young, S.J., J.J. Odell, and P. C. Woodland. Tree-Based State Tying for High Accuracy Modelling [C]// Proceedings ARPA Workshop on Human Language Technology. 1994. 被引量：1
10Xu, B., et al., Integrating tone information in continuous Mandarin recognition[C]// Proc. ISSPIS, 1999. 被引量：1

共引文献81

1王思丽,祝忠明.机构知识库相关性检索机制研究与试验[J].情报科学,2020,0(2):94-101. 被引量：1
2董云耀,钱如栏.一种改进的基于隐马尔可夫的信息检索模型[J].杭州电子科技大学学报（自然科学版）,2009,29(4):46-49. 被引量：1
3荣传振,岳振军,贾永兴,王渊,杨宇.唇语识别关键技术研究进展[J].数据采集与处理,2012,27(S2):277-283. 被引量：4
4吴晓春,吴娴,朱巧明.一个语言模型压缩方法的研究与实践[J].苏州大学学报（工科版）,2008,28(3):16-20. 被引量：1
5刘政怡,樊庆林,吴建国,李炜.基于输入法的通用存储结构[J].计算机工程与设计,2008,29(17):4554-4558.
6刘政怡,吴建国,李炜.基于整句输入法的状态空间模型[J].计算机工程与应用,2008,44(30):153-156. 被引量：2
7吴晓春,吴娴,李培峰,朱巧明.基于分组的次数与规则剪枝相结合的语言模型压缩方法研究[J].计算机工程与科学,2008,30(11):129-133.
8杜晓杰,张楠,魏蓉,齐丙辰.自然语言理解策略——中文语义分析及LSF随机化句法分析模型与应用[J].天津师范大学学报（自然科学版）,2008,28(4):73-76. 被引量：1
9刘丹,方卫国,周泓.二元语法中文分词数据平滑算法性能研究[J].计算机工程与应用,2009,45(17):33-36. 被引量：4
10张威.口译语料库的开发与建设:理论与实践的若干问题[J].中国翻译,2009,30(3):54-59. 被引量：48

同被引文献26

1薛化建,董兴华,周喜,吐尔洪.吾司曼,李晓.基于子字单元的维吾尔语语音识别研究[J].计算机工程,2011,37(20):208-210. 被引量：5
2张小燕,宿建军,薛化建,王磊.维吾尔语语音识别语料库中的OOV研究[J].计算机工程与设计,2012,33(2):772-776. 被引量：4
3米日古力.阿布都热素,艾克白尔.帕塔尔,艾斯卡尔.艾木都拉.基于电话语料的维吾尔连续音素识别[J].通信技术,2012,45(7):54-56. 被引量：4
4张晴晴,刘勇,王智超,潘接林,颜永红.卷积神经网络在语音识别中的应用[J].网络新媒体技术,2014,3(6):39-42. 被引量：15
5陈翠平.基于深度信念网络的文本分类算法[J].计算机系统应用,2015,24(2):121-126. 被引量：43
6李慧.词语相似度算法研究综述[J].现代情报,2015,35(4):172-177. 被引量：17
7王龙,杨俊安,陈雷,林伟,刘辉.基于循环神经网络的汉语语言模型并行优化算法[J].应用科学学报,2015,33(3):253-261. 被引量：7
8其米克.巴特西,黄浩,王羡慧.基于深度神经网络的维吾尔语语音识别[J].计算机工程与设计,2015,36(8):2239-2244. 被引量：13
9江国荐,顾乃杰,张旭,任开新.基于SAE-LBP的网页分类研究[J].小型微型计算机系统,2016,37(4):738-742. 被引量：4
10张剑,屈丹,李真.基于循环神经网络语言模型的N-best重打分算法[J].数据采集与处理,2016,31(2):347-354. 被引量：3

引证文献5

1王敏,曾浩.循环神经网络语言模型定点化优化算法研究[J].软件导刊,2017,16(2):63-66. 被引量：1
2骆聪,周城.基于改进的n-gram模型的URL分类算法研究[J].计算机技术与发展,2018,28(9):38-41. 被引量：2
3江逸琪,赵彤洲,柴悦,高佩东.基于BiLSTM-CRF的体育新闻主题词抽取方法[J].武汉工程大学学报,2020,42(1):102-107.
4梁翀,刘迪,浦正国,张彬彬.一种基于前馈序列记忆神经网络的改进方法[J].山东农业大学学报（自然科学版）,2021,52(2):313-315. 被引量：2
5穆凯代姆罕·伊敏江,艾斯卡尔·艾木都拉,米吉提·阿不里米提.基于CNN-HMM和RNN的维吾尔语语音识别[J].现代电子技术,2021,44(11):172-176. 被引量：3

二级引证文献8

1龚永罡,田润琳,廉小亲,夏天.基于MapReduce的三元N-gram算法的并行化研究[J].电子技术应用,2019,45(5):70-73. 被引量：6
2李帆,程云章,边俊杰,耿晓斌.基于PPG信号的LSTM网络同步动脉血压预测[J].软件导刊,2020,19(8):44-48. 被引量：10
3朱琪.基于网络爬虫的舆情分析预警系统设计[J].电子设计工程,2020,28(22):56-60. 被引量：10
4贾嘉敏,潘文林.基于改进Inception-ResNet_v2的低资源少数民族语音识别[J].软件导刊,2022,21(8):51-55. 被引量：2
5杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：4
6吴峰,谢聪,姬少培.基于双流LSTM神经网络的股价趋势预测[J].应用科学学报,2023,41(2):344-358. 被引量：3
7王馨悦,周小天.基于人机交互增强算法的便携语言翻译机系统研究[J].自动化与仪器仪表,2023(4):220-224. 被引量：2
8王晓丹,谢先明,李活.基于改进DFSMN模型的语音交互服务系统设计[J].自动化与仪器仪表,2024(1):150-154.

1曲卫民,张俊林,孙乐.基于主题的汉语语言模型的研究[J].计算机研究与发展,2003,40(9):1368-1374. 被引量：3
2张俊林,孙乐,孙玉芳.一种改进的基于记忆的自适应汉语语言模型[J].中文信息学报,2005,19(1):8-13. 被引量：1
3肖镜辉,王晓龙,刘秉权.一种基于相似度的汉语语言模型平滑技术及其在音字转换中的应用[J].高技术通讯,2006,16(2):127-132.
4谢振斌.汉语特点与拼音文字[J].中文信息,1993(3):34-35.
5王鉴全,季绍波.基于关联规则的自动构词算法研究[J].计算机科学,2014,41(11):256-259. 被引量：3
6卢先宁,高泽华,高峰.Web日志挖掘中的会话识别技术研究[J].数据通信,2012(4):19-21.
7来自百度的电子阅读器——百度阅读器[J].电脑知识与技术（经验技巧）,2012(3):15-15.
8陈立,杨健.器件优选信息系统设计方案[J].中国科技博览,2012(31):348-348.
9杨琳,张建平,颜永红.特定领域的汉语语言模型平滑算法比较研究[J].计算机工程与应用,2006,42(32):14-16. 被引量：5
10王龙,杨俊安,刘辉,陈雷,林伟.基于RNN汉语语言模型自适应算法研究[J].火力与指挥控制,2016,41(5):31-34. 被引量：4

声学技术

2015年第5期

浏览历史

内容加载中请稍等...

基于循环神经网络的汉语语言模型建模方法被引量：5

参考文献15

二级参考文献118

共引文献81

同被引文献26

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络的汉语语言模型建模方法 被引量：5

参考文献15

二级参考文献118

共引文献81

同被引文献26

引证文献5

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于循环神经网络的汉语语言模型建模方法被引量：5