基于条件随机场的稳健口语理解研究

Research on Robust Spoken Language Understanding based on Conditional Random Fields

下载PDF

导出

摘要语音识别性能的不理想造成的识别错误以及不符合文法的口语输入往往造成口语理解性能下降.针对这个问题,提出一种改进口语理解稳健性的方法.该方法通过在训练数据集中人工加入错误文本噪声进行语料扩充,再进行条件随机场口语理解模型训练,用得到的模型对具有噪声的未知数据集进行口语理解.实验结果表明该方法能提高口语理解的稳健性,较未加入噪声训练得到的模型在准确率、召回率及F1值上都有显著的提高. The performance of natural language understanding is often degraded by undesirability speech recognition errors and ill-formed inputs in spoken language. A new method for robust spoken language understanding based on conditional random fields is proposed. Erroneous texts are artificially added in the training data for corpus expansion to train the model parameters of conditional random fields, the model is applied to the unknown data sets with noise for spoken language understanding. Experimental results show the proposed method can improve the robustness of spoken language understanding. Significant precision, recall and Fl-score improvements can be obtained compared with the model trained on clean spoken text database.

作者程露红黄浩马平

机构地区新疆大学信息科学与工程学院

出处《新疆大学学报（自然科学版）》 CAS 北大核心 2016年第1期88-93,共6页 Journal of Xinjiang University(Natural Science Edition)

基金国家自然科学基金(61365005 60965002)

关键词口语对话系统口语理解条件随机场稳健性 spoken dialogue system Spoken Language Understanding（SLU） Conditional Random Fields（CRF） robustness

分类号 TP317.52 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献10

1Wang Y Y, Yu D, Ju Y C, et al. An introduction to voice search[J]. Signal Processing Magazine, IEEE, 2008, 25(3): 28-38. 被引量：1
2吴尉林,陆汝占,段建勇,刘慧,高峰,陈玉泉.基于两阶段分类的口语理解方法[J].计算机研究与发展,2008,45(5):861-868. 被引量：3
3Minker W, Bennacef S, Gauvain J. A stochastic case flame approach for natural language understanding [C]//Spoken Language, 1996. ICSLP 96. Proceedings., Fourth International Conference on. IEEE, 1996, 2: 1013-1016. 被引量：1
4Deng Y, Xu B, Huang T.Chinese spoken language understanding across domain[C].Sixth International Conference on Spoken Language Processing. 2000, 1:230- 234. 被引量：1
5Lafferty J,McCallum A,Pereira F. Conditional random fields: Probabilistic models for segmenting and labeling sequence data[C]//Proc of the 18th Int Conf on Machine Learning. San Francisco. CA: Morgan Kaufmann, 2001:282-289. 被引量：1
6迟呈英,于长远,战学刚.基于条件随机场的中文分词方法[J].情报杂志,2008,27(5):79-81. 被引量：11
7张朝胜,郭剑毅,线岩团,余正涛,雷春雅,王海雄.基于条件随机场的英文产品命名实体识别[J].计算机工程与科学,2010,32(6):115-117. 被引量：13
8于江德,葛彦强,余正涛.基于条件随机场的汉语词性标注[J].微电子学与计算机,2011,28(10):63-66. 被引量：6
9袁金仕..Viterbi算法：分析与实现[D].国防科学技术大学,2004:
10Nocedal J, Wright S J. Numerical Optimization[M]. Springer,1999. 被引量：1

二级参考文献41

1刘非凡,赵军,吕碧波,徐波,于浩,夏迎炬.面向商务信息抽取的产品命名实体识别研究[J].中文信息学报,2006,20(1):7-13. 被引量：47
2周文帅,冯速.汉语分词技术研究现状与应用展望[J].山西师范大学学报（自然科学版）,2006,20(1):25-29. 被引量：16
3周俊生,戴新宇,尹存燕,陈家骏.基于层叠条件随机场模型的中文机构名自动识别[J].电子学报,2006,34(5):804-809. 被引量：112
4冯冲,陈肇雄,黄河燕,张亮,王江伟.基于条件随机域的复杂最长名词短语识别[J].小型微型计算机系统,2006,27(6):1134-1139. 被引量：16
5洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
6姜维,王晓龙,关毅,赵健.基于多知识源的中文词法分析系统[J].计算机学报,2007,30(1):137-145. 被引量：29
7Sutton C,McCallum A,Rohanimanesh K.Dynamic Conditional Random Fields:Factorized Probabilistic Models for Labeling and Segmenting Sequence Data[J].The Journal of Machine Learning Research,2007,8(3):693-723. 被引量：1
8The ACE 2008 Evaluation Plan.Assessment of Detection and Recognition of Entities and Relations Within and Across Documents[EB/OL].[2008-08-08].http:/ /www.Itl.nist.gov/iad/mig//tests/ace/ace08/doc/ace08-evalplan.v1.2d.pdf. 被引量：1
9廖先桃.CRF理论、工具包的使用及在NE上的应用[EB/OL].[2008-04-02].http://ir.hit.edu.cn/phpwebsite/. 被引量：2
10Wallach H.Efficient Traning of Conditional Random Fields[EB/OL].[2009-06-20].http:www.cogsci.ed.ac.uk. 被引量：1

共引文献28

1李月伦,常宝宝.基于最大间隔马尔可夫网模型的汉语分词方法[J].中文信息学报,2010,24(1):8-14. 被引量：8
2康旭珍,李茹,李双红.框架元素语义核心词自动识别研究[J].中文信息学报,2011,25(4):115-121. 被引量：1
3宋立峰.中文分词算法在专利文献中的应用研究[J].海峡科学,2011(7):9-11. 被引量：5
4姜文志,顾佼佼,丛林虎.CRF与规则相结合的军事命名实体识别研究[J].指挥控制与仿真,2011,33(4):13-15. 被引量：18
5姜文志,顾佼佼,胡文萱,栗飞.条件随机场模型的应用研究及改进[J].计算机与现代化,2011(11):55-58. 被引量：3
6王昌厚.基于条件随机场的中文命名体识别[J].福建电脑,2012,28(2):89-89. 被引量：2
7陆伟,鞠源,张晓娟,吴丹.产品命名实体特征选择与识别研究[J].图书情报知识,2012,29(3):4-12. 被引量：13
8袁里驰.基于改进的隐马尔科夫模型的词性标注方法[J].中南大学学报（自然科学版）,2012,43(8):3053-3057. 被引量：15
9黄诗琳,郑小林,陈德人.针对产品命名实体识别的半监督学习方法[J].北京邮电大学学报,2013,36(2):20-23. 被引量：15
10谷川,周宏宇,于江德.融合多特征的中文产品命名实体识别[J].科学技术与工程,2013,21(31):9417-9421. 被引量：7

1Tur,徐为群.口语理解从语音中抽取语义信息的系统[J].国外科技新书评介,2011(10):19-19.
2张蕤,孙甲松.基于逻辑回归的口语理解方法研究[J].信息技术,2016,40(4):92-95.
3张蓉.计算机上的汉字口语输入[J].微型计算机,1990(1):64-65.
4晓风.联合文头的两种做法[J].软件指南,2003(6):41-41.
5郭群,李剑锋,陈小平,胡国平.一种面向移动终端的自然口语任务理解方法[J].计算机系统应用,2013,22(8):124-129. 被引量：1
6张成,陆汝占.统计与规则结合的问句理解[J].计算机应用与软件,2008,25(6):135-137.
7李艳玲,颜永红.中文口语理解中关键语义类模糊匹配方法的研究[J].小型微型计算机系统,2014,35(9):2182-2186. 被引量：2
8吴尉林,陆汝占,段建勇,刘慧,高峰,陈玉泉.基于两阶段分类的口语理解方法[J].计算机研究与发展,2008,45(5):861-868. 被引量：3
9左云存,宗成庆.基于语义分类树的汉语口语理解方法[J].中文信息学报,2006,20(2):8-15. 被引量：2
10李艳玲,颜永红.中文口语理解弱监督训练方法[J].计算机应用,2015,35(7):1965-1968. 被引量：2

新疆大学学报（自然科学版）

2016年第1期

浏览历史

内容加载中请稍等...

基于条件随机场的稳健口语理解研究

参考文献10

二级参考文献41

共引文献28

相关作者

相关机构

相关主题

浏览历史