语义分析和结构化语言模型被引量：7

Semantic Analysis and Structured Language Models

下载PDF

导出

摘要提出了一个语义分析集成系统,并在此基础上构建了结构化的语言模型.该语义分析集成系统能够自动分析句子中各个词的词义以及词之间的语义依存关系,达到90.85%的词义标注正确率和75.84%的语义依存结构标注正确率.为了描述语言的结构信息和长距离依存关系,研究并分析了两种基于语义结构的语言模型.最后,在中文语音识别任务上测试两类语言模型的性能.与三元语言模型相比,性能最好的语义结构语言模型——中心词三元模型,使绝对字错误率下降0.8%,相对错误率下降8%. An integrated semantic analysis system is presented, and the structured language models are proposed based on it. The semantic analysis system can automatically tag semantic class for each word and analyze the semantic dependency structure between words with the precision of 90.85% and 75.84% respectively. In order to describe sentence structure and long-distance dependency, two kinds of structured language models are examined and analyzed. Finally, these two language models are evaluated on the task of Chinese speech recognition. Experiments show that the best semantic structured language model-headword trigram model-achieves 0.8% absolute error reduction and 8% relative error reduction over the trigram model.

作者李明琴李涓子王作英陆大

机构地区清华大学电子工程系清华大学计算机科学与技术系

出处《软件学报》 EI CSCD 北大核心 2005年第9期1523-1533,共11页 Journal of Software

基金国家高技术研究发展计划(863)~~

关键词语义分析依存分析语言模型语音识别 semantic analysis dependency analysis language model speech recognition

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献14

1梅家驹著..同义词词林[M].上海:上海辞书出版社,1983:762.
2Jelinek F. Self-Organized language modeling for speech recognition. In: Waibel A, Lee KF, eds. Readings in Speech Recognition.San Mateo: Morgan Kaufmann Publishers, 1990. 450-506. 被引量：1
3Brown PF, DellaPietra V J, DeSouza PV, Lai JC, Mercer RL. Class-Based n-gram models of natural language. Computational Linguistics, 1992,18(4).467-479. 被引量：1
4Lau R, Rosenfeld R, Roukos S. Trigger-Based language models: A maximum entropy approach. In: Sullivan BJ, ed. Proc. of the Int'l Conf. on Acoustics, Speech, and Signal Processing (ICASSP), Vol Ⅱ. 1993.45-48. 被引量：1
5Bellegarda JR. A multi-span language modeling framework for large vocabulary speech recognition. IEEE Trans. on Speech Audio Processing, 1998,6(5):456-467. 被引量：1
6Gao JF, Suzuki H, Wen Y. Exploring headword dependency and predictive clustering for language modeling. In: Hajic J,Matsumoto Y, eds. Proc. of the Empirical Methods in Natural Language Processing (EMNLP). 2002. 248-256. 被引量：1
7Chelba C. Exploiting syntactic structure for natural language modeling [Ph.D. Thesis]. Johns Hopkins University, 2000. 被引量：1
8Xu P, Chelba C, Jelinek F. A study on rich syntactic dependencies for structured language modeling. In: Proc. of the 40th Annual Meeting of the Association for Computational Linuistics (ACL). ACL, 2002. 191-199. 被引量：1
9Roark B. Probabilistic top-down parsing and language modeling. Computational Linguistics, 2001,27(2):249-276. 被引量：1
10Gao JF, Suzuki H. Unsupervised learning of dependency structure for language modeling. In: Proc. of the 41st Annual Meeting of the Association for Computational Linguistics (ACL). ACL, 2003. 7-12. http://research.microsoft.com/～jfgao/paper/dlm-ACL03.pdf. 被引量：1

二级参考文献3

1董振东,董强.知网和汉语研究[J].当代语言学,2001,3(1):33-44. 被引量：57
2齐士钤张家禄.汉语普通话辅音音长分析[J].声学学报,1982,(1):8-13. 被引量：17
3王作英.基于段长分布的HMM语音识别模型 [A]..第二届全国汉字汉语识别会议 [C].庐山,1989.9. 被引量：1

共引文献49

1曹剑芬,李爱军,胡方,张利刚.语音学知识在语音识别中的应用:案例分析[J].清华大学学报（自然科学版）,2008,48(S1):748-753. 被引量：3
2林旭东,孙爱东,林丕源,刘汉兴.基于依存关系与支持向量机的中文问题分类方法[J].郑州大学学报（理学版）,2009,41(1):64-68. 被引量：2
3刘敬伟,王作英,肖熙.基于自回归模型的加性噪声环境稳健语音识别[J].清华大学学报（自然科学版）,2006,46(1):50-53. 被引量：2
4陈立伟,张晔.基于改进的隐马尔可夫和神经网络混合模型的语音识别[J].应用声学,2006,25(2):90-95.
5王宏,郭艳丽,贾新民.基于HMM的孤立字识别[J].昌吉学院学报,2006(1):94-98. 被引量：3
6范斐斐,李振波,陈佳品.基于K均值分段的语音识别在微机器人控制系统中的应用[J].电子技术应用,2006,32(5):4-6. 被引量：2
7林旭东,彭宏,郑启伦,陈绍坚.基于Web的中文开放式问题回答系统[J].计算机科学,2006,33(5):211-213.
8赵蕤,王作英.语音识别中信道和噪音的联合补偿[J].声学学报,2006,31(5):466-470. 被引量：11
9贺无名.语音识别技术及其研究进展[J].中国科技信息,2006(18):157-158. 被引量：3
10孙健,王作英.融合段长信息的中、英文语种辨识[J].模式识别与人工智能,2006,19(5):567-571.

同被引文献57

1陈耀东,王挺,陈火旺.浅层语义分析研究[J].计算机研究与发展,2008,45(z1):321-325. 被引量：12
2高思丹,袁春风.语句相似度计算在主观题自动批改技术中的初步应用[J].计算机工程与应用,2004,40(14):132-135. 被引量：47
3龚汉明,周长胜.汉语分词技术综述[J].北京机械工业学院学报,2004,19(3):52-55. 被引量：26
4陆俭明.“句式语法”理论与汉语研究[J].中国语文,2004(5):412-416. 被引量：179
5刘云峰,齐欢,代建民.潜在语义分析在中文信息处理中的应用[J].计算机工程与应用,2005,41(3):91-93. 被引量：18
6许嘉璐.现状和设想——试论中文信息处理与现代汉语研究[J].中国语文,2000(6):490-496. 被引量：37
7肖强,吴伟斌,陈联忠,蒲卫,王伟中,李小华,黄家驹.自由结构录入法在电子病历系统中的应用[J].解放军医院管理杂志,2005,12(3):222-222. 被引量：10
8孟爱国,卜胜贤,李鹰,甘文.一种网络考试系统中主观题自动评分的算法设计与实现[J].计算机与数字工程,2005,33(7):147-150. 被引量：46
9由丽萍,范开泰,刘开瑛.汉语语义分析模型研究述评[J].中文信息学报,2005,19(6):57-63. 被引量：22
10朱嫣岚,闵锦,周雅倩,黄萱菁,吴立德.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006,20(1):14-20. 被引量：326

引证文献7

1于一,廖睿,叶大田.电子病历结构化方法概述[J].北京生物医学工程,2007,26(1):103-106. 被引量：16
2贾电如,李阳明.基于语句结构及语义相似度计算主观题评分算法的研究[J].信息化纵横,2009(5):5-7. 被引量：12
3杨鹤标,陈力.自然语言向SQL代码的转化方法[J].计算机工程,2011,37(23):72-74. 被引量：4
4李迎凯,徐小良.一种改进的基于知网的句子相似度计算方法[J].电子科技,2012,25(7):69-71. 被引量：1
5胡金柱,舒江波,胡泉,杨进才,谢芳,李源.汉语复句关系词自动识别中规则的约束条件研究[J].语言文字应用,2015(1):82-89. 被引量：6
6张睿,于陶静.在线评论特征对消费者购买决策的影响[J].科技与管理,2016,18(6):93-98. 被引量：2
7张钢,杨显华.期刊论文基于互联网的标准化研究与实现[J].计算机应用研究,2017,34(9):2685-2687.

二级引证文献41

1余元龙,杜宜,张淑娟,杨勇.实施电子病历的难点和对策[J].现代医院,2008,8(11):134-136. 被引量：2
2孙沂振,沈云学,唐鹤云.电子病历概述[J].医学信息学杂志,2009,30(3):1-5. 被引量：25
3张燕,高非.电子病案结构和临床辅助决策系统设计[J].中国病案,2009,10(4):28-30. 被引量：5
4梁晓诚,岳晓光,麦范金,赵子强,路英,王挺.基于自然语言处理的主观题评分算法研究[J].昆明理工大学学报（理工版）,2010,35(2):81-84. 被引量：10
5赵晓,刘学锋,王晓霞.编译原理理论在C程序题自动评分系统中的应用[J].陕西科技大学学报（自然科学版）,2010,28(3):135-137. 被引量：3
6田甜,张振国.主观题自动阅卷技术研究[J].计算机工程与设计,2010,31(16):3697-3699. 被引量：13
7麦范金,岳晓光,赵子强,路英,王挺,岳砥柱.基于自然语言处理的智能评分系统[J].桂林理工大学学报,2010,30(3):426-430. 被引量：4
8张燕,高非,游伟程.电子病历——基于病人全集的循证医学临床证据[J].循证医学,2010,10(5):286-289. 被引量：5
9高靖,杨惠祥,王振潮,张双雨.电子病历与医院住院流程再造的关系[J].中国医疗设备,2011,26(1):73-74. 被引量：5
10许陆飞,田禾,雷健波.基于OpenSDE的XML技术在电子病历结构化中的应用[J].中国数字医学,2011,6(5):44-47. 被引量：3

1邱忆,黄世泽.聚类算法在结构化语言模型中的应用[J].电信技术研究,2008(3):26-34.
2郑飞,陆鑫达.异构计算系统的三元模型与性能分析[J].上海交通大学学报,1997,31(8):12-15. 被引量：3
3乔剑敏,张仰森.词义标注一致性检验系统的设计与实现[J].中文信息学报,2010,24(4):44-51. 被引量：3
4徐坤.中文语音识别领域的激战[J].计算机应用文摘,2017,0(1):63-65.
5意法半导体(ST)联手讯飞开放平台提供中文语音识别[J].微型机与应用,2017,36(7):21-21.
6尹继豪,樊孝忠,刘士宁,于江德.一种基于Bootstrapping构建训练语料的方法[J].计算机研究与发展,2007,44(z2):394-397.
7马彬,洪宇,杨雪蓉,姚建民,朱巧明.基于语义依存线索的事件关系识别方法研究[J].北京大学学报（自然科学版）,2013,49(1):109-116. 被引量：15
8林旭东,彭宏,郑启伦,陈绍坚.基于Web的中文开放式问题回答系统[J].计算机科学,2006,33(5):211-213.
9古凌岚,孙素云.基于语义依存的中文本体非分类关系抽取方法[J].计算机工程与设计,2012,33(4):1676-1680. 被引量：7
10苏新春,李安,洪桂治.机用义项库在词义标注中的作用及其完善[J].厦门大学学报（哲学社会科学版）,2010,60(3):137-144. 被引量：9

软件学报

2005年第9期

浏览历史

内容加载中请稍等...

语义分析和结构化语言模型被引量：7

参考文献14

二级参考文献3

共引文献49

同被引文献57

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

语义分析和结构化语言模型 被引量：7

参考文献14

二级参考文献3

共引文献49

同被引文献57

引证文献7

二级引证文献41

相关作者

相关机构

相关主题

浏览历史

语义分析和结构化语言模型被引量：7