基于改进的隐马尔科夫模型的汉语词性标注被引量：10

下载PDF

导出

摘要基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果。

作者王敏郑家恒

机构地区山西大学计算机与信息技术学院

出处《计算机应用》 CSCD 北大核心 2006年第S2期197-198,207,共3页 journal of Computer Applications

基金国家自然科学基金资助项目(60473139) 山西省自然科学基金资助项目(20051034)

关键词中文信息处理词性标注隐马尔科夫模型平滑算法未登录词

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1梁以敏,黄德根.基于完全二阶隐马尔可夫模型的汉语词性标注[J].计算机工程,2005,31(10):177-179. 被引量：25
2张孝飞,陈肇雄,黄河燕,蔡智.词性标注中生词处理算法研究[J].中文信息学报,2003,17(5):1-5. 被引量：13
3刘启和,詹思瑜,杨国纬.基于统计语言模型的双向词类标注方法[J].计算机科学,2003,30(9):59-60. 被引量：2
4屈刚,陆汝占.一个改进的汉语词性标注系统[J].上海交通大学学报,2003,37(6):897-900. 被引量：7
5徐望,王炳锡.N-gram语言模型中的插值平滑技术研究[J].信息工程大学学报,2002,3(4):13-15. 被引量：13
6魏欧,吴健,孙玉芳,sonata.iscas.ac.cn.基于统计的汉语词性标注方法的分析与改进[J].软件学报,2000,11(4):473-480. 被引量：31
7（美）Christopher,D.Manning,（德）Hinrich,Schutze著,苑春法等译..统计自然语言处理基础[M].北京:电子工业出版社,2005:416.
8LEE SZ,,ISUJII JI,RIM HC.Lexicalized Hidden Markov Models for Part-of-Speech Tagging. Proceedings of18th International Conference on Computational Linguistics . 2000 被引量：1
9XU W,,RUDNICKY A.Can Atifical Neural Networks Learn Lan-guage Models. 6th International Conference on Spoken Language Processing(ICSLP 2000 ) . 2000 被引量：1
10THEDE SM,,HARPER MP.A Second-order Hidden Markov Model for Part-of-speech Tagging. The37th annual meeting of the asso-ciation for computation linguistics(ACL99) . 1999 被引量：1

二级参考文献41

1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量：43
2周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量：25
3刘开瑛等.语料库词类自动标注算法研究[A].陈肇雄.机器翻译研究进展[C].北京:电子工业出版社,1992.378—386. 被引量：1
4周强俞士汶.一种切分和词性标注相融合的汉语语料库多级处理方法[A].陈力为.计算语言学研究与应用[C].北京:北京语言学院出版社,1993.126—131. 被引量：1
5白栓虎黄昌宁夏莹.基于统计的汉语语料库词性自动标注的研究与实现[A].黄昌宁,夏莹.语言信息处理专论[C].北京:清华大学出版社,.. 被引量：1
6Rosenfeld R. Adaptive statistical language modeling: maximum entropy approch [D]. Pittsburgh:Carnegie Mellon Univ, 1994. 被引量：1
7Brown R F, Della-Pietray V J,de Sousa P V,et al.Class-based N-gram models onatural language [J].Computational Linguistics, 1992,18 (4) : 467 - 479. 被引量：1
8Jelinek F. Self-organizing language models for speech recognition [A]. Reading in Speech Reognition [C]. USA: Morgan Kaufman Publishers, Inc,1990. 450-506. 被引量：1
9Morialdo B. Tagging english text with a problistic model [J]. Computational Linguistics, 1994. 20 (2) :155-171. 被引量：1
10Berger A L,Della P, Pietra S A, et al. A maximum entropy approach to natrual language processing [J].Computational Linguistics, 1996,22 ( 1 ) : 450- 480. 被引量：1

共引文献67

1方浩,许鸿文,蔡益宇.一种基于语义关系改进的隐马尔可夫模型研究[J].通信技术,2008,41(5):157-159. 被引量：3
2陈文亮,朱靖波,吕学强.词性标注规则的获取和优化[J].术语标准化与信息技术,2004(2):23-26. 被引量：5
3张虎,郑家恒,刘江.汉语语料库词性标注自动校对方法研究[J].计算机应用,2005,25(1):17-19. 被引量：1
4方华,陆汝占,刘绍明.一个实现多种切分标注算法的系统[J].计算机工程,2004,30(24):122-124. 被引量：2
5梁以敏,黄德根.基于完全二阶隐马尔可夫模型的汉语词性标注[J].计算机工程,2005,31(10):177-179. 被引量：25
6黄永文,何中市.基于互信息的统计语言模型平滑技术[J].中文信息学报,2005,19(4):46-51. 被引量：8
7黄永文,何中市.基于全局折扣的统计语言模型平滑技术[J].重庆大学学报（自然科学版）,2005,28(8):51-55. 被引量：3
8温锐,朱巧明,李培峰.HMM和负反馈模型在词性标注中的应用[J].苏州大学学报（自然科学版）,2005,21(3):39-42. 被引量：5
9张孝飞,陈肇雄,黄河燕,王建德.基于锚点词对的双语词对齐算法[J].小型微型计算机系统,2006,27(2):330-334. 被引量：10
10韩东妹,林民.自动词性标注概述[J].内蒙古科技与经济,2006(01S):132-133.

同被引文献54

1方浩,许鸿文,蔡益宇.一种基于语义关系改进的隐马尔可夫模型研究[J].通信技术,2008,41(5):157-159. 被引量：3
2宋枫溪,高林.文本分类器性能评估指标[J].计算机工程,2004,30(13):107-109. 被引量：33
3林亚平,刘云中,周顺先,陈治平,蔡立军.基于最大熵的隐马尔可夫模型文本信息抽取[J].电子学报,2005,33(2):236-240. 被引量：48
4梁以敏,黄德根.基于完全二阶隐马尔可夫模型的汉语词性标注[J].计算机工程,2005,31(10):177-179. 被引量：25
5刘润楠.中国大陆手语语言学研究现状[J].中国特殊教育,2005(5):26-29. 被引量：22
6向晓雯,史晓东,曾华琳.一个统计与规则相结合的中文命名实体识别系统[J].计算机应用,2005,25(10):2404-2406. 被引量：37
7赵岩,王晓龙,刘秉权,关毅.融合聚类触发对特征的最大熵词性标注模型[J].计算机研究与发展,2006,43(2):268-274. 被引量：20
8刘万代,马新明.社会主义新农村建设中农业信息化发展研究[J].安徽农业科学,2006,34(12):2911-2912. 被引量：16
9洪铭材,张阔,唐杰,李涓子.基于条件随机场(CRFs)的中文词性标注方法[J].计算机科学,2006,33(10):148-151. 被引量：56
10刘迁,焦慧,贾惠波.信息抽取技术的发展现状及构建方法的研究[J].计算机应用研究,2007,24(7):6-9. 被引量：41

引证文献10

1高玉琢,任思佳,王恒,佘廉.基于数值编码规则的信息抽取方法[J].宁夏大学学报（自然科学版）,2009,30(1):46-49. 被引量：2
2韩普,姜杰.HMM在自然语言处理领域中的应用研究[J].计算机技术与发展,2010,20(2):245-248. 被引量：16
3侯呈风,古丽拉.阿东别克.改进的HMM应用于哈萨克语词性标注[J].计算机工程与应用,2010,46(36):147-149. 被引量：8
4侯呈风,古丽拉.阿东别克,陈景超.基于HMM的哈萨克语词性标注研究[J].计算机应用与软件,2012,29(2):31-33. 被引量：3
5袁里驰.基于改进的隐马尔科夫模型的词性标注方法[J].中南大学学报（自然科学版）,2012,43(8):3053-3057. 被引量：15
6才华.隐马尔科夫模型在词性标注中的应用[J].西藏大学学报（社会科学版）,2012,27(5):77-81.
7刘滔,雷霖,陈荦,熊伟.基于MapReduce的中文词性标注CRF模型并行化训练研究[J].北京大学学报（自然科学版）,2013,49(1):147-152. 被引量：5
8牛秀萍,马建芬.HMM词性标注中高频生词的处理[J].计算机应用与软件,2014,31(2):86-88.
9薛彬,陶海军,王加强.针对民生热线文本的热点挖掘系统设计[J].中国计量大学学报,2017,28(3):371-379. 被引量：1
10龙广玉,陈益强,邢云冰.连续手语识别中的文本纠正和补全方法[J].计算机应用,2021,41(3):694-698. 被引量：1

二级引证文献44

1Zhixiang Ji,Xiaohui Wang,Changyu Cai,Hongjian Sun.Power entity recognition based on bidirectional long short-term memory and conditional random fields[J].Global Energy Interconnection,2020,3(2):186-192. 被引量：8
2王恒.WEB日志中基于KNN算法的注入式攻击行为检测方法研究[J].宁夏大学学报（自然科学版）,2009,30(3):248-250. 被引量：1
3杨皓东,江凌,李国俊.国内自然语言处理研究热点分析——基于共词分析[J].图书情报工作,2011,55(10):112-117. 被引量：14
4朱宇,宋艳.嵌入式语音识别系统特征参数提取研究[J].计算机技术与发展,2011,21(7):246-249. 被引量：2
5邱莎,阿圆,王付艳,丁海燕.基于统计的中文地名自动识别研究[J].计算机技术与发展,2011,21(11):35-38. 被引量：13
6吐尔根·依布拉音,袁保社.新疆少数民族语言文字信息处理研究与应用[J].中文信息学报,2011,25(6):149-156. 被引量：27
7周杰,顾明亮,张宁,杨帆.基于动态贝叶斯网络的汉语方言辨识[J].计算机技术与发展,2012,22(11):179-182.
8桑海岩,古丽拉.阿东别克,牛宁宁.基于最大熵的哈萨克语词性标注模型[J].计算机工程与应用,2013,49(11):126-129. 被引量：4
9胡亚洲,王新民,曹江涛.基于改进DTW的机器人语音指令识别系统研究[J].计算机技术与发展,2013,23(7):70-72. 被引量：3
10聂金慧,苏红旗,时志远.中文新词提取与过滤研究综述[J].中国科技博览,2013(30):209-210. 被引量：1

1魏欧,孙玉芳.汉语词性标注方法的研究[J].计算机科学,2000,27(7):71-75. 被引量：6
2刘海天,赵政文,盛光磊.隐马尔可夫模型及其在自然语言处理中的应用[J].微处理机,2009,30(3):74-76. 被引量：2
3许长志,闵帆.带权约简及其在汉语词性标注自动校对中的应用[J].控制与决策,2007,22(7):740-744. 被引量：1
4韩霞,黄德根.基于半监督隐马尔科夫模型的汉语词性标注研究[J].小型微型计算机系统,2015,36(12):2813-2816. 被引量：7
5谷川,田喜平.基于条件随机场的汉语词性标注方法研究[J].安阳师范学院学报,2010(5):6-8.
6林红,苑春法,郭树军.基于最大熵方法的汉语词性标注[J].计算机应用,2004,24(1):14-16. 被引量：8
7田野,张屹峰.基于UML协作图的集成测试算法[J].太原师范学院学报（自然科学版）,2008,7(2):96-99. 被引量：1
8袁萍,周铁军.一种汉语词性标注规则获取算法的实现[J].湖南大学学报（自然科学版）,2003,30(S1):200-202.
9董跃华,邓文龙.基于BP-HMM的词性标注方法的研究[J].计算机工程与设计,2014,35(4):1424-1428. 被引量：1
10王素格,张永奎.汉语词性标注排歧方法探讨[J].计算机工程与应用,2001,37(7):70-72. 被引量：7

计算机应用

2006年第S2期

浏览历史

内容加载中请稍等...

基于改进的隐马尔科夫模型的汉语词性标注被引量：10

参考文献11

二级参考文献41

共引文献67

同被引文献54

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于改进的隐马尔科夫模型的汉语词性标注 被引量：10

参考文献11

二级参考文献41

共引文献67

同被引文献54

引证文献10

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于改进的隐马尔科夫模型的汉语词性标注被引量：10