期刊文献+

基于改进的隐马尔科夫模型的汉语词性标注 被引量:10

下载PDF
导出
摘要 基于传统隐马尔科夫(HMM)模型的基础上,对词语的词汇发射概率做出了新的假设,从而更好地体现了该词语与上下文依赖关系。还利用指数线性插值平滑算法对参数进行了有效平滑,并且给出了未登录词词汇发射概率估计模型。实验结果证明,改进后的模型明显优于传统HMM词性标注模型的效果。
作者 王敏 郑家恒
出处 《计算机应用》 CSCD 北大核心 2006年第S2期197-198,207,共3页 journal of Computer Applications
基金 国家自然科学基金资助项目(60473139) 山西省自然科学基金资助项目(20051034)
  • 相关文献

参考文献11

二级参考文献41

  • 1周强.规则和统计相结合的汉语词类标注方法[J].中文信息学报,1995,9(3):1-10. 被引量:43
  • 2周强.基于语料库和面向统计学的自然语言处理技术[J].计算机科学,1995,22(4):36-40. 被引量:25
  • 3刘开瑛 等.语料库词类自动标注算法研究[A].陈肇雄.机器翻译研究进展[C].北京:电子工业出版社,1992.378—386. 被引量:1
  • 4周强 俞士汶.一种切分和词性标注相融合的汉语语料库多级处理方法[A].陈力为.计算语言学研究与应用[C].北京:北京语言学院出版社,1993.126—131. 被引量:1
  • 5白栓虎 黄昌宁 夏莹.基于统计的汉语语料库词性自动标注的研究与实现[A].黄昌宁,夏莹.语言信息处理专论[C].北京:清华大学出版社,.. 被引量:1
  • 6Rosenfeld R. Adaptive statistical language modeling: maximum entropy approch [D]. Pittsburgh:Carnegie Mellon Univ, 1994. 被引量:1
  • 7Brown R F, Della-Pietray V J,de Sousa P V,et al.Class-based N-gram models onatural language [J].Computational Linguistics, 1992,18 (4) : 467 - 479. 被引量:1
  • 8Jelinek F. Self-organizing language models for speech recognition [A]. Reading in Speech Reognition [C]. USA: Morgan Kaufman Publishers, Inc,1990. 450-506. 被引量:1
  • 9Morialdo B. Tagging english text with a problistic model [J]. Computational Linguistics, 1994. 20 (2) :155-171. 被引量:1
  • 10Berger A L,Della P, Pietra S A, et al. A maximum entropy approach to natrual language processing [J].Computational Linguistics, 1996,22 ( 1 ) : 450- 480. 被引量:1

共引文献67

同被引文献54

引证文献10

二级引证文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部