期刊文献+

对蒙古语语料库的短语标注

A Phrase-tagging Research in Mongolian Corpus
下载PDF
导出
摘要 通过本项研究,我们对100万词级现代蒙古语语料库做了短语标注,建立了现代蒙古语基本短语库。这一成果,对今后建立一个面向信息处理的、具有较强通用性的蒙古语语义分类和描述体系,提供了必要的前提条件。局部测试结果表明,标注软件对简单句子标注基本短语的召回率和准确率分别达到了92.93%和86.79%。今后有必要深入研究语义信息的获取、语法信息的细化以及蒙古语短语的歧义结构种类、产生歧义结构的原因等问题。 In this research project, the writer has tagged phrases in one million words-level modem Mongolian corpus and set up modem Mongolian basic phrase bank. The achievement provides a very necessary prerequisite for setting up Mongolian language semantic classification and the related description framework, local tests show the recall and the precision of tagging basic phrases in simple sentences reach 92. 93 % and 86. 79 %, we should do deep research on semantic information, grammatical information and ambiguous structure in Mongolian phrases
出处 《中央民族大学学报(哲学社会科学版)》 CSSCI 北大核心 2006年第5期64-67,共4页 Journal of Minzu University of China(Philosophy and Social Sciences Edition)
基金 本研究为国家社会科学基金(批准号为02BYY036) 国家自然科学基金(批准号为60263001)项目
关键词 蒙古语 语料库 短语标注 Mongolian language corpus phrase-tagging
  • 相关文献

参考文献12

  • 1内蒙古大学蒙古学学院蒙古语文研究所.现代蒙古语[M].呼和浩特:内蒙古人民出版社,2005. 被引量:4
  • 2清格尔泰.现代蒙古语语法(蒙古文版)[M].呼和浩特:内蒙古人民出版社,1999. 被引量:1
  • 3确精扎布.关于蒙古语词组的若干问题[J].内蒙古大学学报,1963,(1). 被引量:1
  • 4华沙宝.蒙古语短语标注策略[J].中央民族大学学报(哲学社会科学版),2003,30(5):98-100. 被引量:2
  • 5华沙宝,达胡白乙拉.蒙古语宾述短语的自动获取研究[A].孙茂松,陈群秀.自然语言理解与大规模内容计算[C].北京:清华大学出版社. 被引量:1
  • 6华沙宝,达胡白乙拉.对蒙古语语料库基本名词短语的定界与统计分析[J].中文信息学报,2005,19(5):52-58. 被引量:4
  • 7青格乐图.面向信息处理的蒙古文固定词组研究[M].呼和浩特:内蒙古教育出版社,2001. 被引量:1
  • 8达胡白乙拉..蒙古语基本动词短语自动识别研究[D].内蒙古大学,2005:
  • 9周强.汉语语料库的短语自动划分和标注研究[M].北京:北京大学计算机系,1996. 被引量:1
  • 10詹卫东著..面向中文信息处理的现代汉语短语结构规则研究[M].北京:清华大学出版社;南宁,2000:174.

二级参考文献10

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部