摘要
通过本项研究,我们对100万词级现代蒙古语语料库做了短语标注,建立了现代蒙古语基本短语库。这一成果,对今后建立一个面向信息处理的、具有较强通用性的蒙古语语义分类和描述体系,提供了必要的前提条件。局部测试结果表明,标注软件对简单句子标注基本短语的召回率和准确率分别达到了92.93%和86.79%。今后有必要深入研究语义信息的获取、语法信息的细化以及蒙古语短语的歧义结构种类、产生歧义结构的原因等问题。
In this research project, the writer has tagged phrases in one million words-level modem Mongolian corpus and set up modem Mongolian basic phrase bank. The achievement provides a very necessary prerequisite for setting up Mongolian language semantic classification and the related description framework, local tests show the recall and the precision of tagging basic phrases in simple sentences reach 92. 93 % and 86. 79 %, we should do deep research on semantic information, grammatical information and ambiguous structure in Mongolian phrases
出处
《中央民族大学学报(哲学社会科学版)》
CSSCI
北大核心
2006年第5期64-67,共4页
Journal of Minzu University of China(Philosophy and Social Sciences Edition)
基金
本研究为国家社会科学基金(批准号为02BYY036)
国家自然科学基金(批准号为60263001)项目
关键词
蒙古语
语料库
短语标注
Mongolian language
corpus
phrase-tagging