-
题名基于无指导机器学习的全文词义自动标注方法
被引量:2
- 1
-
-
作者
卢志茂
刘挺
李生
-
机构
哈尔滨工程大学计算机科学与技术学院
哈尔滨工业大学计算机学院信息检索研究室
-
出处
《自动化学报》
EI
CSCD
北大核心
2006年第2期228-236,共9页
-
基金
国家自然科学基金重点项目(60435020)国家自然科学基金项目(60575042
60573072)资助~~
-
文摘
为实现汉语全文词义自动标注,本文采用了一种新的基于无指导机器学习策略的词义标注方法.实验中建立了四个词义排歧模型,并对其测试结果进行了比较.其中实验效果最优的词义排歧模型融合了两种无指导的机器学习策略,并借助依存文法分析手段对上下文特征词进行选择.最终确定的词义标注方法可以使用大规模语料对模型进行训练,较好的解决了数据稀疏问题,并且该方法具有标注正确率高、扩展性能好等优点,适合大规模文本的词义标注工作.
-
关键词
词义标注
无指导学习算法
单纯贝叶斯模型
依存文法
-
Keywords
Sense tagging, unsupervised learning algorithm, naive Bayesian model, dependency grammar
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-