期刊文献+

基于聚类方法对特定领域术语的自动筛选 被引量:7

To Automatically Filter Specific Field Terms Based on the Clustering Method
下载PDF
导出
摘要 从大规模无标注的文本中获取特定领域的术语词典,通常采用的方法是从术语抽取器得到相关术语,而后使用手工的方式进行术语筛选,得到相关领域的术语。这需要大量的人力物力,并且标准无法统一。本文提出了一种利用CBC聚类方法从抽取的术语文本中自动剔除非此领域的术语,并且通过对训练语料库文本的不断丰富,还可以对新词进行识别,以扩大该领域的术语集。最后,通过对实验结果进行评测,显示了CBC聚类方法对术语筛选的良好效果。 In order to get the specific field term dictionary from large-scale unlabelled texts,we usually use manual methods to filter terms after getting the terms from the machine of term-extraction. But this needs more manpower and material resources. This paper proposes a new way to automatically filter the specific terms from term texts based on the CBC(cluster by committee) clustering method. Meanwhile, it can recognize new field terms by enlarging the field corpus. Finally it evaluates the results of this experiment, and shows the better effect of the method in filtering terms.
作者 李勇
出处 《计算机工程与科学》 CSCD 2008年第2期64-66,134,共4页 Computer Engineering & Science
关键词 CBC聚类方法 术语筛选 语料库 术语抽取 CBC(cluster by committee) term filtering corpus term extracting
  • 相关文献

参考文献8

二级参考文献1

共引文献89

同被引文献131

引证文献7

二级引证文献77

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部