期刊文献+

基于多特征的中文关键词抽取方法 被引量:6

CHINESE KEYWORD EXTRACTION METHOD BASED ON MULTI-FEATURES
下载PDF
导出
摘要 关键词抽取是信息检索、文本分类、文本聚类以及自动文摘生成等技术的基础。在分析传统中文关键词抽取方法不足的基础上,提出一种基于多特征的中文关键词提取方法。该方法在抽取中文关键词过程中,从词频、关联度、词性以及位置等多种特征来全面考查关键词,有效地避免了传统关键词提取方法产生的偏差。实验结果表明,与传统方法相比,该方法在不同测试集上关键词提取的平均召回率均得到明显提升。 Keywords extraction is the basis for the techniques of information retrieval,text classification,text clustering and automatic summarisation.According to the analysis on shortcomings of traditional Chinese keyword extraction methods,we propose a multi-feature-based Chinese keyword extraction method.The method comprehensively inspects the keywords in the process of Chinese keyword extraction from multiple features such as the word frequency,correlation,part of speech( POS) and position,etc.,and effectively avoids the derivations in traditional keywords extraction methods.Experimental results demonstrate that the average recall rate of the keywords extraction improves significantly on different test sets compared with traditional methods.
作者 杨颖 戴彬
出处 《计算机应用与软件》 CSCD 北大核心 2014年第11期109-112,共4页 Computer Applications and Software
基金 四川省教育厅2010年青年基金项目(10ZC102)
关键词 关键词抽取 词频 关联度 文本聚类 Extraction Word frequency Word correlation Text clustering
  • 相关文献

参考文献12

二级参考文献66

共引文献279

同被引文献67

引证文献6

二级引证文献14

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部