期刊文献+

基于词汇语义计算的文本相似度研究 被引量:25

Research of text similarity based on word similarity computing
下载PDF
导出
摘要 基于《知网》的词汇语义计算方法揭示了词汇间的语义信息。根据文本的向量空间模型描述形式,采用了基于《知网》的词汇语义计算方法来计算两篇文章向量的相关性,并用最大匹配算法来获得这两篇文章的相似度,通过该计算过程达到揭示文本所蕴涵概念的目的,并用实验对该方法的有效性进行了验证,提出了今后的改进方向。 The algorithm used to compute word similarity based on how-net opens out some relational information between words. Ac- cording to VSM, the algorithm was adopted to compute two texts pertinence. And the biggest matching algorithm was used to compute similarity. Experiments showed the validity of algorithm. Finally, development direction in future was presented.
出处 《计算机工程与设计》 CSCD 北大核心 2006年第2期241-244,共4页 Computer Engineering and Design
基金 重庆大学教师资助计划基金项目(2003A33)
关键词 《知网》 相似度计算 义原 匹配 向量空间模型 how-net similarity computing sememe matching VSM
  • 相关文献

参考文献7

二级参考文献9

  • 1黄萱青 吴立德.独立于语种的文本分类方法[M].,2000.37-43. 被引量:1
  • 2鲁松 白硕 等.文本中词语权重计算方法的改进[M].,2000.31-36. 被引量:1
  • 3卜东波.聚类/分类理论研究及其在大模型文本挖掘的应用:博士论文[M].,2000.. 被引量:1
  • 4穗志文.基于骨架依存树的语句相似度计算模型[J].计算语言学文集,1998,(3):176-184. 被引量:3
  • 5黄萱菁,2000 International Conference on Multilingual Information Processing,2000年,37页 被引量:1
  • 6鲁松,2000 International Conference on Multilingual Information Processing,2000年,31页 被引量:1
  • 7卜东波,博士学位论文,2000年 被引量:1
  • 8Yang Yiming,Proceedings of ACMSIGIR Conference on Research and Development in Information Retrieval(SIGIR),1999年,42页 被引量:1
  • 9Yang Yiming,J Information Retrieval,1999年,1卷,1/2期,67页 被引量:1

共引文献517

同被引文献223

引证文献25

二级引证文献351

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部