期刊文献+

MED算法及其在网页搜索中的应用

Modified Edit Distance Algorithm and Its Application in Web Search
下载PDF
导出
摘要 针对传统方法不能很好地处理网页中简短域和用户查询之间的相关性排序问题,提出一种改进的编辑距离(MED)排序算法,在编码和计算过程中引入查询词分布的位置、顺序和距离等信息,将查询和简短域之间的相关性问题转化为编码字符串的相似性问题。仿真实验结果表明,与传统的相关性排序算法相比,该算法可以提高网页搜索中简短网页域的相关性排序性能。 Aiming at the problems that the traditional methods can not perform well on the short Web page fields,a Modified Edit Distance(MED) algorithm is proposed. In the process of encoding and calculating,the algorithm uses the position,order,and distance information,so the problem on the relevance between the corresponding query and short field can be converted to the problem on the similarity between the encoding strings. Simulation experimental results show this algorithm can significantly outperform the traditional algorithms for relevance ranking on short Web fields,especially for very short fields.
作者 叶福军
出处 《计算机工程》 CAS CSCD 北大核心 2010年第2期36-38,共3页 Computer Engineering
基金 浙江省科技计划基金资助项目(2007C23050)
关键词 网页搜索 相关性排序 编辑距离 字符串匹配 Web search relevance ranking edit distance string match
  • 相关文献

参考文献5

  • 1Robertson S E. Experimentation as a Way of Life: Okapi at Tree[J]. Information Processing & Management, 2000, 36(1 ): 95-108. 被引量:1
  • 2Buttcher S. Term Proximity Scoring for Ad-hoc Retrieval on Very Large Text Collections[C]//Proceedings of ACM SIGIR'06. [S. l.]: ACM Press, 2006. 被引量:1
  • 3Levenshtein V I. Binary Codes Capable of Correcting Deletions, Insertions, and Reversals[J]. Soviet Physics Doklady, 1966, 10(8): 707-710. 被引量:1
  • 4车万翔,刘挺,秦兵,李生.基于改进编辑距离的中文相似句子检索[J].高技术通讯,2004,14(7):15-19. 被引量:65
  • 5Cormen Thomas H.算法导论[M].北京:机械工业出版社,2006. 被引量:4

二级参考文献8

共引文献67

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部