期刊文献+

基于Lucene的搜索引擎研究 被引量:1

Research of Search Engine Based on Lucene
下载PDF
导出
摘要 Lucene是一个纯Java实现的高性能、可扩展的全文信息检索工具库,可以很方便地把它融入到应用程序中来增加索引和搜索功能.分析了Lucene的索引文件结构和搜索排序算法,探讨了Lucene中计算文档与查询项相关度的向量空间模型(VSM).最后,通过实验验证了索引过程的建立以及如何提高索引性能. As an information retrieval library written in Java, Lucene, with its high performance and easy to scale, can easily add indexing and searching capabilities to applications. This paper analyzes the structure of index file and ranking algorithm, and discusses the vector space model used in Lucene to compute the relevance between documents and query. We do an experiment to test the indexing process and discuss how to improve the performance of index in Lucene at the end.
作者 詹自熬 陶斌
出处 《河南工程学院学报(自然科学版)》 2008年第4期40-43,共4页 Journal of Henan University of Engineering:Natural Science Edition
关键词 LUCENE 向量空间模型 相关度 信息检索 Lucene vector space model relevance information retrieval
  • 相关文献

参考文献1

二级参考文献3

  • 1Salton G, Wong A. On the Specification of Term Value in Automatic Indexing. Journal of Documentation, 1973, 29(4):351-372 被引量:1
  • 2Wong S K M, Ziarko W. Generalized Vector Space Model in Information Retrieval. In:Proc the 8th Annual ACM SIGIR International Conference on Research and Development in Information Retrieval, 1985:18-25 被引量:1
  • 3丁璇,侯汉清,章成志.中文网页标引源主题表达能力的调查统计[J].大学图书馆学报,2002,20(6):70-72. 被引量:29

共引文献20

同被引文献3

引证文献1

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部