期刊文献+

FTP搜索引擎数据采集策略的研究

Data acquisition strategy for FTP search engine
下载PDF
导出
摘要 为了解决传统FTP Search Engine的检索时效性问题,提出了一种有针对性的数据采集更新模型。在该模型中,更新频率被设计用于解决在怎样尽可能降低服务器负载压力的前提下保证较高的平均有效下载比率的问题,而队列排序用于解决在一次数据采集更新中怎样确定FTP站点队列采集对象顺序的策略优化。 Because the traditional FTP search engines usually adopt centralized spiders to collect data, the temporal effectiveness insufficient is their major demerit. For solving this problem, an efficient data acquisition model is presented. The key technologies involve data update frequency and queue order. The data update frequency is designed to provide a balance between a good ratio of available FTP file download links and a high data acquisition frequency. The queue order is designed to optimize the order strategy of FTP sites in a data acquisition task.
出处 《计算机工程与设计》 CSCD 北大核心 2009年第8期1853-1854,1885,共3页 Computer Engineering and Design
基金 国家863高技术研究发展计划基金项目(2006AA10Z239) 欧盟亚洲信息技术与通信基金项目(Europe Aid/117839/C/G-41-15) 江苏省高校省级重点实验室开放基金项目(2006)
关键词 FTP 搜索引擎 时效性 更新频率 队列排序 FTP search engine temporal effectiveness data update frequency queue order
  • 相关文献

参考文献8

二级参考文献36

  • 1马张华,陈文广.查询优化与动态自动聚类系统[J].大学图书馆学报,2005,23(3):34-40. 被引量:7
  • 2陈华 李晓明.文件分类查找方法[P].专利申请号:02100839.6.2002-01. 被引量:1
  • 3Dhand H Mannila等著 张银奎 廖丽等译.数据挖掘原理[M].北京:机械工业出版社,2003.. 被引量:1
  • 4陈华 李晓明.高级文件搜索引擎核心功能的实现技术:搜索引擎与Web挖掘进展[M].高等教育出版社,2003.. 被引量:1
  • 5[4]Wagner R A, Fisher M J. The string-to-string correction problem [J]. Journal of the Association for Computing Machinery, 1974,21:168 - 173. 被引量:1
  • 6[5]Bunke H,Csirik J. Parametric string edit distance and its application to pattern recognition [J]. IEEE Trans System Man and Cybernetics, 1995,25 (1) :202 - 206. 被引量:1
  • 7Liu Jianguo,Proceedings of the Fourth International Conference/Exhibitionon High Performance,2000年,751页 被引量:1
  • 8S Brin,L Page.The Anatomy of a Large-Scale Hypertexual Web Search Engine[A].Proc of the 7th WWW Conf[C].1998. 被引量:1
  • 9天网.北京大学天网中英搜索引擎[EB/OL].http://e.pku.edu.cn,2003-10. 被引量:1
  • 10YAN Hongfei,WANG Jianyong,LI Xiaoming.A Dynamically Reconfigurable Model for a Distributed Web Crawling System[A].2001 Int'l Conf on Computer Networks and Mobile Computing[C].2001.157-162. 被引量:1

共引文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部