期刊文献+

主题爬虫的设计与实现 被引量:40

下载PDF
导出
摘要 文章以主题相关度为核心研究了设计主题爬虫的相关技术 ,通过实验给出了具体实现。实验结果充分论证了其可行性与实用性 ,为进行主题搜索引擎设计和主题信息采集奠定了良好的基础。
作者 汪涛 樊孝忠
出处 《计算机应用》 CSCD 北大核心 2004年第S1期270-272,共3页 journal of Computer Applications
  • 相关文献

参考文献5

  • 1曹军.Google的PageRank技术剖析[J].情报杂志,2002,21(10):15-18. 被引量:70
  • 2李盛韬,吴丽辉,于满泉,潘文锋,余智华,王斌,程学旗.主题Web信息采集的研究与设计[A]语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集,2003. 被引量:1
  • 3李晓明,李星主编..搜索引擎与Web挖掘进展[M].北京:高等教育出版社,2003:225.
  • 4孙茂松,陈群秀主编..语言计算与基于内容的文本处理[M].北京:清华大学出版社,2003:633.
  • 5(美)Jeff,Heaton著,童兆丰等译..网络机器人Java编程指南[M].北京:电子工业出版社,2002:420.

二级参考文献8

  • 1R. Baeza Yates, B. Ribeiro Neto. Modern Information Retrieval ACM Press,1998 被引量:1
  • 2Google inc. http: //www. google. com 被引量:1
  • 3Dell Zhang, Yisheng Dong. An Efficient Algorithm to Rank Web Resources.The 9th International World Wide Web Conference, 2000. http: //www9. org/w9cdrom/251/251. html 被引量:1
  • 4Jon Kleinberg. Authoritative Sources in a Hyperlinked Environment. Journal of the ACM, 1999;46(5) 被引量:1
  • 5L. Page, S. Brin, R. Motwani, T. Winograd. The PageRank Citation Ranking: Bringing order to the Web. http://www - db. stanford. edu/~ backrub /pageranksub.ps, January, 1998. 被引量:1
  • 6S. Brin, L. Page The Anatomy of a Large- scale Hypertextual Web Search Engine Computer Networks and ISDN Systems, 1998 被引量:1
  • 7Arvind Arasu, Junghoo Cho. Hector Garcia - Molina, Andreas Paepcke, Sriram Raghavan. Searching the Web. ACM Transactions on Intemet Technology,2001 ;1(1) 被引量:1
  • 8Taher Haveliwala. Effcient Computation of Pagerank. Technical Report 1999 -31, Database Group, Computer Science Department, Stanford University,February 1999. http: //dbpubs. stanford. edu /pub/1999 - 31. 被引量:1

共引文献69

同被引文献199

引证文献40

二级引证文献167

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部