期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
融合链接结构的主题爬虫算法 被引量:4
1
作者 刘韶涛 李洪胜 《华侨大学学报(自然科学版)》 CAS 北大核心 2017年第2期195-200,共6页
通过分析基于内容的链接选择Best-First算法,引入能够体现链接价值的HITS(hyperlink induced topic search)算法,提出了新的链接选择策略.将两种算法相结合,新的爬虫不仅仅考虑页面内容,同时将链接结构加入进来,使得在下载的过程中能够... 通过分析基于内容的链接选择Best-First算法,引入能够体现链接价值的HITS(hyperlink induced topic search)算法,提出了新的链接选择策略.将两种算法相结合,新的爬虫不仅仅考虑页面内容,同时将链接结构加入进来,使得在下载的过程中能够保证主题相关性和权威性,缓解爬虫在爬行阶段的"近视"现象.结果表明:新的爬行策略比单一的Best-First算法具有更好的性能表现. 展开更多
关键词 Best-First算法 链接结构 HITS算法 爬行策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部