期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
主题网络爬虫研究综述 被引量:9
1
作者 左薇 张熹 +1 位作者 董红娟 于梦君 《软件导刊》 2020年第2期278-281,共4页
随着人们对信息资源的个性化需求不断加大,主题网络爬虫应时而生。阐述主题网络爬虫定义及工作原理;介绍了主题网络爬虫研究进展,对主题网络爬虫爬行策略、网页抓取优先级以及系统设计实现进行阐述;总结当前研究的不足,对未来研究方向... 随着人们对信息资源的个性化需求不断加大,主题网络爬虫应时而生。阐述主题网络爬虫定义及工作原理;介绍了主题网络爬虫研究进展,对主题网络爬虫爬行策略、网页抓取优先级以及系统设计实现进行阐述;总结当前研究的不足,对未来研究方向进行了展望。 展开更多
关键词 主题网络爬虫 主题爬虫 搜索引擎
下载PDF
改进空间向量模型主题网络爬虫系统 被引量:7
2
作者 徐明子 吕立 李喜旺 《计算机系统应用》 2013年第7期36-39,52,共5页
详细阐述了主题网络爬虫实现的关键技术,将传统的空间向量模型进行改进形成自适应的空间向量模型,结合网页内容和链接两个方面进行网页相关度计算,设计并实现了一个面向主题的网络爬虫系统.针对主题网络爬虫爬行中出现的页面捕捉不全问... 详细阐述了主题网络爬虫实现的关键技术,将传统的空间向量模型进行改进形成自适应的空间向量模型,结合网页内容和链接两个方面进行网页相关度计算,设计并实现了一个面向主题的网络爬虫系统.针对主题网络爬虫爬行中出现的页面捕捉不全问题还提出了一种改进的手动与遗传因子相结合的网页搜索策略.最后给出实验结果,证明该系统的可行性及优越性. 展开更多
关键词 主题爬虫 相关度计算 搜索策略 遗传因子
下载PDF
基于主题网络爬虫的高校网络信息动态搜索策略研究 被引量:3
3
作者 王鲁荣 《四川师范大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第6期919-921,共3页
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态... 在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态搜索和监控,方便网络管理者及时、有针对性地获取互联网上的相关信息. 展开更多
关键词 校园网络管理 主题网络爬虫 搜索引擎
下载PDF
基于主题网络爬虫的不良网页的发现与识别 被引量:2
4
作者 方育柯 傅彦 +1 位作者 周俊临 夏虎 《郑州大学学报(理学版)》 CAS 北大核心 2010年第2期26-30,共5页
针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络... 针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络环境的目的.实验结果表明,所提出的算法能够有效检测不良网页,并且能够很好地应对不良网站的反关键字过滤策略. 展开更多
关键词 主题网络爬虫 不良网页 文本特征
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部