期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
主题网络爬虫研究综述
被引量:
9
1
作者
左薇
张熹
+1 位作者
董红娟
于梦君
《软件导刊》
2020年第2期278-281,共4页
随着人们对信息资源的个性化需求不断加大,主题网络爬虫应时而生。阐述主题网络爬虫定义及工作原理;介绍了主题网络爬虫研究进展,对主题网络爬虫爬行策略、网页抓取优先级以及系统设计实现进行阐述;总结当前研究的不足,对未来研究方向...
随着人们对信息资源的个性化需求不断加大,主题网络爬虫应时而生。阐述主题网络爬虫定义及工作原理;介绍了主题网络爬虫研究进展,对主题网络爬虫爬行策略、网页抓取优先级以及系统设计实现进行阐述;总结当前研究的不足,对未来研究方向进行了展望。
展开更多
关键词
主题网络爬虫
主题爬虫
搜索引擎
下载PDF
职称材料
改进空间向量模型主题网络爬虫系统
被引量:
7
2
作者
徐明子
吕立
李喜旺
《计算机系统应用》
2013年第7期36-39,52,共5页
详细阐述了主题网络爬虫实现的关键技术,将传统的空间向量模型进行改进形成自适应的空间向量模型,结合网页内容和链接两个方面进行网页相关度计算,设计并实现了一个面向主题的网络爬虫系统.针对主题网络爬虫爬行中出现的页面捕捉不全问...
详细阐述了主题网络爬虫实现的关键技术,将传统的空间向量模型进行改进形成自适应的空间向量模型,结合网页内容和链接两个方面进行网页相关度计算,设计并实现了一个面向主题的网络爬虫系统.针对主题网络爬虫爬行中出现的页面捕捉不全问题还提出了一种改进的手动与遗传因子相结合的网页搜索策略.最后给出实验结果,证明该系统的可行性及优越性.
展开更多
关键词
主题爬虫
相关度计算
搜索策略
遗传因子
下载PDF
职称材料
基于主题网络爬虫的高校网络信息动态搜索策略研究
被引量:
3
3
作者
王鲁荣
《四川师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第6期919-921,共3页
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态...
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态搜索和监控,方便网络管理者及时、有针对性地获取互联网上的相关信息.
展开更多
关键词
校园网络管理
主题网络爬虫
搜索引擎
下载PDF
职称材料
基于主题网络爬虫的不良网页的发现与识别
被引量:
2
4
作者
方育柯
傅彦
+1 位作者
周俊临
夏虎
《郑州大学学报(理学版)》
CAS
北大核心
2010年第2期26-30,共5页
针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络...
针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络环境的目的.实验结果表明,所提出的算法能够有效检测不良网页,并且能够很好地应对不良网站的反关键字过滤策略.
展开更多
关键词
主题网络爬虫
不良网页
文本特征
下载PDF
职称材料
题名
主题网络爬虫研究综述
被引量:
9
1
作者
左薇
张熹
董红娟
于梦君
机构
云南大学职业与继续教育学院
云南大学信息学院
出处
《软件导刊》
2020年第2期278-281,共4页
基金
云南大学职业与继续教育学院一般项目(YK1704ZJ)。
文摘
随着人们对信息资源的个性化需求不断加大,主题网络爬虫应时而生。阐述主题网络爬虫定义及工作原理;介绍了主题网络爬虫研究进展,对主题网络爬虫爬行策略、网页抓取优先级以及系统设计实现进行阐述;总结当前研究的不足,对未来研究方向进行了展望。
关键词
主题网络爬虫
主题爬虫
搜索引擎
Keywords
topic
-
focused
web
crawler
topic
-
focused
crawler
search
engine
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
改进空间向量模型主题网络爬虫系统
被引量:
7
2
作者
徐明子
吕立
李喜旺
机构
中国科学院研究生院
中国科学院沈阳计算技术研究所
出处
《计算机系统应用》
2013年第7期36-39,52,共5页
文摘
详细阐述了主题网络爬虫实现的关键技术,将传统的空间向量模型进行改进形成自适应的空间向量模型,结合网页内容和链接两个方面进行网页相关度计算,设计并实现了一个面向主题的网络爬虫系统.针对主题网络爬虫爬行中出现的页面捕捉不全问题还提出了一种改进的手动与遗传因子相结合的网页搜索策略.最后给出实验结果,证明该系统的可行性及优越性.
关键词
主题爬虫
相关度计算
搜索策略
遗传因子
Keywords
topic
-
focused
web
crawler
relevance
calculation
search
strategy
gene
factor
分类号
TP391.3 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题网络爬虫的高校网络信息动态搜索策略研究
被引量:
3
3
作者
王鲁荣
机构
四川音乐学院计算机中心
出处
《四川师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2011年第6期919-921,共3页
基金
四川省教育厅科研基金(09ZC052)资助项目
文摘
在校园网已经成为Internet一部分的今天,构建和谐校园网,不仅需要对校园网内部进行有效的管理,同时还需要动态掌握Internet上的信息,避免不良信息入侵校园为校园管理带来安全隐患.研究了如何通过主题网络爬虫技术实现高校网络信息动态搜索和监控,方便网络管理者及时、有针对性地获取互联网上的相关信息.
关键词
校园网络管理
主题网络爬虫
搜索引擎
Keywords
campus
network
management
topic
-
focused
web
crawler
search
engine
分类号
TP393 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于主题网络爬虫的不良网页的发现与识别
被引量:
2
4
作者
方育柯
傅彦
周俊临
夏虎
机构
电子科技大学计算机科学与工程学院
出处
《郑州大学学报(理学版)》
CAS
北大核心
2010年第2期26-30,共5页
基金
国家自然科学基金资助项目
编号60973120
+4 种基金
60903073
国家863计划项目
编号2007AA01Z440
四川省科技攻关项目
编号2008GZ0009
文摘
针对互联网中出现的大量不良内容,分析出其主要特征,首次提出将不良网页的文本特征与搜索引擎中网络爬虫相结合的技术来主动寻找互联网中的不良网页及不良网站,并将结果分级别反馈到用户层以便对不良网页和网站进行处理,以达到净化网络环境的目的.实验结果表明,所提出的算法能够有效检测不良网页,并且能够很好地应对不良网站的反关键字过滤策略.
关键词
主题网络爬虫
不良网页
文本特征
Keywords
topic
-
focused
web
crawler
unhealthy
web
page
text
feature
分类号
TP391 [自动化与计算机技术—计算机应用技术]
TP181 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
主题网络爬虫研究综述
左薇
张熹
董红娟
于梦君
《软件导刊》
2020
9
下载PDF
职称材料
2
改进空间向量模型主题网络爬虫系统
徐明子
吕立
李喜旺
《计算机系统应用》
2013
7
下载PDF
职称材料
3
基于主题网络爬虫的高校网络信息动态搜索策略研究
王鲁荣
《四川师范大学学报(自然科学版)》
CAS
CSCD
北大核心
2011
3
下载PDF
职称材料
4
基于主题网络爬虫的不良网页的发现与识别
方育柯
傅彦
周俊临
夏虎
《郑州大学学报(理学版)》
CAS
北大核心
2010
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部