期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
HTMLUNIT在网络信息采集系统中的应用
被引量:
1
1
作者
陈永江
仲兆满
陈宗华
《淮海工学院学报(自然科学版)》
CAS
2013年第4期31-35,共5页
首先分析了传统HttpClient方式进行网页信息抓取时的不足,进而讨论了HTMLUNIT技术对富JavaScript页面的支持、获取Ajax技术页面的异步数据和需要模拟交互的页面数据的机器自动抓取问题,并给出实例和实现。进行了HTMLUNIT与流行浏览器内...
首先分析了传统HttpClient方式进行网页信息抓取时的不足,进而讨论了HTMLUNIT技术对富JavaScript页面的支持、获取Ajax技术页面的异步数据和需要模拟交互的页面数据的机器自动抓取问题,并给出实例和实现。进行了HTMLUNIT与流行浏览器内核JavaScript解析速度的对比性试验,最后得出了分析结论。
展开更多
关键词
采集系统
HTMLUNIT
java
浏览器内核
下载PDF
职称材料
题名
HTMLUNIT在网络信息采集系统中的应用
被引量:
1
1
作者
陈永江
仲兆满
陈宗华
机构
江苏金鸽网络科技有限公司
出处
《淮海工学院学报(自然科学版)》
CAS
2013年第4期31-35,共5页
基金
科技部科技人员服务企业计划项目(2009GJC10043)
文摘
首先分析了传统HttpClient方式进行网页信息抓取时的不足,进而讨论了HTMLUNIT技术对富JavaScript页面的支持、获取Ajax技术页面的异步数据和需要模拟交互的页面数据的机器自动抓取问题,并给出实例和实现。进行了HTMLUNIT与流行浏览器内核JavaScript解析速度的对比性试验,最后得出了分析结论。
关键词
采集系统
HTMLUNIT
java
浏览器内核
Keywords
data-collecting
system
HTMLUNIT
java
browser
kernel
分类号
TP311.52 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
HTMLUNIT在网络信息采集系统中的应用
陈永江
仲兆满
陈宗华
《淮海工学院学报(自然科学版)》
CAS
2013
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部