-
题名分布式Web信息采集系统的研究与设计
被引量:10
- 1
-
-
作者
李盛韬
成绫
余智华
-
机构
中国科学院计算技术研究所软件研究室
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第16期162-166,182,共6页
-
基金
中科院计算所领域前沿青年基金资助(编号:20016280-8)
-
文摘
Web信息的急速膨胀,使得Web信息采集面临一个巨大的挑战。针对这一情况,实现了一个分布式Web信息采集系统,以提高一般Web信息采集的能力。文章论述了分布式信息采集的基本原理、分类、难点以及相应的对策,并就该分布式Web信息采集系统进行了仔细的剖析。最后,对分布式Web信息采集的发展作了一个展望。
-
关键词
信息采集
分布式
搜索引擎
信息处理
WEB
-
Keywords
Web Crawler,Web Gathering,Search Engine,Information Processing,Web
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于XML的数据库信息交换机制
被引量:8
- 2
-
-
作者
成绫
李盛韬
程学旗
-
机构
中国科学院计算机技术研究所软件研究室
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第25期184-186,225,共4页
-
基金
国家自然科学基金(编号:60173018)
-
文摘
该文对XML在数据库信息交换领域的应用问题进行了探讨;分析了XML在与DOM技术相结合进行数据库信息交换的优势和意义,并通过一个应用实例阐述了此种技术的具体实现方法。
-
关键词
数据库
XML
DOM
节点树
-
Keywords
database,XML ,DOM,node tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-