期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Web内容抽取及其数据管理方法 被引量:16
1
作者 张成洪 肖军建 张诚 《复旦学报(自然科学版)》 CAS CSCD 北大核心 2001年第2期177-183,共7页
随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ... 随着Internet及其相关技术的飞速发展 ,WWW已成为最大的信息集散地 .无论对企业还是个人 ,Web逐渐成为最主要的信息来源 .然而由于网站数量过多以及由此带来的信息泛滥 ,使得有用信息的获取越来越困难 .搜索引擎只能提供信息的查找范围 ,而具体的内容还要靠详细搜查 .而且网页信息都是非结构化或半结构化的 ,无法直接利用分析工具进行分析 .所以有必要提供一种网页内容自动抽取及使网页数据结构化的方法 。 展开更多
关键词 数据抽取 网页包装 规则表达式 模式匹配 INTERNET WWW web数据集成系统 数据管理 网页数据结构化
原文传递
基于XSLT的Web包装器环境 被引量:1
2
作者 廖灵睿 肖田元 《计算机工程与科学》 CSCD 2006年第9期15-17,59,共4页
Web包装器将网页内容转换为XML格式,用于系统集成。进行XML转换的XSLT技术能较好地支持包装器的信息抽取和组织。本文从包含查询接口、结果模式和映射规则的包装器描述文件(XML)出发,给出了自动生成可执行代码的技术方案。包装器的执行... Web包装器将网页内容转换为XML格式,用于系统集成。进行XML转换的XSLT技术能较好地支持包装器的信息抽取和组织。本文从包含查询接口、结果模式和映射规则的包装器描述文件(XML)出发,给出了自动生成可执行代码的技术方案。包装器的执行及其生成过程完全基于XSLT技术,系统具有较强的可移植性。提出“元数据对齐”方法进行内容辅助定位,提高了对页面变化的容忍度。原型系统的实现验证了以上技术的可行性。 展开更多
关键词 web包装器 XSLT XML SCHEMA
下载PDF
HTML到XML转换技术的研究与实现 被引量:1
3
作者 陈艳梅 张斌 《现代图书情报技术》 CSSCI 北大核心 2003年第5期66-67,90,共3页
网络上大多数的信息都是用 HTML写的 ,这种语言不能处理网络上的很多需求 ,因为它只是一种用于浏览信息的语言 ,不能表达数据本身 ,网络还没有形成一个良好的结构化文档的存贮 ,而只是一个可变的 HTML页的聚集 ,我们迫切希望来自网络资... 网络上大多数的信息都是用 HTML写的 ,这种语言不能处理网络上的很多需求 ,因为它只是一种用于浏览信息的语言 ,不能表达数据本身 ,网络还没有形成一个良好的结构化文档的存贮 ,而只是一个可变的 HTML页的聚集 ,我们迫切希望来自网络资源的信息以一种结构化的方式来存贮。XML和它的各种扩展功能如数据模型、查询语言等是实现结构化方式的一种 ,是一种元语言 ,可以弥补很多 HTML的不足。未来的网页会使用具有很好结构化的 XML语言 ,但是现在这一阶段是过渡阶段 ,必须思考一种方法来实现 HTML到 XML的转换 ,以更好地利用网络资源。本文提出了一种实现 HTML到 XML转换的方法。 展开更多
关键词 HTML 超文本标记语言 XML 可扩展性标记语言 网络信息 信息描述 语言格式 转换技术
下载PDF
一个面向服务的EAI框架 被引量:17
4
作者 王颖 吴荣泉 +1 位作者 黄美锋 邵培南 《计算机工程》 CAS CSCD 北大核心 2006年第1期279-280,F0003,共3页
介绍了面向服务的框架(SOA),基于企业应用系统原有底层架构,结合WebService和传统企业应用集成(EAI)解决方案,讨论了面向服务的EAI框架,并给出.net平台下对已有应用的WebService封装实现。
关键词 企业应用集成 面向服务的框架 web Service封装
下载PDF
利用Web Service实现电子化供应链管理 被引量:6
5
作者 孙涛 范林根 刘仲英 《计算机应用与软件》 CSCD 北大核心 2005年第8期57-59,共3页
e化供应链是电子商务B2B模式的进一步延伸,如何低成本地实现企业间信息平台的无缝连接是实现e化供应链的关键。在分析了e化供应链技术要求的基础上,给出了基于WebService的e化供应链解决方案,并对实现过程进行了讨论。
关键词 电子商务 电子化供应链管理 web SERVICE 网上购物 网上交易 B2B模式
下载PDF
利用Web Service实现电子化供应链管理
6
作者 孙涛 刘仲英 《计算机与现代化》 2004年第10期82-84,128,共4页
e化供应链是电子商务B2B模式的进一步延伸,如何低成本地实现企业间信息平台的无缝连接是实现e化供应链的关键。在分析了e化供应链技术要求的基础上,给出了基于WebService的e化供应链解决方案,并对实现过程进行了讨论。
关键词 web服务 电子化供应链 Wleb SERVICE wrapper
下载PDF
异构数字资源整合方案的研究与实现 被引量:4
7
作者 吴一平 《图书情报工作》 CSSCI 北大核心 2011年第3期111-115,共5页
介绍异构资源的概念、特征、整合方法等,提出基于Web服务的数字图书馆分层次异构资源整合方案,构造方案的具体模型,同时以南开大学数字图书馆为例,设计方案的具体实现。从而揭示该方案对于整合数字图书馆中的异构资源、促进数字图书馆... 介绍异构资源的概念、特征、整合方法等,提出基于Web服务的数字图书馆分层次异构资源整合方案,构造方案的具体模型,同时以南开大学数字图书馆为例,设计方案的具体实现。从而揭示该方案对于整合数字图书馆中的异构资源、促进数字图书馆建设、方便用户检索和使用数字资源、提升图书馆的服务质量具有积极作用。 展开更多
关键词 异构数据库 整合 web服务 分层次 包装器
原文传递
搜索引擎返回结果自动抽取
8
作者 藕军 任明仑 《现代图书情报技术》 CSSCI 北大核心 2007年第2期49-52,共4页
提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链... 提出一种从搜索引擎返回结果页面上自动抽取结果记录及后续页面链接信息并生成Wrapper的方法:对于一个有效的结果页面,通过比较其HTML标签树上节点的相似度从而识别出潜在记录块,利用启发式规则从潜在记录块中将结果记录块和后续页面链接分别识别出来,然后利用其在标签树上的位置信息分别构造Wrapper。实验结论及与已有方法的比较表明,该方法简单可行且高效。 展开更多
关键词 搜索引擎 web信息抽取 包装器生成 HTML标签树 节点相似度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部