期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
XML数据库技术研究 被引量:18
1
作者 秦杰 杨树强 窦文华 《计算机科学》 CSCD 北大核心 2003年第8期6-9,共4页
XML database is a new database technology. This paper gives an overview about the last research aboutXML database and its related productions,then comparing XML database with traditional RDBMS. We analyze andpoint out... XML database is a new database technology. This paper gives an overview about the last research aboutXML database and its related productions,then comparing XML database with traditional RDBMS. We analyze andpoint out some weaknesses about XML database,and give out our viewpoint. 展开更多
关键词 XML 数据库 数据交换标准 面向对象 应用程序 数据查询 文档格式
下载PDF
基于XML的Web数据挖掘技术 被引量:7
2
作者 宋中山 曾广平 《中南民族大学学报(自然科学版)》 CAS 2005年第1期64-67,共4页
全面分析了 Web挖掘最新技术及发展方向 ,重点分析了 Web结构挖掘、Web内容挖掘方法以及 WebL og挖掘等 ,介绍了基于 XML 的 Web数据挖掘的特点 ,提出了运用 XML 解决 Web数据挖掘中半结构化数据的模型查询与模型抽取的方法 ,并通过实... 全面分析了 Web挖掘最新技术及发展方向 ,重点分析了 Web结构挖掘、Web内容挖掘方法以及 WebL og挖掘等 ,介绍了基于 XML 的 Web数据挖掘的特点 ,提出了运用 XML 解决 Web数据挖掘中半结构化数据的模型查询与模型抽取的方法 ,并通过实例说明了该方法 . 展开更多
关键词 数据挖掘 WEB挖掘 可扩展标记语言 半结构化数据
下载PDF
Web-based多数据源集成系统的研究 被引量:9
3
作者 戴青云 樊沛 +1 位作者 李刚 董逸生 《计算机科学》 CSCD 北大核心 2002年第9期119-120,F004,共3页
1 引言 多数据源信息集成系统是近年来数据库界和人工智能界研究的热点.在复杂的数据库应用环境中,如CIMS、DSS、IQ&AS、DW等,各种数据往往分布在多个不同源系统上,如数据库系统、文件系统,以及Web系统.
关键词 异构数据库 信息集成 Web—based 多数据源集成系统 数据仓库
下载PDF
基于模式发现的在线招聘信息抽取 被引量:5
4
作者 陈建辉 刘利民 《微计算机信息》 北大核心 2006年第09X期194-196,共3页
随着互联网的迅速发展,网络已成为招聘信息的重要来源。但是各个人才招聘网站结构各异、形式多样,人们要花大量的精力才能实现招聘信息的抽取。本文针对招聘信息的显示特点,提出一种基于模式发现的在线招聘信息抽取器设计框架。该信息... 随着互联网的迅速发展,网络已成为招聘信息的重要来源。但是各个人才招聘网站结构各异、形式多样,人们要花大量的精力才能实现招聘信息的抽取。本文针对招聘信息的显示特点,提出一种基于模式发现的在线招聘信息抽取器设计框架。该信息抽取器将PAT数组用于模式发现,实现招聘信息的自动抽取,对以列表、表格形式显示的招聘信息以及类似的在线商品等信息的在线抽取都有较好的效果。 展开更多
关键词 Web抽取 模式发现 半结构化数据 PAT 数组 XML
下载PDF
XML数据库技术研究 被引量:2
5
作者 张赟 《湖北师范学院学报(自然科学版)》 2006年第2期71-74,共4页
对XML数据库技术进行了分析研究,研讨了XML数据库技术与传统的数据库技术的性能比较,指出了目前需要改进的方面。讨论了XML数据库技术未来的发展趋势。
关键词 数据库 NXD XEDB 半结构化数据
下载PDF
XML文档语义检索方法研究 被引量:4
6
作者 莫正波 宋玲 +1 位作者 吕强 邓薇 《计算机工程与应用》 CSCD 2013年第11期121-125,共5页
由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查... 由于半结构文档如XML越来越广泛的应用,在数据库和信息检索领域,对半结构XML数据相似度的研究也变得尤为重要。给定XML文档集D和用户查询q,XML检索即是从D中查找出符合q的XML文档。为了有效地进行XML信息检索,提出了一种新的计算用户查询与XML文档之间相似度的算法。该算法分为三步:基于WordNet对用户查询q进行同义词扩展得到q';将q'和D中的每一篇XML文档都进行数字签名,并通过签名之间的匹配对D进行有效过滤,除去大量不符合用户查询的文档,得到一个文档子集D',D'í D;对q'与D'中的文档进行精确匹配得到检索结果。 展开更多
关键词 可扩展标示语言(XML) 半结构文档 相似度
下载PDF
一种基于后缀树的包装器自动生成方法研究 被引量:2
7
作者 李永丽 张玉良 《计算机工程与应用》 CSCD 北大核心 2007年第34期114-118,共5页
包装器是一种能够从网页中自动抽取数据并将其转换为结构化数据的软件程序。现有的包装器生成系统多是半自动化的,需要用户具有关于目标页面的先验知识,而且大多只能处理简单结构数据,而不能很好地处理具有嵌套结构的数据。提出了一种... 包装器是一种能够从网页中自动抽取数据并将其转换为结构化数据的软件程序。现有的包装器生成系统多是半自动化的,需要用户具有关于目标页面的先验知识,而且大多只能处理简单结构数据,而不能很好地处理具有嵌套结构的数据。提出了一种基于后缀树的包装器自动生成方法,生成的包装器不仅可以处理简单结构数据,还可以处理嵌套结构数据,具有较低的时间复杂度,有一定的实用价值。 展开更多
关键词 网页 信息抽取 后缀树 半结构化数据 包装器自动生成
下载PDF
XML数据库技术研究 被引量:2
8
作者 王唯贤 《河南科学》 2010年第6期736-739,共4页
对XML数据库技术进行了总体分析,介绍了XML的最新研究进展,并将其与传统的数据库技术进行了比较,指出了其目前需要改进的方面.
关键词 XML本源数据库 半结构化数据
下载PDF
面向半结构化数据的树逻辑及其性质研究
9
作者 韩婷婷 陈韬略 +1 位作者 俞春 吕建 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第2期162-170,共9页
 半结构化数据正以其灵活性而成为解决Internet环境下互操作语义层面问题的重要工具和网络数据交换格式的标准.从基础理论层面上对版结构化数据进行研究,在考察了进程代数和空间逻辑的有关结果后,从模型和逻辑系统的角度对半结构化数...  半结构化数据正以其灵活性而成为解决Internet环境下互操作语义层面问题的重要工具和网络数据交换格式的标准.从基础理论层面上对版结构化数据进行研究,在考察了进程代数和空间逻辑的有关结果后,从模型和逻辑系统的角度对半结构化数据特别是XML语言进行刻画.在[1]的基础上,在数据模型中加入了受限算子,并提出一种新的空间逻辑———树逻辑,在其中引入了一个新的模态算子,它们的意义在于能够对私有数据的性质进行刻画和表达.此外,通过修正数据模型中的同余关系,使得模型符合数据的有序性,从而使其更为合理.在此基础上证明了树逻辑系统公式可满足性的不可判定性,从而说明针对整个树逻辑系统的模型检测算法是不存在的.同时选择了其中一个子逻辑系统,给出了其模型检测算法,并证明了该算法的正确性. 展开更多
关键词 半结构化数据 树逻辑 不可判定性 模型检测
下载PDF
一种基于XML的Web数据挖掘技术 被引量:8
10
作者 王建丽 丁振国 《西安科技学院学报》 北大核心 2002年第3期337-340,共4页
阐述了一种基于XML的数据抽取技术 ,并示例如何将该技术应用于Web信息的挖掘 ,通过对实例的剖析 ,提出了有关技术人员如何通过该数据挖掘技术拥有一个维护成本低廉而且可靠的数据抽取系统 。
关键词 数据挖掘 半结构化数据 XML 数据抽取系统 Web 异构数据库 信息发布 数据模型
下载PDF
正则表达式的Web数据提取研究 被引量:4
11
作者 刘松业 《电脑编程技巧与维护》 2008年第15期89-91,共3页
Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Internet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网... Internet正在日益成为一个重要的信息来源,如何对Web数据进行检索和加工,使得用户能够更好地利用Internet上的数据资源己经成为了新的研究热点。文中论述了半自动化数据提取算法,其中使用了基于扩展正则表达式的信息槽提取算法和基于网页特性的事件分割算法。同时描述了利用这些算法的信息提取系统,并详细介绍了系统的体系结构和实现细节。该系统可以被用于真实的Web环境中以提高存储、利用信息的效率,在一定程度上解决在Internet上获取信息及利用信息的困难。 展开更多
关键词 数据提取 算法 正则表达式 半结构化数据
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部