期刊文献+
共找到105篇文章
< 1 2 6 >
每页显示 20 50 100
大数据知识服务的内涵、典型特征及概念模型 被引量:95
1
作者 秦晓珠 李晨晖 麦范金 《情报资料工作》 CSSCI 北大核心 2013年第2期18-22,共5页
文章首先描述了大数据知识服务的内涵,详细分析了大数据知识服务的典型特征,并结合大数据知识服务模式下对各种类型大数据管理和处理需求,给出了大数据知识服务概念模型,最后指出大数据知识服务的实现需要解决大数据的可表示性、可处理... 文章首先描述了大数据知识服务的内涵,详细分析了大数据知识服务的典型特征,并结合大数据知识服务模式下对各种类型大数据管理和处理需求,给出了大数据知识服务概念模型,最后指出大数据知识服务的实现需要解决大数据的可表示性、可处理性、可融合性及可靠性四个关键问题。 展开更多
关键词 大数据 知识服务 半结构化数据 非结构化数据
原文传递
信息集成研究综述 被引量:35
2
作者 杨先娣 彭智勇 +1 位作者 刘君强 李旭辉 《计算机科学》 CSCD 北大核心 2006年第7期55-59,80,共6页
信息集成所要解决的问题是把位于不同的异构信息源上的数据合并起来,以便为用户提供一个这些数据的统一视图。在当前的实际应用中,设计信息集成系统很重要,并且已经成为数据库领域的研究热点。本文对这一领域的研究做了综述,包括信息集... 信息集成所要解决的问题是把位于不同的异构信息源上的数据合并起来,以便为用户提供一个这些数据的统一视图。在当前的实际应用中,设计信息集成系统很重要,并且已经成为数据库领域的研究热点。本文对这一领域的研究做了综述,包括信息集成的方法、逻辑框架、查询处理,以及Web上半结构化数据的集成。最后,对将来的研究主题进行了展望。 展开更多
关键词 信息集成 异构 LAV GAV 半结构化数据
下载PDF
KDW综述:基于Web的数据挖掘 被引量:19
3
作者 恽爽 韩立新 +1 位作者 董浚 陈道蓄 《计算机工程》 CAS CSCD 北大核心 2003年第1期284-286,共3页
由于Web数据所具有的半结构化特征,基于Web的数据挖掘与传统的基于数据库的数据挖掘有许多不同之处。基于Web的数据挖掘主要包括3种数据挖掘任务:对Web内容的挖掘,对Web结构的挖掘和对Web访问的挖掘。该文综述了基于Web的数据挖掘技... 由于Web数据所具有的半结构化特征,基于Web的数据挖掘与传统的基于数据库的数据挖掘有许多不同之处。基于Web的数据挖掘主要包括3种数据挖掘任务:对Web内容的挖掘,对Web结构的挖掘和对Web访问的挖掘。该文综述了基于Web的数据挖掘技术,并介绍了国内在这个领域的研究现状。 展开更多
关键词 KDW WEB 数据挖掘 知识获取 半结构化数据 数据库
下载PDF
基于多知识的Web网页信息抽取方法 被引量:10
4
作者 朱明 黄云 蔡庆生 《小型微型计算机系统》 CSCD 北大核心 2001年第9期1058-1061,共4页
从 Web网页中自动抽取所需要的信息内容 ,是互联网信息智能搜取的一个重要研究课题 .为有效解决网页信息抽取所需的信息描述知识获取问题 ,这里提出了一种基于多知识的 Web网页信息抽取方法 (简称 MKIE方法 ) .该方法将网页信息抽取所... 从 Web网页中自动抽取所需要的信息内容 ,是互联网信息智能搜取的一个重要研究课题 .为有效解决网页信息抽取所需的信息描述知识获取问题 ,这里提出了一种基于多知识的 Web网页信息抽取方法 (简称 MKIE方法 ) .该方法将网页信息抽取所需的知识分为二类 .一类是描绘网页内容本身表示特点 ,以及识别各网页信息对象的确定模式知识 ;另一类则描述网页信息记录块 ,以及各网页信息对象的非确定模式知识 .MKIE方法根据前一类知识 ,动态分析获得后一类知识 ;并利用这两类知识 ,最终完成从信息内容类似但其表现形式各异的网页中 ,抽取出所需要的信息 .美大学教员论文网页信息抽取实验结果表明 。 展开更多
关键词 WEB 网页 信息抽取 知识 互联网
下载PDF
Web信息的自主抽取方法 被引量:15
5
作者 许建潮 侯锟 《计算机工程与应用》 CSCD 北大核心 2005年第14期185-189,198,共6页
提出了基于表格结构及列表结构的W eb页面信息自主抽取的方法。可根据用户对信息的需求自主地从相关页面中抽取信息并将抽取信息按关系模型进行重组存放在数据库中,对表格结构信息源仅需标注一页网页,即可获取抽取知识,通过自学习能够... 提出了基于表格结构及列表结构的W eb页面信息自主抽取的方法。可根据用户对信息的需求自主地从相关页面中抽取信息并将抽取信息按关系模型进行重组存放在数据库中,对表格结构信息源仅需标注一页网页,即可获取抽取知识,通过自学习能够较好地适应网页信息的动态变化,实现信息的自动抽取。对列表结构信息源信息,通过对DOM树结构的分析,动态获得信息块在DOM层次结构中的路径,根据信息对象基本的抽取知识,获得信息对象值。采用自学习的方法以适应网页信息的动态变化。 展开更多
关键词 WEB 半结构化数据 信息抽取 WRAPPER
下载PDF
Native-XML数据库综述 被引量:17
6
作者 李骥 陈福生 《计算机工程与设计》 CSCD 2004年第6期932-934,960,共4页
Native-XML作为一个重要的技术,为面向对象的数据库的存储和处理提供了有力支持。在介绍Native- XML数据库的概念、分类的基础上,分析讨论了现有Native-XML数据库的特点,指出了Native-XML数据库的 应用中的问题,并简单介绍了3个典型的Na... Native-XML作为一个重要的技术,为面向对象的数据库的存储和处理提供了有力支持。在介绍Native- XML数据库的概念、分类的基础上,分析讨论了现有Native-XML数据库的特点,指出了Native-XML数据库的 应用中的问题,并简单介绍了3个典型的Native-XML数据库。 展开更多
关键词 Native-XML 数据库 面向对象 存储 半结构化数据
下载PDF
基于XML的多数据库系统集成数据模型 被引量:3
7
作者 卢晓蓉 陈传波 李兵 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2002年第8期18-20,共3页
随着网络信息的大量积累 ,如何充分利用网络资源已成为一个亟待解决的问题 ,将数据库技术应用到Web数据中是一种较好的解决办法 ,而其中则牵涉到Web数据的结构抽取以及采用什么形式描述这种结构 .基于上述情况 ,提出了如何将一个典型的... 随着网络信息的大量积累 ,如何充分利用网络资源已成为一个亟待解决的问题 ,将数据库技术应用到Web数据中是一种较好的解决办法 ,而其中则牵涉到Web数据的结构抽取以及采用什么形式描述这种结构 .基于上述情况 ,提出了如何将一个典型的半结构化数据 (HTML网页 )经过模式抽取并转换为XIDM描述形式的方法 。 展开更多
关键词 多数据库系统 半结构化数据 模式抽取 公共数据模型 XML
下载PDF
一种基于XML的半结构化数据存储方法 被引量:11
8
作者 吴共庆 陈恩红 《计算机工程》 CAS CSCD 北大核心 2004年第10期57-59,共3页
提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从... 提出了一种基于XML存储半结构化数据的方法,设计并实现了相应存储与解析算法。鉴于OEM模型是一种图状模型,而通常的XML数据模型是树状模型,为此需解决图状模型数据映射为树状模型数据这一关键问题,利用XML元素和属性的语义信息可从语义级别解决该问题。 展开更多
关键词 半结构化数据 OEM模型 XML DOM
下载PDF
数据集成中XML数据查询语义重写 被引量:9
9
作者 高军 唐世渭 +1 位作者 杨冬青 王腾蛟 《计算机研究与发展》 EI CSCD 北大核心 2002年第4期435-442,共8页
查询重写是数据库研究的一个基本问题,它和查询优化、数据仓库、数据集成、语义缓存等数据库问题密切相关.为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图.用户提交查询后,系统尽可能利用中间视图层... 查询重写是数据库研究的一个基本问题,它和查询优化、数据仓库、数据集成、语义缓存等数据库问题密切相关.为提高集成系统的查询效率,系统选择提交频率较高的XML查询物化为中间层视图.用户提交查询后,系统尽可能利用中间视图层中视图,而不是访问数据源来回答查询,这个问题实际可以归结为半结构化查询重写问题.考虑到中间视图层空间的有限性,已有视图应当尽可能回答更多的查询.传统查询重写方法没有考虑半结构化数据之间的约束,而根据约束可以等价变换查询,从而提高中间视图层中的表达能力.提出了一种新的半结构化查询重写的方法,该方法在保证算法正确性和完备性的基础上,利用了半结构化数据中的约束,尤其是XML文档中的路径依赖,来增强中间层物化视图的表达能力.理论分析和初步原型实验证明方法的有效性. 展开更多
关键词 数据集成 XML 数据查询 查询重写 数据库 半结构化数据
下载PDF
模式发现在Web抽取中的应用及设计 被引量:7
10
作者 蔡霞 张森 周宇 《控制工程》 CSCD 2003年第3期227-229,269,共4页
WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。但因每个Web站点的主题各异、形式多样、结构不同,人们往往要花大量精力在人工定位和抽取有用数据上。提出了一个基于模式发现的数据抽取框架,分析了将PAT树用于模式发现的自动... WWW的迅速发展,使其日益成为人们查找有用数据的重要来源。但因每个Web站点的主题各异、形式多样、结构不同,人们往往要花大量精力在人工定位和抽取有用数据上。提出了一个基于模式发现的数据抽取框架,分析了将PAT树用于模式发现的自动数据抽取技术。初步实验结果表明所得的抽取规则能从多数搜索引擎上获得较高的抽取率。该方法对于从搜索引擎的搜索结果等结构化、半结构化网页中自动抽取重复模式具有较好的效果。 展开更多
关键词 WEB 数据抽取 模式发现 搜索引擎 WWW 计算机网络
下载PDF
基于OEM模型的半结构化数据的模式抽取 被引量:8
11
作者 鲁明羽 陆玉昌 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2004年第9期1264-1267,共4页
Web数据是典型的半结构化数据 ,缺乏明确的、预知的、与数据分离存储的外在模式 ,导致查询、浏览和集成Web数据的效率极低。该文提出一种基于 OEM (objectexchange model)模型的半结构化数据的模式抽取算法 ,采用自顶向下的剪枝策略 ,... Web数据是典型的半结构化数据 ,缺乏明确的、预知的、与数据分离存储的外在模式 ,导致查询、浏览和集成Web数据的效率极低。该文提出一种基于 OEM (objectexchange model)模型的半结构化数据的模式抽取算法 ,采用自顶向下的剪枝策略 ,可快速发现频繁简单路径集 ,应用于半结构化数据的集成及查询回答与优化。其特点是可降低目标模式的规模 。 展开更多
关键词 半结构化数据 模式抽取 对象交换模型 剪枝
原文传递
基于多层模式的多记录网页信息抽取方法 被引量:5
12
作者 朱明 王军 王俊普 《计算机工程》 CAS CSCD 北大核心 2001年第9期40-42,共3页
为有效解决网页信息抽取所需知识的获取问题,提出了一种基于多层模式的网页信息抽取方法(简称HPIE方法)。将网页信息抽取知识分为若干层,由抽象到具体逐层描述信息识别模式知识。HPIE方法能够利用各抽取对象之间存在的相互... 为有效解决网页信息抽取所需知识的获取问题,提出了一种基于多层模式的网页信息抽取方法(简称HPIE方法)。将网页信息抽取知识分为若干层,由抽象到具体逐层描述信息识别模式知识。HPIE方法能够利用各抽取对象之间存在的相互联系,以及抽取过程与结果所形成的新学习样本,不断完善多层模式的知识内容,并帮助最终从多个信息内容类似但其描述格式各异的HTML网页中,抽取出所需的多记录信息内容。有关多个(美国大学教员)论文目录网页的抽取实验结果表明,HPIE方法具有较强的网页信息自适应抽取能力。 展开更多
关键词 半结构化数据 信息抽取 模式识别 网页 计算机网络
下载PDF
半结构化数据与关系数据的比较研究 被引量:3
13
作者 庄毅 徐海力 《计算机与现代化》 2004年第1期29-30,37,共3页
围绕将半结构化数据(XML)与关系数据的比较及两者在性能上问题,进行了一些讨论。并通过一个试验程序,具体考察了半结构化数据和关系数据在处理较大规模数据(1万条记录以上)时性能上的差异。最后,对于其在这个领域内的应用,给出了一些探... 围绕将半结构化数据(XML)与关系数据的比较及两者在性能上问题,进行了一些讨论。并通过一个试验程序,具体考察了半结构化数据和关系数据在处理较大规模数据(1万条记录以上)时性能上的差异。最后,对于其在这个领域内的应用,给出了一些探讨性的结论。 展开更多
关键词 半结构化数据 关系数据 半结构化文档 数据库 计算机
下载PDF
基于半结构化数据的新型产品结构模式研究 被引量:8
14
作者 董峥 徐晓飞 战德臣 《计算机集成制造系统-CIMS》 EI CSCD 北大核心 2003年第1期15-19,共5页
针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向... 针对二维表父子关系存储结构的不足,提出基于XML半结构化数据的新型产品结构解决方案。设计了基于XML的可重用构件库,以提高产品设计效益;同时提出以踪迹树为核心的产品结构树动态联接思想,以平衡系统的存储与计算能力;给出了踪迹树向产品结构树的映射算法,并提出了可屏蔽系统复杂性的产品结构服务模型。 展开更多
关键词 半结构化数据 产品结构模式 可扩展标记语言 踪迹树 产品数据管理 制造业
下载PDF
数据库技术:回顾与展望 被引量:7
15
作者 周傲英 邱越峰 +1 位作者 田增平 施伯乐 《计算机科学》 CSCD 北大核心 1999年第4期17-21,共5页
数据库系统的研究和开发在其三十年的历史中取得了巨大的成功,形成了一个数百亿美元的产业。数据库技术和系统的应用已经遍及各个领域,奠定了数据库系统作为当今社会信息基础设施核心技术的地位。尽管如此,数据库的研究和发展一刻也来... 数据库系统的研究和开发在其三十年的历史中取得了巨大的成功,形成了一个数百亿美元的产业。数据库技术和系统的应用已经遍及各个领域,奠定了数据库系统作为当今社会信息基础设施核心技术的地位。尽管如此,数据库的研究和发展一刻也来曾停止过,传统的研究主要集中在增强和提高数据库管理系统(DBMS)的功能和性能上。但是,DBMS作为管理大容量数据的工具无疑会受到所管理的对象和所应用的环境的影响。目前。 展开更多
关键词 数据库 DBMS 数据管理 数据模型 数据挖掘
下载PDF
XML数据库存储策略综述 被引量:8
16
作者 门爱华 冯建华 周立柱 《计算机科学》 CSCD 北大核心 2005年第9期13-17,共5页
XML是SGML一个子集,本质上是一种特殊的SGML标记语言。XML已经成为Internet上数据表示和数据交换的新标准,被认为是最有前途的一种半结构化数据组织方式。XML的重点是管理信息的数据本身,而不是数据的样式。XML这种明确的分工导致的将... XML是SGML一个子集,本质上是一种特殊的SGML标记语言。XML已经成为Internet上数据表示和数据交换的新标准,被认为是最有前途的一种半结构化数据组织方式。XML的重点是管理信息的数据本身,而不是数据的样式。XML这种明确的分工导致的将是更高效的 Web程序设计,更快的搜索引擎、更统一的数据表示和更方便的数据交流的出现。因为底层的存储表达对上层的查询处理和优化有着重要的性能影响,所以如何存储XML文档才是最好的方式已经成为一个重要问题。本文介绍了几种XML数据库的存储策略,并对每种存储策略进行了描述、分析,然后对几种存储策略进行了性能和优缺点的比较。 展开更多
关键词 XIVIL 半结构化数据 数据库 存储策略 结点 簇集
下载PDF
基于XML的制造业产品结构的有效实现 被引量:3
17
作者 吴冬梅 王树国 蔡鹤皋 《组合机床与自动化加工技术》 北大核心 2002年第10期15-17,19,共4页
在对传统产品结构在物理存储结构及逻辑效用弊端分析的基础上 ,提出了基于XML半结构化数据的产品结构的物理形式 ,并基于此结构构建产品可重用构件库。利用XSLT的自动映射机制 ,有效实现了产品结构树在存储、显示和应用方面的综合优化。
关键词 制造业 产品结构 XML XSLT BOM 半结构化数据
下载PDF
一种结构化数据和半结构化数据的统一集成模型 被引量:5
18
作者 李生琦 徐福缘 徐莹 《计算机工程与应用》 CSCD 北大核心 2004年第15期34-36,100,共4页
结构化和半结构化数据的统一集成和访问是目前Web数据访问中急需解决的问题。文章提出了一种半结构化数据表示模型———层次数据图(HDG),给出了结构化数据向HDG的转换方法,并就不同结构HDG的统一集成问题进行了探究。
关键词 半结构化数据 层次数据图 关系模型 集成
下载PDF
网际网上半结构化数据抽取与知识发现方法及其实现 被引量:7
19
作者 陈恩红 范焱 +1 位作者 王行甫 蔡庆生 《计算机科学》 CSCD 北大核心 1999年第10期49-52,共4页
1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只... 1.引言在信息化程度日益提高的今天,半结构化信息已遍及社会的各个领域。例如,网际网(World WideWeb,又称WWW)已成为一个巨大的信息源,然而WWW上的信息并不能以一种通用的方式进行查询及操纵,大量的信息是以静态的HTML文本形式存储并只能通过浏览器来浏览,因此如何有效利用这类信息显得尤为重要。 展开更多
关键词 网际网 数据抽取 知识发现 半结构化数据
下载PDF
半结构化数据的表示及查询方法研究 被引量:1
20
作者 陈恩红 石竹 王煦法 《计算机工程》 CAS CSCD 北大核心 2001年第5期5-7,共3页
介绍了如何将网页中的有用住处提取出来,并以为数据模型将其组织存储的方法,以及在这种存储模型上对半结构化数据WWWOEM的查询方法。
关键词 半结构化数据 对象交换模型 数据模型 数据查询 数据库 WWW 网页
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部