期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
针对XML流数据的复杂Twig Pattern查询处理 被引量:9
1
作者 杨卫东 王清明 施伯乐 《软件学报》 EI CSCD 北大核心 2007年第4期893-904,共12页
XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独... XML流数据处理在研究领域引起了研究者的广泛兴趣.针对XML流数据的、具有嵌套AND/OR谓词的复杂Twig Pattern查询处理,提出一种新方法.为了提高查询处理性能,将所有Twig Pattern合并为一个共享前缀的查询树,其中,AND/OR谓词被表示为单独的抽象语法树,因而能够以文档顺序、单遍地处理复杂Twig Pattern的匹配,并避免了YFilter中对嵌套谓词进行后置处理所产生的中间结果.实验结果表明,该方法能够有效改善Twig Pattern的处理性能,尤其是在处理大文档的情况下.基于已有的研究工作,讨论如何利用DTD(document type definition)的结构和约束信息优化Twig Pattern,即这种优化是在系统运行前进行的预处理. 展开更多
关键词 XML文档流 xPam twig PATTERN 查询树 DTD(document type definition)
下载PDF
F-Index:一种加速Twig查询处理的扁平结构索引 被引量:4
2
作者 周军锋 孟小峰 +1 位作者 蒋瑜 谢敏 《软件学报》 EI CSCD 北大核心 2007年第6期1429-1442,共14页
如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查... 如何快速、有效地处理twig形式的查询是XML查询处理的关键问题,通过过滤与查询无关的元素可以减少查询中需要处理的元素数目,从而提高查询的执行效率.提出一种扁平结构索引F-Index,能够快速过滤所有与查询无关的索引结点,进而过滤掉查询无关的元素,在处理深度嵌套的复杂结构XML文档时具有很大的优势.提出一种新的查询算法,能够有效处理过滤后剩余元素的匹配问题.基于不同数据集的实验表明,使用F-Index进行过滤可以极大地提高查询处理的性能. 展开更多
关键词 XML 查询优化 twig查询 过滤 结构索引
下载PDF
XML数据中Twig查询处理与优化技术研究综述 被引量:8
3
作者 毕鑫 王国仁 +2 位作者 赵相国 袁野 张盼 《计算机科学与探索》 CSCD 2013年第9期769-782,共14页
可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布... 可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布式XML数据、不确定XML数据、图模型XML数据中的发展现状,并分析了存在的问题和挑战,最后探讨了Twig查询处理与优化技术今后的发展趋势和研究方向。 展开更多
关键词 twig查询 可扩展标记语言(XML) 分布式XML数据 不确定XML数据 图模型XML数据
下载PDF
一种复杂XML Twig查询处理算法 被引量:3
4
作者 郭红 沈煌 《小型微型计算机系统》 CSCD 北大核心 2008年第11期2012-2015,共4页
根据复杂Twig查询的特点,充分利用DTD资源,建立一种基于DTD的索引结构,采用Dewey编码方法对XML文档进行统一编码,并提出一种基于DTD的复杂Twig查询处理算法STwigScan;查询时,通过扫描DTD索引,将复杂Twig查询定位在条件节点以及目标节点... 根据复杂Twig查询的特点,充分利用DTD资源,建立一种基于DTD的索引结构,采用Dewey编码方法对XML文档进行统一编码,并提出一种基于DTD的复杂Twig查询处理算法STwigScan;查询时,通过扫描DTD索引,将复杂Twig查询定位在条件节点以及目标节点上,有效的减少查询处理算法的处理规模;实验证明,STwigScan算法处理规模比较小,查询效率比较高. 展开更多
关键词 XML XML twig 查询处理
下载PDF
有效支持XML结构化连接的索引——CATI 被引量:2
5
作者 于亚新 王国仁 +1 位作者 张海宁 李建新 《计算机研究与发展》 EI CSCD 北大核心 2007年第1期111-118,共8页
结构化连接的效率直接影响着XML查询的性能,目前对XML的结构化连接大多都是基于编码的方法.介绍了一种全新的有效支持XML结构化连接的树索引CATI(compact ancestor tree index).CATI的基本思想是,对于给定的一个祖先后代查询(A-D查询)或... 结构化连接的效率直接影响着XML查询的性能,目前对XML的结构化连接大多都是基于编码的方法.介绍了一种全新的有效支持XML结构化连接的树索引CATI(compact ancestor tree index).CATI的基本思想是,对于给定的一个祖先后代查询(A-D查询)或Twig查询,遍历XML文档,找出所有的祖先A的实例,用以建立CATI的主干;对于每个A实例,找出它的直接后代D的实例链接在它的后面.因为经典的结构连接算法Stack-Tree算法效率较高且使用较广,因此应用基于CATI的结构连接算法和基于Stack-Tree的结构连接算法就A-D查询和Twig查询做了大量实验.实验结果表明,基于CATI的结构化连接在一般查询情况下性能明显优于基于Stack-Tree的结构化连接. 展开更多
关键词 XML 结构化连接 紧凑祖先树索引 祖先后代查询 twig查询 Stack—Tree
下载PDF
Efficient processing of partially specified twig pattern queries 被引量:1
6
作者 ZHOU JunFeng MENG XiaoFeng LING TokWang 《Science in China(Series F)》 2009年第10期1830-1847,共18页
As huge volumes of data are organized or exported in tree-structured form, it is quite necessary to extract useful information from these data collections using effective and efficient query processing methods. A natu... As huge volumes of data are organized or exported in tree-structured form, it is quite necessary to extract useful information from these data collections using effective and efficient query processing methods. A natural way of retrieving desired information from XML documents is using twig pattern (TP), which is, actually, the core component of existing XML query languages. Twig pattern possesses the inherent feature that query nodes on the same path have concrete precedence relationships. It is this feature that makes it infeasible in many actual scenarios. This has driven the requirement of relaxing the complete specification of a twig pattern to express more flexible semantic constraints in a single query expression. In this paper, we focus on query evaluation of partially specified twig pattern (PSTP) queries, through which we can reap the most flexibility of specifying partial semantic constraints in a query expression. We propose an extension to XPath through introducing two Samepath axes to support partial semantic constraints in a concise but effective way. Then we propose a stack based algorithm, pTwigStack, to process a PSTP holistically without deriving the concrete twig patterns and then processing them one by one. Further, we propose two DTD schema based optimization methods to improve the performance of pTwigStack algorithm. Our experimental results on various datasets indicate that our method performs significantly better than existing ones when processing PSTPs. 展开更多
关键词 XML database query processing partially specified twig pattern holistic twig join XPATH
原文传递
一种基于语义信息的XML Twig查询处理方法 被引量:2
7
作者 何志学 廖湖声 《微电子学与计算机》 CSCD 北大核心 2015年第5期95-98,103,共5页
为了提高XML数据库查询引擎中核心的Twig查询处理效率,提出基于语义信息的Twig查询处理TwigRT算法.该算法根据XML模式定义中的对象语义信息识别XML数据中的对象,将其属性和值存储在关系数据库表中;Twig查询分解为内容查询和结构查询两部... 为了提高XML数据库查询引擎中核心的Twig查询处理效率,提出基于语义信息的Twig查询处理TwigRT算法.该算法根据XML模式定义中的对象语义信息识别XML数据中的对象,将其属性和值存储在关系数据库表中;Twig查询分解为内容查询和结构查询两部分,其中内容查询部分通过SQL在数据库表中的查询实现,起到缩减结构查询范围的作用;结构查询部分通过整体结构匹配算法实现.最后通过实验验证了算法的有效性. 展开更多
关键词 XML查询 twig算法 语义信息
下载PDF
基于部分求值的Twig查询优化 被引量:1
8
作者 高万辰 廖湖声 苏航 《计算机工程》 CAS CSCD 北大核心 2016年第3期53-60,68,共9页
Tree Match算法是一种有效的Twig查询匹配算法,但其存在反复分析Twig模式的缺点。针对该问题,引入编译中的部分求值技术,提出一种Twig查询优化方案。通过部分求值提前完成对Twig模式的分析,生成查询专用的指令序列代替原查询程序,并给... Tree Match算法是一种有效的Twig查询匹配算法,但其存在反复分析Twig模式的缺点。针对该问题,引入编译中的部分求值技术,提出一种Twig查询优化方案。通过部分求值提前完成对Twig模式的分析,生成查询专用的指令序列代替原查询程序,并给出查询机执行引擎,从而消除重复计算,优化XML树模式查询过程。实验结果表明,在不同Twig模式下,该优化方案能够有效提高XML查询的执行效率。 展开更多
关键词 可扩展标记语言数据库 Xquery语言 XPath语言 twig查询 编译 部分求值 树模式查询
下载PDF
Efficient Processing of Distributed Twig Queries Based on Node Distribution 被引量:1
9
作者 Xin Bi Xiang-Guo Zhao Guo-Ren Wang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第1期78-92,共15页
Massive XML data are increasingly generated for the representation, storage and exchange of web information. Twig query processing over massive XML data has become a research focus. However, most traditional algorithm... Massive XML data are increasingly generated for the representation, storage and exchange of web information. Twig query processing over massive XML data has become a research focus. However, most traditional algorithms cannot be directly implemented in a distributed manner. Some of the existing distributed algorithms generate a lot of useless intermediate results and execute many join operations of partial results in most cases; others require the priori knowledge of query pattern before XML partition, storage and query processing, which is impractical in the cases of large-scale data or frequent incoming new queries. To improve efficiency and scalability, in this paper, we propose a 3-phase distributed algorithm DisT3 based on node distribution mechanism to avoid unnecessary intermediate results. Furthermore, we propose a lightweight local index ReP with an enhanced XML partitioning approach using arbitrary partitioning strategy, and based on ReP we propose an improved 2-phase distributed algorithm DisT2ReP to further reduce the communication cost. After the performance guarantees are analyzed, extensive experiments are conducted to verify the efficiency and scalability of our proposed algorithms in distributed twig query applications. 展开更多
关键词 XML twig query distributed computing node distribution
原文传递
分布式XML Twig查询处理方法 被引量:1
10
作者 何志学 廖湖声 王静 《计算机工程与设计》 北大核心 2016年第1期123-126,210,共5页
在单机环境下,难以处理半结构化XML大数据查询,为此分析Twig查询的结构匹配特征,基于MapReduce编程模型,提出TwigMRR算法对XML Twig查询进行分布式处理。对XML数据进行Dewey编码,水平切分后存储于分布式文件系统,通过执行Map-Reduce-Red... 在单机环境下,难以处理半结构化XML大数据查询,为此分析Twig查询的结构匹配特征,基于MapReduce编程模型,提出TwigMRR算法对XML Twig查询进行分布式处理。对XML数据进行Dewey编码,水平切分后存储于分布式文件系统,通过执行Map-Reduce-Reduce任务对Twig分解后的线性路径查询进行分布式并行计算以取得结果。实验结果验证了该算法的有效性和完整性,与类似算法的比较结果表明了其在处理效率方面的优势。 展开更多
关键词 分布式计算 twig查询 MAPREDUCE模型 XML数据 HADOOP平台
下载PDF
标签劣质的XML数据上的查询处理 被引量:1
11
作者 姜国华 姜守旭 +2 位作者 王宏志 李建中 高宏 《计算机科学与探索》 CSCD 2011年第8期673-685,共13页
XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XM... XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。 展开更多
关键词 劣质数据 可扩展标记语言(XML) twig查询
下载PDF
Path-partitioned encoding supports wildcard-awareness twig queries
12
作者 徐小双 冯玉才 王锋 《Journal of Shanghai University(English Edition)》 2009年第5期363-374,共12页
Finding all occurrences of a twig query in an XML database is a core operation for efficient evaluation of XML queries. It is important to effiectively handle twig queries with wildcards. In this paper, a novel path-p... Finding all occurrences of a twig query in an XML database is a core operation for efficient evaluation of XML queries. It is important to effiectively handle twig queries with wildcards. In this paper, a novel path-partitioned encoding scheme is proposed for XML documents to capture paths of all elements, and a twig query is modeled as an XPattern extended from tree pattern. After definition, simplification, normalization, verification and initialization of the XPattern, both work sets and a join plan are generated. According to these measures, an effiective algorithm to answer for a twig query, called DMTwig, is designed without unnecessary elements and invalid structural joins. The algorithm can adaptively deal with twig queries with branch ([ ]), child edge (/), descendant edge (//), and wildcard (*) synthetically. We show that path-partitioned encoding scheme and XPattern guarantee the I/O and CPU optimality for twig queries. Experiments on representative data set indicate that the proposed solution performs significantly. 展开更多
关键词 XML tree pattern structural join encoding scheme twig query
下载PDF
基于模式的XML Twig查询处理方法
13
作者 赵逸智 何志学 张云峰 《北华航天工业学院学报》 CAS 2016年第5期16-19,共4页
针对XML Twig查询中,祖先-后裔关系和通配符带来的不确定性,提出了一种基于文档模式处理Twig查询的方法 STwigStack。首先将Twig查询与模式树进行匹配,得到该查询对应的具体查询类型,将不确定的元素确定化;然后,采用处理Twig查询的通用... 针对XML Twig查询中,祖先-后裔关系和通配符带来的不确定性,提出了一种基于文档模式处理Twig查询的方法 STwigStack。首先将Twig查询与模式树进行匹配,得到该查询对应的具体查询类型,将不确定的元素确定化;然后,采用处理Twig查询的通用算法TwigStack计算确定化后的查询结果;最后通过实验对比分析了STwigStack与TwigStack的运行效率,验证了所提出算法的有效性。 展开更多
关键词 XML SCHEMA 查询处理 twig查询 XML数据
原文传递
一种标签劣质XML数据上的twig查询处理的优化
14
作者 姜国华 姜守旭 李建中 《智能计算机与应用》 2011年第2X期53-54,72,共3页
XML数据中的不正确数据、不一致数据、不精确数据等劣质教据给XML数据上的有效查询处理带来了挑战。专注于研究标签劣质的XML数据上twig查询处理的优化方法,文中分别给出了优化方法的原理、伪代码、正确性证明和复杂度分析,并通过例... XML数据中的不正确数据、不一致数据、不精确数据等劣质教据给XML数据上的有效查询处理带来了挑战。专注于研究标签劣质的XML数据上twig查询处理的优化方法,文中分别给出了优化方法的原理、伪代码、正确性证明和复杂度分析,并通过例子加以解释。通过实验验证了优化方法的效率。 展开更多
关键词 XML twig查询 查询优化
下载PDF
基于关键字之间结构关系的XML查询结果排序方法 被引量:2
15
作者 任建华 周建 +1 位作者 孟祥福 魏珂 《计算机科学》 CSCD 北大核心 2013年第6期178-182,214,共6页
非空结果的XML关键字查询中,多个查询关键字之间必然存在联系,这种联系可以通过SLCA(最紧致片段)的结构关系获得。基于SLCA的结构关系,提出了一种推测多个关键字内在联系的XML关键字查询结果排序方法:通过LISA II算法获得SLCA;根据SLCA... 非空结果的XML关键字查询中,多个查询关键字之间必然存在联系,这种联系可以通过SLCA(最紧致片段)的结构关系获得。基于SLCA的结构关系,提出了一种推测多个关键字内在联系的XML关键字查询结果排序方法:通过LISA II算法获得SLCA;根据SLCA的结构信息推测出各个关键字之间的内在结构关系,得到所有关键字组成的关系树;然后根据关系树中各关键字对查询结点的严格程度得到对应SLCA的重要程度,据此得到有序的SLCA并输出。该方法利用了XML文档的结构信息对查询结果进行排序。实验结果和分析表明,提出的方法具有较高的准确率,能够较好地满足当前用户的需求和偏好。 展开更多
关键词 关键字查询 SLCA 小枝查询 结果排序 准确率
下载PDF
一种分布式系统上的元数据管理系统 被引量:2
16
作者 魏光辉 李杰斌 +2 位作者 王程玉 何震瀛 汪卫 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期416-420,共5页
元数据是描述数据及资源属性的数据.集中式的元数据管理会存在系统性能瓶颈、单点失效、数据容错差和难以扩展等缺点.而随着云计算的深入研究和广泛应用,涌现出很多高可用的分布式平台.HMS是一种架构在HBase?Hadoop平台上的元数据管理系... 元数据是描述数据及资源属性的数据.集中式的元数据管理会存在系统性能瓶颈、单点失效、数据容错差和难以扩展等缺点.而随着云计算的深入研究和广泛应用,涌现出很多高可用的分布式平台.HMS是一种架构在HBase?Hadoop平台上的元数据管理系统,旨在分布式系统上提供一种元数据管理服务,并保证有效性和高可用性.本系统提供元数据管理所需要的CRUD操作的支持,并且提供实体查询的扩展支持. 展开更多
关键词 XML 小枝查询 分布式系统
下载PDF
采用流水线方式的XML整体小枝查询方案 被引量:1
17
作者 付林林 廖湖声 +1 位作者 高红雨 陈荣鑫 《计算机研究与发展》 EI CSCD 北大核心 2011年第S3期105-113,共9页
随着XML在数据交换和数据表示领域扮演着越来越重要的角色,近年来,为了提高小枝查询的效率,研究人员提出了多种方案,然而一些方法没有考虑如何利用多核计算资源;一些方法需要预先掌握XML数据整体拓扑结构.为了高效实现XML整体小枝查询,T... 随着XML在数据交换和数据表示领域扮演着越来越重要的角色,近年来,为了提高小枝查询的效率,研究人员提出了多种方案,然而一些方法没有考虑如何利用多核计算资源;一些方法需要预先掌握XML数据整体拓扑结构.为了高效实现XML整体小枝查询,TwigPipe算法采用流水线方式,并提出了新的数据划分策略和查询算法,结合更为简单的数据中间表示形式以及预先枚举机制,TwigPipe算法能够有效地提高查询效率和降低内存需求. 展开更多
关键词 XML 小枝查询 流水方式 整体查询算法
下载PDF
一种基于XML小枝查询片段松弛的近似查询与结果排序方法
18
作者 魏珂 任建华 孟祥福 《计算机科学》 CSCD 北大核心 2012年第10期164-169,共6页
提出了一种基于XML小枝查询片段松弛的近似查询与结果排序方法来实现用户在XML文档中的近似查询:通过收集用户的查询历史来推测用户偏好,并以此计算原始小枝查询分解得到的查询片段的重要程度,然后按照重要程度的排序进行查询松弛;在松... 提出了一种基于XML小枝查询片段松弛的近似查询与结果排序方法来实现用户在XML文档中的近似查询:通过收集用户的查询历史来推测用户偏好,并以此计算原始小枝查询分解得到的查询片段的重要程度,然后按照重要程度的排序进行查询松弛;在松弛方法中,根据查询片段数目的不同采用不同的松弛方法,若片段数目较多则以查询片段为粒度对其松弛,较少则以查询结点为粒度对数值查询与非数值查询采用不同的方法进行松弛,得到最为相关的近似查询结果;最后按近似查询结果对原始查询和用户偏好的满足程度进行排序并输出。实验证明,该近似查询方法能够较好地满足用户的需求和偏好,具有较高的查全率和准确率。 展开更多
关键词 小枝查询 近似查询 查询松弛 用户偏好 结果排序
下载PDF
面向Twig查询的XML类型推导
19
作者 罗卿 廖湖声 杨红丽 《计算机研究与发展》 EI CSCD 北大核心 2013年第S1期32-43,共12页
Twig查询是XML数据查询的核心操作.在复杂的XML数据处理中,Twig查询结果的类型信息可以用于优化后续的XML数据查询与处理.针对这种情况,分析了Twig查询的类型推导问题,提出了一种精确的XML类型推导方法,能够根据Twig查询中的结构约束和... Twig查询是XML数据查询的核心操作.在复杂的XML数据处理中,Twig查询结果的类型信息可以用于优化后续的XML数据查询与处理.针对这种情况,分析了Twig查询的类型推导问题,提出了一种精确的XML类型推导方法,能够根据Twig查询中的结构约束和输入数据的数据类型,推导出查询结果的精确类型,从而为作用于Twig查询结果的XML数据处理提供更加精确的XML类型信息,以支持更深入的静态类型检查和提供更多的类型相关的查询优化的机会.该方法包括XML模式图到XML类型树的转换、XML类型树上的Twig模式匹配、可共存类型节点判断和XML类型树的子类型化,以不同子类型化的XML类型树的形式为不同种类的Twig查询结果提供了精确的类型信息.实验说明了这种类型推导方法的有效性. 展开更多
关键词 XML 类型推导 twig查询 XML SCHEMA
下载PDF
LCA关系序对导引小枝查询
20
作者 徐小双 冯玉才 +1 位作者 王锋 周英飚 《小型微型计算机系统》 CSCD 北大核心 2010年第3期398-403,共6页
让关系数据库支持XML数据存储和查询,是XML领域重要的研究分支.DM XML系统以关系数据库为平台,融合结构映射和模型映射,根据路径统计实现了路径分区的编码方案.提出了DM XML查询模式集的解析、验证和生成方法.集合中的模式对应唯一的约... 让关系数据库支持XML数据存储和查询,是XML领域重要的研究分支.DM XML系统以关系数据库为平台,融合结构映射和模型映射,根据路径统计实现了路径分区的编码方案.提出了DM XML查询模式集的解析、验证和生成方法.集合中的模式对应唯一的约束节点LCA关系序对,该序对并能严格地转化为等价的SQL查询.从实验数据分析,表明了DM XML编码方案的合理性和路径查询的高效性. 展开更多
关键词 路径表达式 树模式 最近公共祖先 结构连接 twig查询
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部