期刊文献+
共找到26篇文章
< 1 2 >
每页显示 20 50 100
XML数据中Twig查询处理与优化技术研究综述 被引量:8
1
作者 毕鑫 王国仁 +2 位作者 赵相国 袁野 张盼 《计算机科学与探索》 CSCD 2013年第9期769-782,共14页
可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布... 可扩展标记语言(extensible markup language,XML)数据已被广泛应用于网络数据交换和存储领域。作为XML数据查询的核心操作,Twig查询处理与优化技术具有十分重要的研究意义。为此,全面总结了Twig查询处理与优化技术在传统XML数据、分布式XML数据、不确定XML数据、图模型XML数据中的发展现状,并分析了存在的问题和挑战,最后探讨了Twig查询处理与优化技术今后的发展趋势和研究方向。 展开更多
关键词 TWIG查询 可扩展标记语言(xml) 分布式xml数据 不确定xml数据 图模型xml数据
下载PDF
基于扩展倒排索引的不确定XML关键字查询算法 被引量:4
2
作者 牛大伟 苏龙超 +1 位作者 韩雨童 张晓琳 《计算机应用与软件》 CSCD 2015年第4期247-251,共5页
现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的... 现有的不确定XML关键字查询算法均需遍历不确定XML文档,并且算法在执行过程中需要频繁的字符串比较,造成时间浪费。针对上述问题,提出基于扩展倒排索引的不确定XML关键字查询算法Pr E。扩展倒排索引有效地存储了不确定XML文档中节点的相关信息,根据扩展倒排索引即可初始化动态哈希表和序号编码链表,并且Pr E算法在执行过程中利用整数的比较代替了字符串的比较。理论分析与实验结果表明,Pr E算法是一种高效的不确定XML关键字查询算法。 展开更多
关键词 不确定xml 关键字查询 扩展倒排索引 PRE
下载PDF
不确定XML的Top-k关键字查询算法研究 被引量:3
3
作者 张晓琳 苏龙超 +1 位作者 韩雨童 王静宇 《小型微型计算机系统》 CSCD 北大核心 2014年第12期2691-2696,共6页
目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtr... 目前不确定XML的Top-k关键字查询仅返回概率值排在前k的根节点,需要进一步的处理才能构建满足特定条件下的子树,效率低下.针对这一问题,定义了一种新的基于最小相关联通子树的Top-k查询语义SRCT-Top-k(smallest related connected subtree Top-k),SRCT-Top-k查询返回概率值排在前k的最小相关联通子树,并提出基于动态Keyw ord数据仓的Pr ListTop-k算法来处理SRCT-Top-k查询.Pr List Top-k算法仅扫描一次动态Keyw ord数据仓就能构建满足特定条件下的子树,并制定了过滤策略减少了中间结果.理论分析和实验结果表明,Pr List Top-k是一种高效的不确定XML的Top-k查询算法. 展开更多
关键词 不确定xml 最小相关联通子树 TOP-K 关键字查询
下载PDF
一种非归并不确定XML小枝模式查询算法 被引量:2
4
作者 刘立新 张晓琳 +2 位作者 吕庆 张换香 褚艳华 《计算机科学》 CSCD 北大核心 2013年第5期198-200,228,共4页
针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的... 针对目前不确定XML小枝模式查询需要存储大量中间结果和归并中间结果的情况,提出一种非归并不确定XML小枝模式查询算法ProTwigList。该算法查询之前通过Tag+Level流进行剪枝,以减少待处理节点的数目;并扩展了区间编码来对剪枝后剩余的普通节点进行编码,用一定规则对分布节点进行标识;查询时采用公共分布节点路径的方法处理分布结点,最后结合最低公共祖先节点的概率计算查询结果的概率值。理论分析和实验结果证明了ProTwigList算法的查询效率。 展开更多
关键词 不确定xml P-文档 分布节点 区间编码 小枝模式
下载PDF
基于概率SLCA的XML过滤 被引量:2
5
作者 张晨静 王晓玲 周傲英 《计算机学报》 EI CSCD 北大核心 2014年第9期1959-1971,共13页
不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(... 不确定数据管理逐渐成为一个重要的研究方向.作为网络交换重要标准的XML数据的不确定管理也成为一个研究热点.基于关键字的概率XML检索是其中一个重要的分支.目前对于概率XML关键字检索的研究,都只考察了结点之间的独立(IND)关系和互斥(MUX)关系.由于更普遍的结点依赖关系在表述和计算上的复杂性,较少有工作讨论.文中讨论概率XML模型PrXML^({exp,ind,mux})中基于SLCA语义的关键字过滤.这种模型中通过EXP结点描述更普遍的结点依赖关系.文中在定义了子树中关键字概率分布表tab及其相关的运算后,分别给出了模型中不同类型结点关键字概率分布表的计算方法,并给出了不需要构造可能世界直接求解SLCA结点概率的算法.文章通过实验评估了算法的特性和性能. 展开更多
关键词 不确定数据 概率xml 关键字过滤 SLCA 关键字概率分布表
下载PDF
PrList:一种高效的不确定XML关键字查询算法
6
作者 张晓琳 苏龙超 +1 位作者 韩雨童 刘立新 《微电子学与计算机》 CSCD 北大核心 2014年第3期36-39,43,共5页
提出基于动态Keyword数据仓的不确定XML关键字查询算法PrList.算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的结点求解SLCA节点,不需要进出栈和字符串的比较.实验结果表明,PrList算法是一种高效的不确定... 提出基于动态Keyword数据仓的不确定XML关键字查询算法PrList.算法首先初始化动态Keyword数据仓,然后自底向上、自左向右遍历Keyword数据仓中的结点求解SLCA节点,不需要进出栈和字符串的比较.实验结果表明,PrList算法是一种高效的不确定XML关键字查询算法. 展开更多
关键词 不确定xml 关键字查询 动态Keyword数据仓 PrList
下载PDF
不确定XML序列匹配等价性研究 被引量:1
7
作者 张晓琳 王鹏 《计算机工程与设计》 CSCD 北大核心 2014年第5期1674-1677,1704,共5页
为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的... 为了保持等价性,将序列匹配应用到不确定XML小枝模式匹配,需要重新考虑假警报和假不予考虑问题。针对这一问题,对不确定XML序列匹配中模式树序列化、子序列匹配和结构过滤的等价性进行分析,使得序列匹配应用到不确定XML小枝模式匹配的理论依据更为完备;通过实验对不确定XML序列匹配的等价性和效率进行验证。理论分析和实验结果表明,序列匹配应用到不确定XML与普通XML是等价的,具有较高的效率。 展开更多
关键词 序列匹配 小枝模式匹配 不确定xml 等价性 假警报 假不予考虑
下载PDF
基于LSPI索引的不确定XML查询处理算法 被引量:1
8
作者 张晓琳 韩雨童 +1 位作者 苏龙超 谭跃生 《计算机应用研究》 CSCD 北大核心 2014年第7期2078-2081,2100,共5页
针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效... 针对目前已有XML通配符查询处理需将文档中所有元素标签读入内存中,匹配效率低的问题,提出一种新的基于LSPI(leaf sibling of path information)索引的不确定XML包含通配符和复杂谓词的查询处理算法Prob-BooleanStarTwig。算法基于有效过滤策略自底向上进行模式匹配,将通配符转换成A-D关系和层次信息约束,解决传统通配符匹配问题,避免多次扫描查询模式,提高查询速度。理论分析和实验结果表明,算法的查询效率明显优于已有的算法。 展开更多
关键词 不确定xml 通配符查询 LSPI索引 小枝模式匹配
下载PDF
不确定XML序列匹配关键技术研究
9
作者 张晓琳 王鹏 《微电子学与计算机》 CSCD 北大核心 2014年第4期123-127,共5页
不确定XML小枝模式匹配的关键技术包括不确定XML文档格式,互斥节点识别,实例树概率计算和概率阈值过滤.目前,不确定XML二元结构连接和整体匹配方法无法充分利用算法的特点解决关键技术问题,针对这一不足,将序列匹配应用到不确定XML小枝... 不确定XML小枝模式匹配的关键技术包括不确定XML文档格式,互斥节点识别,实例树概率计算和概率阈值过滤.目前,不确定XML二元结构连接和整体匹配方法无法充分利用算法的特点解决关键技术问题,针对这一不足,将序列匹配应用到不确定XML小枝模式匹配,并对不确定XML序列匹配关键技术问题进行分析和证明,理论分析和实验结果表明序列匹配方法应用到不确定XML小枝模式匹配是有效的. 展开更多
关键词 不确定xml 小枝模式匹配 序列匹配 概率阈值过滤
下载PDF
高效的连续不确定XML数据Top-k查询算法
10
作者 张晓琳 郑春红 +1 位作者 刘立新 吕庆 《计算机工程与科学》 CSCD 北大核心 2014年第6期1101-1107,共7页
目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又... 目前,不确定XML数据的top-k查询算法中都没有处理连续不确定数据,本文提出SPCProTJFast算法,该算法改进了传统的归并算法,并结合连续不确定数据的过滤方法,实现了连续不确定XML的Top-k查询。为了避免概率下限值过小对过滤效果的影响,又提出HPCProTJFast算法,该算法推迟了对连续节点的处理,只有在获得满足概率条件的整枝路径时才对连续节点进行访问。实验表明,在执行时间以及过滤效率上,同直接处理连续不确定数据的ProTJFast算法相比,这两种算法都要更高效,并且HPCProTJFast算法的效率更高。 展开更多
关键词 连续不确定 xml 归并 TOP-K
下载PDF
支持多维连续随机变量的不确定XML数据模型研究
11
作者 张晓琳 崔光月 +1 位作者 刘立新 郑珍珍 《内蒙古科技大学学报》 CAS 2012年第1期76-80,共5页
不确定数据模型研究已受到广泛关注,但对于支持多维连续随机变量的不确定数据管理却缺乏研究,在已有模型的基础上,提出了一种扩展的基于p-文档的连续不确定数据模型,用于支持多维连续随机变量,并对相关的联合概率及条件概率查询进行了定... 不确定数据模型研究已受到广泛关注,但对于支持多维连续随机变量的不确定数据管理却缺乏研究,在已有模型的基础上,提出了一种扩展的基于p-文档的连续不确定数据模型,用于支持多维连续随机变量,并对相关的联合概率及条件概率查询进行了定义;具有相关关系的多维连续随机变量,存储相应的联合概率密度函数,根据不同的分布类型选择相应的查询处理方法;相互独立的多个随机变量,则分别存储每个变量的概率密度函数,并在查询时根据查询条件进行相应的处理. 展开更多
关键词 不确定xml p-文档模型 多维连续随机变量
下载PDF
基于序列的不确定XML整体小枝查询技术
12
作者 王鹏 张晓琳 《电子科技》 2013年第11期146-150,共5页
针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配... 针对基于序列的不确定XML小枝模式匹配算法需要子序列匹配和结构过滤两个阶段,而导致查询效率低的问题,提出一种以PrTRIM算法为基础的整体小枝模式匹配算法。H-PrTRIM算法将PrTRIM算法中子序列匹配和结构过滤两个阶段合并,在子序列匹配的同时进行结构过滤,使子序列匹配得到的结果就是查询的最终结果,解决了由于子序列匹配产生过多的中间结果而降低查询效率的问题。实验结果表明,H-PrTRIM算法的效率高于PrTRIM算法,应用于查询大文档和结构复杂的查询语句时更能体现出优势。 展开更多
关键词 不确定xml 序列 整体小枝模式
下载PDF
高效不确定XML复杂Twig查询处理算法
13
作者 张晓琳 韩雨童 +1 位作者 苏龙超 刘立新 《计算机工程与设计》 CSCD 北大核心 2014年第4期1258-1263,共6页
针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDe... 针对目前普通XML复杂Twig查询处理算法易造成大量空间和时间浪费,且不能完全适用于不确定XML的问题,提出一种基于P-文档模型的不确定XML复杂Twig查询处理算法Prob-BooleanTwig,处理包含AND,NOT和OR复杂谓词的查询模式。算法在扩展了EDewey编码的基础上,构建路径叶子节点索引,进行自底向上的查询模式匹配,避免了对查询模式的多次扫描。理论分析和实验结果表明,Prob-BooleanTwig算法具有高效性。 展开更多
关键词 不确定xml 复杂Twig查询 编码 路径索引 查询处理
下载PDF
A survey of uncertain data management
14
作者 Lingli LI Hongzhi WANG +1 位作者 Jianzhong LI Hong GAO 《Frontiers of Computer Science》 SCIE EI CSCD 2020年第1期162-190,共29页
Uncertain data are data with uncertainty information,which exist widely in database applications.In recent years,uncertainty in data has brought challenges in almost all database management areas such as data modeling... Uncertain data are data with uncertainty information,which exist widely in database applications.In recent years,uncertainty in data has brought challenges in almost all database management areas such as data modeling,query representation,query processing,and data mining.There is no doubt that uncertain data management has become a hot research topic in the field of data management.In this study,we explore problems in managing uncertain data,present state-of-the-art solutions,and provide future research directions in this area.The discussed uncertain data management techniques include data modeling,query processing,and data mining in uncertain data in the forms of relational,XML,graph,and stream. 展开更多
关键词 uncertain DATA PROBABILISTIC DATABASE PROBABILISTIC xml SEMI-STRUCTURED DATA DATA STREAM
原文传递
扩展标记语言文档在数据库动态查询的应用
15
作者 陶袁 马雨石 《辽宁工学院学报》 2005年第4期227-228,231,共3页
针对目前在WEB应用中不同用户在IE客户端上请求查询的不确定性,给计算机正确响应用户的请求带来困难的问题,提出应用扩展标记语言模板来保存用户要查询的信息,并把该模板保存到会话中,解决了根据用户的请求正确的查询数据库的内容、正... 针对目前在WEB应用中不同用户在IE客户端上请求查询的不确定性,给计算机正确响应用户的请求带来困难的问题,提出应用扩展标记语言模板来保存用户要查询的信息,并把该模板保存到会话中,解决了根据用户的请求正确的查询数据库的内容、正确的显示用户查询的结果的问题。 展开更多
关键词 不确定的请求 扩展标记语言文档 会话
下载PDF
一种高效的连续不确定XML小枝模式匹配算法 被引量:4
16
作者 张晓琳 吕庆 +1 位作者 刘立新 郑春红 《计算机应用研究》 CSCD 北大核心 2013年第2期364-366,370,共4页
针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用... 针对目前不确定XML小枝模式匹配算法均基于归并,易造成很大的空间和时间浪费问题,提出基于P-文档模型的连续不确定XML的非归并的小枝模式匹配算法。算法在节点入队列和出队列时分别进行过滤剪枝操作,减少待处理节点的个数,匹配过程使用相互关联的链表存储中间结果,不需要归并。理论分析与实验结果表明,该算法是一种高效的连续不确定XML查询算法。 展开更多
关键词 连续不确定xml 小枝模式匹配 过滤剪枝 非归并
下载PDF
连续不确定XML数据索引技术研究 被引量:3
17
作者 张换香 张晓琳 刘立新 《计算机应用与软件》 CSCD 北大核心 2013年第8期51-53,共3页
针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定... 针对连续不确定XML数据的概率阈值查询,提出CPTI(Continuous Probabilistic Threshold Index)索引技术,包括CPTI结构索引和CPTI值索引。CPTI结构索引扩展了结构索引F-index支持连续不确定XML数据,通过CPTI结构索引查询twig小枝,并确定小枝的路径概率;CPTI值索引是一个二维表,记录cont类节点的概率信息,通过CPTI值索引过滤与查询无关的元素以减少查询中需要处理的元素数目。实验表明,此索引技术可极大地提高查询处理的性能。 展开更多
关键词 连续不确定 xml 索引 概率阈值查询
下载PDF
连续不确定XML数据查询处理算法 被引量:1
18
作者 张晓琳 霍伟 +1 位作者 刘立新 崔光月 《计算机工程与设计》 CSCD 北大核心 2013年第7期2426-2430,共5页
针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果... 针对目前连续不确定XML数据同步多区间的查询处理算法易造成较大时间开销的问题,提出一种基于蒙特卡洛最小二乘思想的小枝模式查询处理算法QueryLSMC。算法根据查询请求依节点遍历序列顺序处理路径栈中节点,利用链表匹配并存储中间结果,通过构造随机样本集线性拟合目标节点中的连续分布函数,避免了对大量矩形分段的处理,有效地减少了计算量。实验结果表明,在取得理想精度的同时,该算法具有高效性。 展开更多
关键词 连续不确定xml 蒙特卡洛最小二乘 小枝模式查询 随机样本集 线性拟合
下载PDF
多维连续不确定XML数据查询处理算法 被引量:1
19
作者 张晓琳 霍伟 +1 位作者 刘立新 崔光月 《微电子学与计算机》 CSCD 北大核心 2013年第6期30-33,共4页
提出一种基于蒙特卡洛思想的数据查询处理算法QueryMC.在查询计算过程中,根据小枝查询模式确定待处理多维随机变量联合概率密度函数及查询区域,通过构造相同区域上的均匀分布随机变量将查询问题建模成相应复合函数的期望,利用算法同时... 提出一种基于蒙特卡洛思想的数据查询处理算法QueryMC.在查询计算过程中,根据小枝查询模式确定待处理多维随机变量联合概率密度函数及查询区域,通过构造相同区域上的均匀分布随机变量将查询问题建模成相应复合函数的期望,利用算法同时产生的随机样本集估计该期望的取值作为问题的解,避免了传统的降维操作,有效地减少了处理时间.实验结果表明,在取得理想精度的同时,算法具有高效性. 展开更多
关键词 连续不确定xml 多维随机变量 小枝查询模式 联合概率密度 蒙特卡洛
下载PDF
标签劣质的XML数据上的查询处理 被引量:1
20
作者 姜国华 姜守旭 +2 位作者 王宏志 李建中 高宏 《计算机科学与探索》 CSCD 2011年第8期673-685,共13页
XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XM... XML数据中的不正确数据、不一致数据、不精确数据等劣质数据给XML数据上的有效查询处理带来了挑战。重点研究了标签劣质的XML数据上twig查询的处理方法。给出求得每个标签的拼写相近标签、松弛标签、同义标签等相似标签的方法,以及在XML文档中求出与原查询相似的所有查询结果的高效算法。通过实验证明了所提方法的有效性和效率。 展开更多
关键词 劣质数据 可扩展标记语言(xml) TWIG查询
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部