期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
非对称数据率网络下的无阻塞连接算法 被引量:1
1
作者 陈刚 《计算机时代》 2013年第7期11-12,16,共3页
基于稳定网的数据流连接算法已有很多研究成果,但在实际应用中,还需要处理不同速率网络下的查询连接,这使得目前流行的基于稳定数据流且内存分配固定环境下的连接算法难以适用。介绍了一种在非对称数据率网络下的无阻塞排序归并连接算法... 基于稳定网的数据流连接算法已有很多研究成果,但在实际应用中,还需要处理不同速率网络下的查询连接,这使得目前流行的基于稳定数据流且内存分配固定环境下的连接算法难以适用。介绍了一种在非对称数据率网络下的无阻塞排序归并连接算法SMA。SMA算法的连接运算分为两阶段:join during run creation和join during merge,第一阶段可用于网络无阻塞情况下通过内存刷新策略来生成头批连接结果,第二阶段用于数据源受阻时借助外存驻留数据继续生成查询连接结果,从而保证了连接结果产生的无阻塞性。试验证明,SMA对等值和空间连接效率很高。 展开更多
关键词 数据流 无阻塞连接 内存刷新 排序归并
下载PDF
数据处理的有力工具—SORT/MERGE软件包
2
作者 冀少华 《计算机科学技术与应用》 1990年第2期41-45,57,共6页
关键词 软件包 数据处理 sort/merge
下载PDF
分布式数据库下基于剪枝的并行合并连接策略 被引量:4
3
作者 高锦涛 李战怀 +1 位作者 杜洪涛 刘文洁 《软件学报》 EI CSCD 北大核心 2019年第11期3364-3381,共18页
排序合并连接是数据库系统一种重要的连接实现方式,比哈希连接有更广泛的应用.分布式环境下,数据分片、分布存储,面对昂贵的网络代价,进行高效排序合并连接的挑战巨大.传统策略首先针对连接数据进行排序,然后基于排好序的数据执行合并连... 排序合并连接是数据库系统一种重要的连接实现方式,比哈希连接有更广泛的应用.分布式环境下,数据分片、分布存储,面对昂贵的网络代价,进行高效排序合并连接的挑战巨大.传统策略首先针对连接数据进行排序,然后基于排好序的数据执行合并连接.这两部分操作均基于原始数据进行操作,通常情况下,原始连接数据存在无用数据块,这些数据块无需连接,但会增加额外开销,包括网络开销.随着数据量的增多,出现无用数据块的概率增大,额外开销随之增多.传统策略没有预先处理这些无用数据块.针对这个问题,提出一种分布式环境下基于剪枝的并行排序合并连接策略(parallel sort-merge join based on prune,简称Pr_PSMJ).其特点是,连接发生之前高效完成对连接对象无用数据块的剪枝处理,提高整体连接效率.基本思想是,根据连接对象对应的连接分区数据统计信息,构造一种双边邻接表(bilateral adjacency list,简称BAL),用来对连接数据中无用数据块进行剪枝,并保证最终连接结果的正确性;剪枝完成后,利用BAL计算出各个最佳本地连接执行点,并指导分区数据的迁移,使数据移动量最小;在连接阶段,由于BAL保证本地连接执行节点的独立性,因此能够轻松并行执行整个连接过程,并在每个连接点本地利用多核环境完成局部并行排序合并连接;最后,将局部结果合并成最终结果.由于Pr_PSMJ中的高效剪枝策略是在连接执行之前完成的,因此几乎适合任何合并连接操作,并且对于其他连接策略也有借鉴作用.给出了基于Pr_PSMJ的算法的正确性、效率性以及适应性分析,并且给出实验验证,证明了在分布式大数据量排序合并连接情况下,Pr_PSMJ相对于其他策略能够有效减少网络开销,并提高连接效率. 展开更多
关键词 分布式 排序合并连接 剪枝 双边邻接表 并行
下载PDF
一种改进的闪存数据库Sort-Merge-Join算法 被引量:1
4
作者 邢玉钢 王翰虎 +1 位作者 马丹 陈梅 《计算机应用研究》 CSCD 北大核心 2012年第2期614-616,620,共4页
在对传统的Sort-Merge-Join算法进一步研究的基础上,提出了一种改进的闪存数据库Sort-Merge-Join算法。该算法只对小关系进行外排序,避免了大关系的外排序,节省了大量时间,同时最小化了中间临时表,达到了少写闪存、减小擦除代价的目的... 在对传统的Sort-Merge-Join算法进一步研究的基础上,提出了一种改进的闪存数据库Sort-Merge-Join算法。该算法只对小关系进行外排序,避免了大关系的外排序,节省了大量时间,同时最小化了中间临时表,达到了少写闪存、减小擦除代价的目的。通过理论分析和与传统Sort-Merge-Join算法在闪存上的比较实验,证明了该算法的优越性。 展开更多
关键词 闪存数据库 sort-merge-Join算法 查询处理 代价评估 连接
下载PDF
集成CPU-GPU架构上的列存储连接优化技术研究 被引量:1
5
作者 丁祥武 李子通 《计算机科学》 CSCD 北大核心 2016年第11期265-271,308,共8页
集成多核CPU-GPU架构已经成为计算机处理器芯片的发展方向。利用这种架构的并行计算能力进行数据处理已经成为了数据库领域的研究热点。为了提高列存储系统的查询性能,首先改进了已有协处理机制中的负载分配策略,通过监测数据库系统CPU... 集成多核CPU-GPU架构已经成为计算机处理器芯片的发展方向。利用这种架构的并行计算能力进行数据处理已经成为了数据库领域的研究热点。为了提高列存储系统的查询性能,首先改进了已有协处理机制中的负载分配策略,通过监测数据库系统CPU占用率,动态地为处理器提供合理的数据划分;然后,针对集成多核CPU-GPU架构上的数据预取机制,提出了一种确定预取数据大小的模型,同时,针对GPU访存的特点,进行了GPU访存优化;最后,使用OpenCL作为编程语言,实现了一种集成多核CPU-GPU架构上的列存储排序归并连接算法,并采用提出的方法对连接处理进行优化。实验证明,所提优化策略可以使列存储系统排序归并连接性能提升33%。 展开更多
关键词 异构芯片 数据预取 查询优化 排序归并连接 OPENCL
下载PDF
无共享多处理机系统的并行连接算法
6
作者 李霖 杨利 周兴铭 《计算机工程》 CAS CSCD 北大核心 1995年第S1期226-231,共6页
在并行数据库中,各种关系操作,特别是连接(Join)操作的并行化一直是一个研究热点。一般认为,无共享(Shared-Nothing)结构是最适于超大规模并行数据库的并行体系结构。因此,本文主要介绍2种基于无共享多处理机系统的并行连接算法,对它们... 在并行数据库中,各种关系操作,特别是连接(Join)操作的并行化一直是一个研究热点。一般认为,无共享(Shared-Nothing)结构是最适于超大规模并行数据库的并行体系结构。因此,本文主要介绍2种基于无共享多处理机系统的并行连接算法,对它们的性能作了比较,并指出在该领域仍存在的一些主要问题。 展开更多
关键词 并行数据库 并行体系结构 无共享 连接 分类—归并 Gracc散列 Hybrid散列
下载PDF
基于变异MD5的快照差分算法 被引量:1
7
作者 唐向阳 陈维维 房元平 《微计算机应用》 2010年第12期1-7,共7页
如何有效、及时地检测和抽取信息源的增量数据是数据仓库及各种数据集成的首要问题,而对于简单的数据源通常用比较数据源两个时刻的快照的方法来检测增量数据。本文从传统Sort Merge快照差分算法代价和效率入手,分析提升其效率和速度的... 如何有效、及时地检测和抽取信息源的增量数据是数据仓库及各种数据集成的首要问题,而对于简单的数据源通常用比较数据源两个时刻的快照的方法来检测增量数据。本文从传统Sort Merge快照差分算法代价和效率入手,分析提升其效率和速度的可能方法,并提出基于变异的M5的Sort Merge算法,有效减少比较的数据量和输入输出的数据量,显著的提高了算法的效率。 展开更多
关键词 快照差分 增量检测 MD5 sort merge
下载PDF
基线与增量数据分离架构下的分布式连接算法 被引量:6
8
作者 樊秋实 周敏奇 周傲英 《计算机学报》 EI CSCD 北大核心 2016年第10期2102-2113,共12页
在大数据背景下,数据库系统表连接操作的效率急需优化,尤其对于基线与增量数据分离的数据库系统来说,其连接操作更是成为其性能的主要瓶颈.为了有效提升事务处理的性能,在基线与增量数据分离的数据库系统架构中,通常将基线数据存储于磁... 在大数据背景下,数据库系统表连接操作的效率急需优化,尤其对于基线与增量数据分离的数据库系统来说,其连接操作更是成为其性能的主要瓶颈.为了有效提升事务处理的性能,在基线与增量数据分离的数据库系统架构中,通常将基线数据存储于磁盘中,增量数据存储于内存中,进而获得较高的事务处理吞吐量和可扩展性.Hbase、BigTable、OceanBase等系统是典型的基线与增量数据分离的数据库管理系统,但是他们的表连接效率较低,其主要原因包括:每次表连接前必须先合并基线数据和增量数据;数据存储模式更为复杂,导致过大的网络开销.该文提出了一种基线与增量数据分离架构下的排序归并连接优化算法.该算法对连接属性做范围切分,在多个节点上并行做排序归并连接.该算法无需在连接前合并基线数据和增量数据,进而实现对基线和增量数据并行处理,同时也避免了大量非连接结果集数据的基线与增量合并操作.并在开源的数据库OceanBase上实现了该算法,通过一系列实验证明,该算法可以极大提高OceanBase数据库的表连接处理性能. 展开更多
关键词 分布式连接 增量数据 并行处理 排序归并连接
下载PDF
数据集成增量检测中Sort Merge算法的改进和实现
9
作者 黄静宾 李争 唐向阳 《计算机应用与软件》 CSCD 2011年第4期274-276,共3页
在数据集成应用中,增量检测一个最主要的职责就是检测计算出数据源的增量数据,有多种方式可以检测分析出数据源的变化数据:触发器、日志分析、快照差分等等。而快照差分又可以采用不同的算法对两个快照进行计算,针对差分算法中SortMerg... 在数据集成应用中,增量检测一个最主要的职责就是检测计算出数据源的增量数据,有多种方式可以检测分析出数据源的变化数据:触发器、日志分析、快照差分等等。而快照差分又可以采用不同的算法对两个快照进行计算,针对差分算法中SortMerge算法的一个改进和实现,主要利用有序文件来提高增量计算的效率。由于快照差分在字符串比对、文件差异计算、大数据量的差异对比、自然连接等实际问题有应用,对此类问题都有一定借鉴意义。 展开更多
关键词 数据集成 增量数据 快照差分 sort merge算法
下载PDF
各种内部排序算法的比较 被引量:3
10
作者 王莉 《黑龙江科技信息》 2009年第29期90-90,共1页
排序是程序设计中非常重要的内容,其算法种类繁多,现介绍常用的几种排序算法,并比较了它们的异同。针对不同的序列选择最佳排序方法,以提高效率。
关键词 插入排序 交换排序 选择排序 归并排序 基数排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部