期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
一种优化MapReduce系统能耗的任务分发算法 被引量:12
1
作者 宋杰 徐澍 +2 位作者 郭朝鹏 鲍玉斌 于戈 《计算机学报》 EI CSCD 北大核心 2016年第2期323-338,共16页
MapReduce是一种典型的分布式计算模型,一经提出就被迅速应用到大数据处理系统中.文中认为MapReduce系统在能耗方面存在优化空间.对于一个分布式并行计算系统,任务的并行性对任务执行性能影响显著,并行性保证方法在优化性能的前提下还... MapReduce是一种典型的分布式计算模型,一经提出就被迅速应用到大数据处理系统中.文中认为MapReduce系统在能耗方面存在优化空间.对于一个分布式并行计算系统,任务的并行性对任务执行性能影响显著,并行性保证方法在优化性能的前提下还应该考虑系统能耗.在MapReduce系统中,传统的Map任务分发算法采用"小任务多次分发的策略",这种策略虽然保证了并行性,但会浪费节点的处理能力,消耗额外的能量;而Reduce任务分发算法尚不能保证Reduce任务间的并行性.文中提出通过动态地调整Map任务和Reduce任务大小,也即任务处理数据量的规模来保证任务并行性,降低MapReduce系统的整体能耗.文中通过实验证明该方法能够有效地降低典型MapReduce作业的能耗. 展开更多
关键词 mapreduce 能耗 能耗优化 任务分发 并行性 云计算 大数据
下载PDF
基于结构并行的MRBP算法 被引量:9
2
作者 任刚 邓攀 +1 位作者 杨超 吴长茂 《计算机研究与发展》 EI CSCD 北大核心 2018年第6期1308-1319,共12页
BP(back propagation)算法是一种常用的神经网络学习算法,而基于Hadoop集群MapReduce编程模型的BP(MapReduce back propagation,MRBP)算法在处理大数据问题时,表现出良好的性能,因而得到了广泛应用.但是,由于该算法缺乏神经节点之间细... BP(back propagation)算法是一种常用的神经网络学习算法,而基于Hadoop集群MapReduce编程模型的BP(MapReduce back propagation,MRBP)算法在处理大数据问题时,表现出良好的性能,因而得到了广泛应用.但是,由于该算法缺乏神经节点之间细粒度结构并行的能力,当遇到数据维度较高、网络节点较多时,性能还显不足.另一方面,Hadoop集群计算节点通信不能由用户直接控制,现有基于集群系统的结构并行策略不能直接用于MRBP算法.为此,提出一种适合于Hadoop集群的结构并行MRBP(structure parallelism based MapReduce back propagation,SP-MRBP)算法,该算法将神经网络各层划分为多个结构,通过逐层并行-逐层集成(layer-wise parallelism,layer-wise ensemble,LPLE)的方式,实现了MRBP算法的结构并行.同时,推导出了SP-MRBP算法和MRBP算法计算时间解析表达式,以此分析了2种算法时间差和SP-MRBP算法最优并行规模.据了解,这是首次将结构并行策略引入MRBP算法中.实验表明,当神经网络规模较大时,SP-MRBP较之原算法,具有较好的性能. 展开更多
关键词 mapreduce模型 结构并行 BP算法 多层神经网络 MRBP算法
下载PDF
基于云计算的舰船通信网络入侵检测方法研究
3
作者 黄国峰 刘宇苹 《舰船科学技术》 北大核心 2024年第10期170-173,共4页
为在面临大规模网络攻击或突发攻击时,提高入侵检测的实时性,提出基于云计算的舰船通信网络入侵检测方法。通过云计算的MapReduce编程模型,设计MapReduce并行化的遗传量子粒子群优化算法,在舰船通信网络数据内,提取网络入侵特征;利用Map... 为在面临大规模网络攻击或突发攻击时,提高入侵检测的实时性,提出基于云计算的舰船通信网络入侵检测方法。通过云计算的MapReduce编程模型,设计MapReduce并行化的遗传量子粒子群优化算法,在舰船通信网络数据内,提取网络入侵特征;利用MapReduce并行化熵聚类算法,确定径向基函数神经网络的基函数中心;确定基函数中心后,在MapReduce编程模型的Map函数内,输入网络入侵特征样本,训练神经网络,优化神经网络权值,通过Reduce函数输出训练结束指示,完成神经网络训练;在完成训练的MapReduce并行化径向基函数神经网络内,输入特征样本,输出舰船通信网络入侵检测结果。实验证明,该方法可有效提取舰船通信网络入侵特征;在不同网络攻击类型下,该方法均可精准完成舰船通信网络入侵检测。 展开更多
关键词 云计算 舰船通信网络 入侵检测 mapreduce并行 粒子群 径向基函数
下载PDF
基于MapReduce的地图代数并行计算方法 被引量:3
4
作者 蒋波涛 王艳东 《测绘地理信息》 2014年第3期51-55,共5页
针对大规模栅格数据的空间分析,设计并实现了一种基于MapReduce架构的通用地图代数并行计算方法。该方法能将栅格像素矩阵按数据行分割为多个独立的子矩阵,并在并行节点上使用地图代数的四种算子对来自不同矩阵的像素进行分析计算。栅... 针对大规模栅格数据的空间分析,设计并实现了一种基于MapReduce架构的通用地图代数并行计算方法。该方法能将栅格像素矩阵按数据行分割为多个独立的子矩阵,并在并行节点上使用地图代数的四种算子对来自不同矩阵的像素进行分析计算。栅格数据叠加实验结果表明,该方法具备有效性和可靠性,能降低计算对硬件设备的要求,并提升了计算效率。 展开更多
关键词 栅格空间分析 mapreduce 地图代数 栅格可并行性
原文传递
基于大数据的用户地址规范化存储与电力营销设计初探 被引量:2
5
作者 陈宁 龙致远 +4 位作者 罗雁 陈薇 王灿博 张海容 付越 《电子测试》 2019年第2期79-81,共3页
针对当前电力企业在用户地址数据管理方面比较混乱,进而给电力企业服务带来诸多的问题,结合当前的计算机技术,提出一种数据规范化存储与电力营销管理系统。考虑到当前海量的电力用户地址,引入Hadoop架构体系对系统进行搭建,同时通过MapR... 针对当前电力企业在用户地址数据管理方面比较混乱,进而给电力企业服务带来诸多的问题,结合当前的计算机技术,提出一种数据规范化存储与电力营销管理系统。考虑到当前海量的电力用户地址,引入Hadoop架构体系对系统进行搭建,同时通过MapReduce对数据进行并行化处理,以提高数据处理的速度;引入用户地址规范化管理模型,以提高用户地址的管理效率,同时提出四种不同的地址纠错方法,提高地址管理的效率。最后,结合就当前设计的应用成效进行简单说明,验证了这种规范化管理的可行性。 展开更多
关键词 mapreduce并行 地址结构 规范化 用户地址 地址纠错
下载PDF
面向大数据应用的多层次混合式并行方法 被引量:1
6
作者 黄磊 支小莉 郑圣安 《上海大学学报(自然科学版)》 CAS CSCD 北大核心 2016年第1期69-80,共12页
基于很多大数据应用存在对数据进行多种并行处理的需求,提出两层混合式并行方法,即执行单元的混合并行和计算模型的混合并行.通过在同一个计算节点上执行单元的混合并行,充分挖掘基础设施的计算能力,从而提高数据处理性能;采用在同一个... 基于很多大数据应用存在对数据进行多种并行处理的需求,提出两层混合式并行方法,即执行单元的混合并行和计算模型的混合并行.通过在同一个计算节点上执行单元的混合并行,充分挖掘基础设施的计算能力,从而提高数据处理性能;采用在同一个执行引擎中集成多个计算模型的并行方法,以适合应用多样异质处理模式.不同的混合并行方法可以契合不同的数据和计算特点,以满足不同的并行目标.介绍了混合式并行方法的基本思想,并以前期开发的并行编程模型BSPCloud为基础,阐述了进程和线程混合并行、BSP和Map Reduce混合并行的主要实现机制. 展开更多
关键词 混合并行 编程模型 整体同步并行(bulk SYNCHRONOUS parallel BSP) mapreduce
下载PDF
逻辑回归参数训练过程的MapReduce并行化实现 被引量:1
7
作者 高婕 《广东技术师范学院学报》 2015年第5期39-41,49,共4页
在逻辑回归算法的实际工程应用中,传统的单机参数训练方法在处理大规模的数据时效率低下.采用并行计算框架实现对训练数据的并行处理,能够有效解决这一问题.基于MapReduce分布式并行计算框架,提出逻辑回归参数训练过程在MapReduce集群... 在逻辑回归算法的实际工程应用中,传统的单机参数训练方法在处理大规模的数据时效率低下.采用并行计算框架实现对训练数据的并行处理,能够有效解决这一问题.基于MapReduce分布式并行计算框架,提出逻辑回归参数训练过程在MapReduce集群上的实现方法并用实验加以验证. 展开更多
关键词 逻辑回归 参数训练 并行化
下载PDF
BitmapAligner:Bit-Parallelism String Matching with MapReduce and Hadoop
8
作者 Mary Aksa Junaid Rashid +3 位作者 Muhammad Wasif Nisar Toqeer Mahmood Hyuk-Yoon Kwon Amir Hussain 《Computers, Materials & Continua》 SCIE EI 2021年第9期3931-3946,共16页
Advancements in next-generation sequencer(NGS)platforms have improved NGS sequence data production and reduced the cost involved,which has resulted in the production of a large amount of genome data.The downstream ana... Advancements in next-generation sequencer(NGS)platforms have improved NGS sequence data production and reduced the cost involved,which has resulted in the production of a large amount of genome data.The downstream analysis of multiple associated sequences has become a bottleneck for the growing genomic data due to storage and space utilization issues in the domain of bioinformatics.The traditional string-matching algorithms are efficient for small sized data sequences and cannot process large amounts of data for downstream analysis.This study proposes a novel bit-parallelism algorithm called BitmapAligner to overcome the issues faced due to a large number of sequences and to improve the speed and quality of multiple sequence alignment(MSA).The input files(sequences)tested over BitmapAligner can be easily managed and organized using the Hadoop distributed file system.The proposed aligner converts the test file(the whole genome sequence)into binaries of an equal length of the sequence,line by line,before the sequence alignment processing.The Hadoop distributed file system splits the larger files into blocks,based on a defined block size,which is 128 MB by default.BitmapAligner can accurately process the sequence alignment using the bitmask approach on large-scale sequences after sorting the data.The experimental results indicate that BitmapAligner operates in real time,with a large number of sequences.Moreover,BitmapAligner achieves the exact start and end positions of the pattern sequence to test the MSA application in the whole genome query sequence.The MSA’s accuracy is verified by the bitmask indexing property of the bit-parallelism extended shifts(BXS)algorithm.The dynamic and exact approach of the BXS algorithm is implemented through the MapReduce function of Apache Hadoop.Conversely,the traditional seeds-and-extend approach faces the risk of errors while identifying the pattern sequences’positions.Moreover,the proposed model resolves the largescale data challenges that are covered through MapReduce in th 展开更多
关键词 Next-generation sequencing multiple sequence alignment mapreduce HADOOP WHOLE-GENOME big data BIT-parallelism
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部