期刊文献+
共找到54篇文章
< 1 2 3 >
每页显示 20 50 100
MPI+OpenMP混合并行编程模型应用研究 被引量:24
1
作者 冯云 周淑秋 《计算机系统应用》 2006年第2期86-89,共4页
多处理器结点集群在高性能计算市场上日趋流行,如何在多处理器上编写出高效的并行代码成为研究的热点。MPI+OpenMP为多处理器结点集群提供了一种有效的并行策略,结点内部共享内存空间编程模式适合 OpenMP并行,消息传递模型MPI被用在集... 多处理器结点集群在高性能计算市场上日趋流行,如何在多处理器上编写出高效的并行代码成为研究的热点。MPI+OpenMP为多处理器结点集群提供了一种有效的并行策略,结点内部共享内存空间编程模式适合 OpenMP并行,消息传递模型MPI被用在集群的结点与结点之间,这样就实现了并行的层次结构化。 展开更多
关键词 mpi openmp mpi+openmp
下载PDF
基于SMP集群的多层次并行编程模型与并行优化技术 被引量:25
2
作者 单莹 吴建平 王正华 《计算机应用研究》 CSCD 北大核心 2006年第10期254-256,260,共4页
详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行... 详细描述了适用于SMP集群这种多层次并行体系结构的混合并行编程模型MPI/OpenMP,它提供了实现SMP节点间和节点内多层次并行的机制。在此基础上结合实用的性能评价方法,分别介绍了MPI,OpenMP和单处理器三个层次上的一些常用和有效的并行优化技术,并指出单处理器性能优化是提高并行程序性能一个不容忽视的问题。 展开更多
关键词 SMP集群 mpi/openmp 并行 优化 单处理器性能优化
下载PDF
基于SMP集群的MPI+OpenMP混合编程模型研究 被引量:19
3
作者 潘卫 陈燎原 +3 位作者 张锦华 李永革 潘莉 夏凡 《计算机应用研究》 CSCD 北大核心 2009年第12期4592-4594,共3页
讨论了MPI+OpenMP混合编程模型的特点及其实现方法。建立了对拉普拉斯偏微分方程求解的混合并行算法,并在HL-2A高性能计算系统上同纯MPI算法作了性能方面的比较。结果表明,该混合并行算法具有更好的扩展性和加速比。
关键词 对称式多处理器集群 消息传递界面 openmp mpi+openmp HL-2A高性能计算系统
下载PDF
SMP集群系统上矩阵特征问题并行求解器的有效算法 被引量:5
4
作者 赵永华 迟学斌 程强 《计算机研究与发展》 EI CSCD 北大核心 2007年第2期334-340,共7页
对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算... 对称矩阵三对角化和三对角对称矩阵的特征值求解是稠密对称矩阵特征问题并行求解器的关键步.针对SMP集群系统的多级体系结构,基于Householder变换的矩阵三对角化和三对角矩阵特征值问题的分而治之算法,给出了它们的MPI+OpenMP混合并行算法.算法研究集中在SMP集群系统环境下的负载平衡、通信开销和性能评价.混合并行算法的设计结合了粗粒度线程并行模式和任务共享的动态调用方法,改善了MPI算法中的负载平衡问题、降低了通信开销.在深腾6800上的实验表明,基于混合并行算法的求解器比纯MPI版本的求解器具有更好的性能和可扩展性. 展开更多
关键词 SMP集群系统 mpi+openmp 混合并行算法 矩阵特征值问题 并行求解器
下载PDF
基于MPI+OpenMP混合编程模式的大规模颗粒两相流LBM并行模拟 被引量:8
5
作者 何强 李永健 +3 位作者 黄伟峰 李德才 胡洋 王玉明 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2019年第10期847-853,共7页
针对大规模三维颗粒两相流全尺度模拟并行计算问题,该文采用MPI+OpenMP混合编程模式,其中机群节点采用MPI并行计算,节点内部采用OpenMP进行细粒化的并行计算,并根据格子Boltzmann方法(LBM)颗粒两相流的特点进行OpenMP程序并行优化设计,... 针对大规模三维颗粒两相流全尺度模拟并行计算问题,该文采用MPI+OpenMP混合编程模式,其中机群节点采用MPI并行计算,节点内部采用OpenMP进行细粒化的并行计算,并根据格子Boltzmann方法(LBM)颗粒两相流的特点进行OpenMP程序并行优化设计,提出了一种适用于大量颗粒的三维颗粒两相流LBM并行计算模型。以颗粒沉积问题为例,在集群计算机平台对并行算法的加速性能进行测试。计算结果表明:该算法具有良好的加速比及扩展性,并且其计算量具有颗粒数量不敏感的优点,适用于大规模多颗粒两相流问题的研究。 展开更多
关键词 5-格子Boltzmann方法(LBM) mpi+openmp 颗粒两相流
原文传递
基于SMP集群的三维网格多粒度混合并行编程模型 被引量:6
6
作者 于方 郑晓薇 孙晓鹏 《计算机应用与软件》 CSCD 2009年第3期138-140,166,共4页
为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP... 为提高大规模三维网格并行算法的执行效率,针对SMP集群分布/共享两级内存层次结构的特点,介绍适用于SMP集群混合编程的不同实现方法。对三维网格模型最短路径问题的并行求解提出了多粒度混合并行编程模型,给出了实现该问题的MPI+OpenMP混合并行算法,并在SMP集群上同粗粒度MPI(Message Passing Interface)并行算法做了性能比较。结果表明,采用该多粒度混合并行编程模型具有更好的加速比和运行效率。 展开更多
关键词 SMP集群 分布/共享内存 mpi+openmp 混合编程模型 三维网格
下载PDF
MPI/OpenMP-Based Parallel Solver for Imprint Forming Simulation
7
作者 Yang Li Jiangping Xu +2 位作者 Yun Liu Wen Zhong Fei Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第7期461-483,共23页
In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining pr... In this research,we present the pure open multi-processing(OpenMP),pure message passing interface(MPI),and hybrid MPI/OpenMP parallel solvers within the dynamic explicit central difference algorithm for the coining process to address the challenge of capturing fine relief features of approximately 50 microns.Achieving such precision demands the utilization of at least 7 million tetrahedron elements,surpassing the capabilities of traditional serial programs previously developed.To mitigate data races when calculating internal forces,intermediate arrays are introduced within the OpenMP directive.This helps ensure proper synchronization and avoid conflicts during parallel execution.Additionally,in the MPI implementation,the coins are partitioned into the desired number of regions.This division allows for efficient distribution of computational tasks across multiple processes.Numerical simulation examples are conducted to compare the three solvers with serial programs,evaluating correctness,acceleration ratio,and parallel efficiency.The results reveal a relative error of approximately 0.3%in forming force among the parallel and serial solvers,while the predicted insufficient material zones align with experimental observations.Additionally,speedup ratio and parallel efficiency are assessed for the coining process simulation.The pureMPI parallel solver achieves a maximum acceleration of 9.5 on a single computer(utilizing 12 cores)and the hybrid solver exhibits a speedup ratio of 136 in a cluster(using 6 compute nodes and 12 cores per compute node),showing the strong scalability of the hybrid MPI/OpenMP programming model.This approach effectively meets the simulation requirements for commemorative coins with intricate relief patterns. 展开更多
关键词 Hybrid mpi/openmp parallel computing mpi openmp imprint forming
下载PDF
基于JavaCC的C代码自动并行化的设计与实现 被引量:5
8
作者 刘有耀 杨鹏程 《计算机应用》 CSCD 北大核心 2016年第9期2422-2426,2431,共6页
针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分... 针对当前大量遗产代码无法重复利用的问题,设计一种新的编译工具将C的串行代码转换为基于MPI+Open MP的混合并行编程代码,降低了并行编程的开发成本。首先,通过对Java CC的优化,实现一种可以解析C语言的词法和语法分析器,进行源代码分析并生成抽象语法树;其次,根据语法树对源代码进行控制依赖性和数据依赖性分析,产生可并行化的语句块分区;再次,按照提出的并行代码生成方法得到目标代码;最后,基于Visual Studio 2010构建目标代码仿真验证环境。实验结果表明,该工具可以较为理想地实现串行代码自动并行化,与手工编写的代码在加速比上的误差为8.2%~18.4%。 展开更多
关键词 JAVACC 抽象语法树 依赖性 自动并行化 mpi+openmp
下载PDF
基于MPI+OpenMP的三维声波方程正演模拟 被引量:5
9
作者 宋鹏 解闯 +3 位作者 李金山 谭军 刘伟 谭惠文 《中国海洋大学学报(自然科学版)》 CAS CSCD 北大核心 2015年第9期97-102,129,共7页
针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多... 针对三维声波方程数值模拟的大计算量和大内存消耗问题,研究并实现了基于MPI+OpenMP的三维声波方程数值模拟并行算法,在PC-Cluster的计算节点间采用基于MPI的按炮分任务的多进程并行模式,在计算节点内采用基于OpenMP的按空间分任务的多线程并行模式,以有效地利用计算和存储资源。3D-Overthrust模型的实验结果显示,基于MPI+OpenMP的三维声波方程数值模拟并行算法的计算效率与基于MPI的按炮分任务并行计算模式相当,但其内存消耗远远低于后者,其更适合于基于大模型或实际模型的三维模拟。 展开更多
关键词 三维声波方程 正演模拟 并行计算 mpi+openmp
下载PDF
对称矩阵三对角化的混合并行算法设计 被引量:3
10
作者 赵永华 迟学斌 陈江 《计算机工程》 EI CAS CSCD 北大核心 2005年第22期39-41,53,共4页
基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。... 基于Householder转换,给出了稠密对称矩阵三对角化的MPI+OpenMP混合并行算法。内容集中在SMP集群系统环境下算法的负载平衡、通信开销和性能评价。OpenMP共享内存并行采用了粗粒度方法,解决了MPI算法中的负载平衡问题,降低了通信开销。在深腾6800上的试验结果表明,MPI+OpenMP版本比纯MPI版本具有更好的性能和可扩展性。 展开更多
关键词 对称矩阵 并行块算法 三对角矩阵 加速比 mpi+openmp
下载PDF
DSMC/PIC耦合模拟的大规模高效混合并行计算研究
11
作者 汪青松 邱昊中 +4 位作者 林拥真 杨富翔 李洁 王正华 徐传福 《计算机科学》 CSCD 北大核心 2023年第S02期811-819,共9页
DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负... DSMC/PIC耦合模拟是一类重要的高性能计算应用。由于粒子动态注入、迁移等操作,传统MPI并行DSMC/PIC耦合模拟通常并行通信开销较大且负载不均衡。文中针对自主研发的DSMC/PIC耦合模拟软件,开展了大规模高效MPI+OpenMP混合并行及动态负载均衡研究。首先设计了基于嵌套双重非结构网格的MPI并行算法,实现了集中式和分布式两种并行通信策略,支持粒子在任意并行进程间的动态迁移。然后提出了加权负载性能模型,设计了动态负载均衡算法及高效网格重映射机制,大幅提升了耦合模拟并行效率,进一步设计了MPI+OpenMP混合并行算法,有效降低了纯MPI并行计算中动态负载均衡的网格重剖分和通信开销。在北京北龙超级云HPC系统上,针对10亿粒子规模脉冲真空弧等离子体羽流开展了数千处理器核心DSMC/PIC耦合并行模拟,验证了并行算法和动态负载均衡的效果。 展开更多
关键词 DSMC/PIC耦合 粒子模拟 分布式和集中式 动态负载均衡 mpi+openmp
下载PDF
嵌入式零树小波压缩和解压缩的并行化算法 被引量:2
12
作者 韩丽洁 李文 田晏嘉 《计算机应用》 CSCD 北大核心 2009年第B06期209-212,共4页
嵌入式零树小波压缩算法是图像压缩技术中有效的压缩算法,但其压缩时间较长。对该算法进行了研究,并在多核机群系统下实现了该算法的并行算法,提高了算法的性能。实现了MPI和MPI+OpenMP两种并行算法,并将串行算法、MPI并行算法与MPI+Ope... 嵌入式零树小波压缩算法是图像压缩技术中有效的压缩算法,但其压缩时间较长。对该算法进行了研究,并在多核机群系统下实现了该算法的并行算法,提高了算法的性能。实现了MPI和MPI+OpenMP两种并行算法,并将串行算法、MPI并行算法与MPI+OpenMP并行算法进行比较。结果显示,随着数据量的增多,MPI并行算法和MPI+OpenMP并行算法相对于串行算法的运行效率都有明显提高,其中MPI+OpenMP并行算法的效率更好。 展开更多
关键词 mpi mpi+openmp 嵌入式零树小波编码
下载PDF
蒙特卡罗中子输运程序的MPI/OpenMP混合并行研究 被引量:3
13
作者 梁金刚 刘诗文 +1 位作者 徐琪 王侃 《原子能科学技术》 EI CAS CSCD 北大核心 2013年第B12期654-659,共6页
消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享... 消息传递/共享内存混合并行方法具有适应分布共享式集群计算机的发展趋势、有助于解决蒙特卡罗计算内存问题、改善并行性能等优势。本文基于一维中子蒙特卡罗输运程序,实现MPI/OpenMP混合并行,研究影响混合并行性能的因素,提出针对共享内存访问竞争、锁竞争、伪共享等问题的解决方法。测试结果表明,混合并行程序和纯粹MPI并行程序有相近的加速效果,同时大量节省了程序的内存使用,对于实现中子蒙特卡罗输运程序的大规模并行有重要意义。 展开更多
关键词 中子输运 蒙特卡罗 混合并行 mpi openmp 内存
下载PDF
MPI+OpenMP环境下的二元合金三维相场模型的并行方法 被引量:2
14
作者 朱昶胜 邓新 +1 位作者 冯力 李浩 《兰州理工大学学报》 CAS 北大核心 2017年第4期16-22,共7页
针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+Op... 针对二元合金三维相场模型模拟研究中存在的计算区域小、计算效率低,难以满足二元合金大规模模拟的需求,提出基于MPI+OpenMP混合编程模式的并行方法.在相同计算规模下对MPI和OpenMP并行技术的优缺点进行分析.在计算机集群环境下对MPI+OpenMP混合编程模式和纯MPI并行方法的并行效率进行对比和分析.结果证明:基于MPI+OpenMP混合编程模式可以有效地扩大二元合金三维相场模型的计算规模;在多核集群环境下,相对于纯MPI并行方法,MPI+OpenMP混合编程可以更加有效地利用多核集群的多层次结构,取得更高的加速比和计算效率. 展开更多
关键词 相场法 二元合金 mpi mpi+openmp
下载PDF
基于多核机群的人工鱼群并行算法 被引量:3
15
作者 李双 李文敬 +1 位作者 孙环龙 林中明 《计算机应用》 CSCD 北大核心 2013年第12期3380-3384,共5页
针对人工鱼群算法在复杂多峰函数优化问题上寻优精度低、后期搜索能力减弱且运行时间长等问题,提出一种基于多核机群的人工鱼群并行算法(PDN-AFS)。首先对人工鱼群算法的优势与不足进行分析,采用动态权衡因子策略并适时引入小生境机制,... 针对人工鱼群算法在复杂多峰函数优化问题上寻优精度低、后期搜索能力减弱且运行时间长等问题,提出一种基于多核机群的人工鱼群并行算法(PDN-AFS)。首先对人工鱼群算法的优势与不足进行分析,采用动态权衡因子策略并适时引入小生境机制,提出一种新的人工鱼群(DN-AFS)算法;然后根据多核机群的并行编程模型(MPI+OpenMP),对DN-AFS算法进行并行设计与分析,提出基于多核机群的人工鱼群并行算法;最后在多核机群环境下进行仿真实验。实验结果表明:该算法有效地提高了复杂多峰函数优化问题的收敛速度和寻优性能,并获得了较高的加速比。 展开更多
关键词 人工鱼群算法 动态权衡因子 小生境 并行算法 mpi+openmp
下载PDF
多核SMP集群混合并行编程技术的研究 被引量:3
16
作者 刘超 祝永志 《微型机与应用》 2017年第4期18-21,共4页
目前,高性能计算领域中大多数系统采用层次化硬件设计,具有若干多核CPU共享存储的节点通过高速网络互联起来。混合并行编程技术将节点间的分布式存储与节点内的共享存储进行了融合。针对多核SMP集群体系结构的特点,进一步研究了适用于多... 目前,高性能计算领域中大多数系统采用层次化硬件设计,具有若干多核CPU共享存储的节点通过高速网络互联起来。混合并行编程技术将节点间的分布式存储与节点内的共享存储进行了融合。针对多核SMP集群体系结构的特点,进一步研究了适用于多核SMP集群的层次化混合并行编程模型MPI/Open MP,以及多核SMP节点间和节点内多级并行的机制。充分利用消息传递编程模型和共享内存编程模型各自的优势,在此基础上研究了多粒度并行化编程方法。 展开更多
关键词 多核SMP集群 混合编程 mpi/openmp
下载PDF
大规模结构有限元分析程序在多核集群计算环境中的性能分析和优化 被引量:2
17
作者 吕海 邸瑞华 龚华 《计算机科学》 CSCD 北大核心 2012年第1期305-310,共6页
通过对基于MPI编程模型实现的开源有限元计算分析软件在多核集群计算平台中的程序性能的分析,找出程序瓶颈及其原因,实现了基于MPI编程模型的并行程序在多核计算环境中的性能优化。根据程序性能瓶颈的分析,提出了基于MPI/OpenMP混合并... 通过对基于MPI编程模型实现的开源有限元计算分析软件在多核集群计算平台中的程序性能的分析,找出程序瓶颈及其原因,实现了基于MPI编程模型的并行程序在多核计算环境中的性能优化。根据程序性能瓶颈的分析,提出了基于MPI/OpenMP混合并行编程模型的大规模线性/非线性方程组求解和多线程多进程同时进行消息通信的两种程序性能优化方案。不同计算规模的实验结果表明,在多核集群计算平台中,MPI/OpenMP混合编程模型实现的大规模非线性方程组求解器相对于单纯基于MPI编程模型实现的并行程序,其性能有2倍到3倍的提升;多线程多进程同时消息传递的优化方案虽然对程序能够起到性能优化作用,但是对解决程序消息通信瓶颈的问题不是最好的方法。两个方案总体性能分析结果表明,基于MPI/OpenMP混合编程模型实现的并行程序,在多核集群计算平台中能够更好地发挥硬件系统的计算能力。 展开更多
关键词 mpi/openmp OpenSeesSP 多核 非线性方程组求解
下载PDF
基于SMP集群系统的MPI-OpenMP混合并行FDTD算法研究 被引量:2
18
作者 朱良杰 宋祖勋 刘真 《现代电子技术》 2011年第14期107-110,共4页
针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属... 针对基于MPI的传统FDTD并行算法存在的缺点,提出了优化的FDTD两级化并行算法。结合MPI和OpenMP编程模型的特点,实现了基于SMP集群系统平台的MPI-OpenMP混合编程模型的两种并行FDTD算法。在实验室搭建的SMP集群系统平台上,通过对一金属长方体的散射问题分析,把混合编程算法同基于MPI的FDTD并行算法进行了比较。结果表明,混合并行算法具有更好的加速比和带宽利用率。 展开更多
关键词 FDTD mpiopenmp 加速比 带宽利用率
下载PDF
MPI+OpenMP混合并行编程模型在分子动力学中的应用
19
作者 张坤峰 张苏 《周口师范学院学报》 CAS 2022年第5期71-75,共5页
针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构... 针对分子动力学串行计算速度不足问题,设计一种基于MPI+OpenMP的并行编程模型,实现LAMMPS并行计算。从而满足在节点间采用MPI进行消息传递并行,在节点内采用OpenMP共享内存模式多线程并行;最后根据分子动力学自身计算特点,对近邻表的构建以及力的计算进行优化,同时将并行结果和串行结果以及纯OpenMP运行时间和混合模型运行时间作对比。实验结果表明,采用MPI+OpenMP混合并行编程模型不仅能够加快计算速度,而且具有很好的扩展性。 展开更多
关键词 分子动力学 mpi+openmp 并行编程模型 LAMMPS
下载PDF
混合模型下LAMMPS并行探究 被引量:1
20
作者 豆育升 刘相金 +1 位作者 白明泽 孙延维 《微电子学与计算机》 CSCD 北大核心 2014年第10期143-146,共4页
面对分子动力学模拟在串行计算上的速度瓶颈问题,设计一种并行计算模型来加快计算速度,在分子动力学模拟软件LAMMPS下引入MPI+OpenMP并行模型,这个模型可以在LAMMPS下提供两级并行处理,充分利用集群优势,提高模拟计算速度.实验结果表明... 面对分子动力学模拟在串行计算上的速度瓶颈问题,设计一种并行计算模型来加快计算速度,在分子动力学模拟软件LAMMPS下引入MPI+OpenMP并行模型,这个模型可以在LAMMPS下提供两级并行处理,充分利用集群优势,提高模拟计算速度.实验结果表明,在十节点下,采用并行模型加速比至少提高8倍以上. 展开更多
关键词 分子动力学 集群 mpi+openmp 消息传递 LAMMPS
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部