期刊文献+
共找到126篇文章
< 1 2 7 >
每页显示 20 50 100
基于模式记忆并行蚁群算法的输电网规划 被引量:35
1
作者 翟海保 程浩忠 +2 位作者 吕干云 陈小良 马则良 《中国电机工程学报》 EI CSCD 北大核心 2005年第9期17-22,共6页
该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上... 该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上,设计了一种基于模式记忆的并行蚁群算法,该算法通过模式记忆实现了解空间分解,能够有效地识别、记忆和跳出局部最优解;通过局部细化搜索进一步加强了局部搜索能力;通过并行计算提高了计算速度。某实际77 节点的算例分析表明了该算法具有很高的计算效率和优秀的局部、全局收敛性,有效克服了现代启发式算法在求解输电网规划问题时存在的效率不高及未成熟收敛等现象。 展开更多
关键词 输电网规划 蚁群算法 记忆 模式 现代启发式算法 未成熟收敛 局部搜索能力 全局最优解 局部最优解 全局收敛性 规划求解 规划模型 空间分解 计算速度 并行计算 计算效率 规划问题 解空间 分析表
下载PDF
基于MPI的云计算模型 被引量:38
2
作者 郭本俊 王鹏 +1 位作者 陈高云 黄健 《计算机工程》 CAS CSCD 北大核心 2009年第24期84-86,共3页
根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为... 根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为算法分布化及并行化提供新思路。 展开更多
关键词 云计算 消息传递接口 机群系统 Hadoop架构
下载PDF
并行最短路径搜索算法的设计与实现 被引量:21
3
作者 卢照 师军 《计算机工程与应用》 CSCD 北大核心 2010年第3期69-71,共3页
针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,... 针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,该算法搜索速度快且性能稳定,当结点数目相当庞大时,算法的优越性更加明显。 展开更多
关键词 最短路径 并行机环境 message passing interface(mpi) 并行搜索算法
下载PDF
并行计算技术及其在勘探地球物理学中的现状与展望 被引量:18
4
作者 黄易 师学明 +1 位作者 范建柯 胡文宝 《地球物理学进展》 CSCD 北大核心 2010年第2期642-649,共8页
本文详细阐述了并行计算技术及其在地球物理勘探数据处理中的发展现状和发展趋势,分析了几个代表性的并行算法实例.这些结果表明,在拥有强大的并行机的基础上,基于并行计算开发环境(MPI和PVM等)设计高效的并行算法,通过分配合理的并行... 本文详细阐述了并行计算技术及其在地球物理勘探数据处理中的发展现状和发展趋势,分析了几个代表性的并行算法实例.这些结果表明,在拥有强大的并行机的基础上,基于并行计算开发环境(MPI和PVM等)设计高效的并行算法,通过分配合理的并行粒度、通信开销、负载平衡等执行高效的并行计算,可以有效加快处理速度、降低成本.目前,并行算法在地震数据处理中应用已较为成熟,近年来向更实用的基于PC机群的并行技术发展.然而,在非地震方法中,并行算法应用较少见文献报道,研究尚处于初级研究阶段.在大地电磁的二维和三维正、反演问题上,并行计算技术逐渐得到越来越多关注和重视.随着资源和能源需求的增长,地球物理勘探向深度和广度快速发展,大幅增长的数据量使得高性能并行计算机和高效的并行算法在勘探地球物理学中的发展和应用将占据愈来愈重要的地位. 展开更多
关键词 并行计算 机群 mpi PVM 地球物理勘探 数据处理
下载PDF
梯级水电站群长期优化调度云计算随机动态规划算法 被引量:16
5
作者 周东清 彭世玉 +1 位作者 程春田 王健 《中国电机工程学报》 EI CSCD 北大核心 2017年第12期3437-3448,共12页
为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式... 为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式计算平台能够充分利用资源,具有诸多优势。为了探索云平台下的分布式并行随机动态规划模型,该文基于消息传递接口(message passing interface,MPI)和Spark框架分别实现了传统集群计算和云计算分布式随机动态规划算法,后者将计算模型转换为数据处理模型进行计算,并通过三库优化调度实验对算法进行了比较。算法分析及实验结果表明,基于云计算的分布式并行随机动态规划算法则可以有效利用云平台的优势,同时拥有完善的容错以及负载均衡机制,具有广阔的应用前景。 展开更多
关键词 随机动态规划 并行计算 云计算 消息传递接口(mpi) spark框架
下载PDF
基于并行协同粒子群优化算法和PC集群的无功优化 被引量:13
6
作者 李英 江全元 +2 位作者 L.JIANG Q. H. WU 曹一家 《电力系统自动化》 EI CSCD 北大核心 2010年第19期42-47,80,共7页
针对大规模电力系统无功优化高维度、非线性、不连续的问题,提出一种并行协同粒子群优化算法。该算法基于消息传递接口技术,采用二级并行的方案求解无功优化问题。第1级并行是通过控制变量分组,将原优化问题分解成几个相互关联的子优化... 针对大规模电力系统无功优化高维度、非线性、不连续的问题,提出一种并行协同粒子群优化算法。该算法基于消息传递接口技术,采用二级并行的方案求解无功优化问题。第1级并行是通过控制变量分组,将原优化问题分解成几个相互关联的子优化问题,每一个子优化问题对应一个子粒子群,各子粒子群相互协同,共同求取最优解。第2级并行是指用粒子群优化算法求解子优化问题时使用多个进程并行求解,进程间采用对等模式分配计算任务,提高了优化效率。此外,为了增强粒子群优化算法的全局寻优能力,在优化过程中对其参数进行了动态调整。通过在PC集群上对IEEE118节点系统和IEEE300节点系统进行仿真计算,验证了该算法能取得较好的优化结果,具有较高的加速比和可扩展性,能满足大规模电力系统无功优化的需要。 展开更多
关键词 无功优化调度 并行计算 消息传递接口 协同进化 粒子群优化算法 PC集群
下载PDF
基于MPI+OpenMP混合编程模型的城市路网最短路径并行算法 被引量:11
7
作者 杨庆芳 刘冬 杨兆升 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1581-1584,共4页
针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效... 针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效改善系统性能,提高系统计算速度。经由长春市路网验证可知,混合模型比MPI模型具有更好的加速比和运算效率,并且随着计算节点个数的增加,加速比提高幅度更大,表明MPI+OpenMP混合模型有着更好的可扩展性。 展开更多
关键词 交通运输系统工程 消息传递接口 mpi+OpenMP混合模型 最短路径 FLOYD算法
下载PDF
分布式并行混合遗传算法在无功优化中的应用 被引量:9
8
作者 李运华 吴宏昺 +1 位作者 盛万兴 刘科研 《电力系统及其自动化学报》 CSCD 北大核心 2008年第2期36-41,共6页
将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标... 将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标准数据运算,证明了这种算法在电力系统无功优化计算中具有很高的稳定性和快速求解能力。 展开更多
关键词 无功优化 消息传递界面 分布式并行混合遗传算法 模拟退火 个体迁移 最优值恢复
下载PDF
多核CPU下的K-means遥感影像分类并行方法 被引量:11
9
作者 吴洁璇 陈振杰 +2 位作者 张云倩 骈宇哲 周琛 《计算机应用》 CSCD 北大核心 2015年第5期1296-1301,共6页
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并... 针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。 展开更多
关键词 K-MEANS算法 并行计算 负载均衡 数据粒度划分 消息传递接口 Open MP
下载PDF
一种基于MPI的并行体绘制算法 被引量:5
10
作者 梁峰 鲁强 曾绍群 《计算机工程》 CAS CSCD 北大核心 2005年第13期171-173,共3页
介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国... 介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国人女性一号(VCH-F1)的头部和脚部数据集的重建,表明该算法在任务规模和节点规模上具有较好的可扩展性。 展开更多
关键词 并行算法 消息传递接口 体绘制 虚拟中国人
下载PDF
格网DEM水系提取并行算法研究 被引量:8
11
作者 江岭 刘学军 +2 位作者 阳建逸 刘凯 宋效东 《地理与地理信息科学》 CSCD 北大核心 2013年第4期62-66,共5页
作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的... 作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的并行策略,实现了DEM预处理、汇流累积及河网分级串行算法的并行化,完成了水系提取的并行计算。在配置Linux操作系统的集群环境下,利用不同大小的DEM数据,测试了算法的并行性能,结果表明并行算法运行时间明显低于串行算法,具有较好的并行效率。 展开更多
关键词 数字高程模型(DEM) 水系提取 并行计算 消息传递接口(mpi)
下载PDF
基于分布式数据集的并行计算框架内存优化方法 被引量:4
12
作者 夏立斌 刘晓宇 +1 位作者 姜晓巍 孙功星 《计算机工程》 CAS CSCD 北大核心 2023年第4期43-51,共9页
随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型... 随着科学计算和人工智能技术的快速发展,分布式环境下的并行计算已成为解决大规模理论计算和数据处理问题的重要手段。内存容量的提高以及迭代算法的广泛应用,使得以Spark为代表的内存计算技术愈发成熟。但是,当前主流的分布式内存模型和计算框架难以兼顾易用性和计算性能,并且在数据格式定义、内存分配、内存使用效率等方面存在不足。提出一种基于分布式数据集的并行计算方法,分别从模型理论和系统开销两个角度对内存计算进行优化。在理论上,通过对计算过程进行建模分析,以解决Spark在科学计算环境下表达能力不足的问题,同时给出计算框架的开销模型,为后续性能优化提供支持。在系统上,提出一种框架级的内存优化方法,该方法主要包括对跨语言分布式内存数据集的重构、分布式共享内存的管理、消息传递过程的优化等模块。实验结果表明,基于该优化方法实现的并行计算框架可以显著提升数据集的内存分配效率,减少序列化/反序列化开销,缓解内存占用压力,应用测试的执行时间相比Spark减少了69%~92%。 展开更多
关键词 内存计算 并行计算 内存优化 Spark框架 消息传递接口
下载PDF
MPI程序同步通信基本模型死锁检测 被引量:6
13
作者 廖名学 范植华 《电子学报》 EI CAS CSCD 北大核心 2008年第2期402-407,共6页
本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,... 本文提出了MPI程序的同步通信模型及三个基本简化模型,给出了判定这些基本模型是否死锁的方法和定理并予以了严格证明.简化模型的死锁检测理论和方法是真实MPI程序死锁检测的必要基础.这些方法基于程序静态分析,必要时进行运行时检测,它们对两种简化模型可以在程序编译前确定是否死锁,对另外一种模型,在编译前可静态确定部分死锁,运行中可确定其他死锁.我们的理论可以证明MPI程序死锁检测主流算法的正确性,其方法可以减少它们对客户源代码或MPI profiling接口的修改量,从而大大降低死锁检测开销,并可在运行前判定死锁. 展开更多
关键词 mpi(message passing interface) 死锁 同步通信
下载PDF
MPI容错机制的研究 被引量:4
14
作者 崔丽青 徐炜民 《计算机工程》 CAS CSCD 北大核心 2004年第16期88-90,共3页
MPI是广泛应用于集群系统的并行程序开发环境,MPI的容错是集群系统可靠性的关键问题。该文讨论了MPI标准中的容错,结合协调设置检查点和同步卷回等机制设计了基于检查点的卷回恢复系统MPIChaRR,该系统应用干Linux集群机,MPICH应用程序... MPI是广泛应用于集群系统的并行程序开发环境,MPI的容错是集群系统可靠性的关键问题。该文讨论了MPI标准中的容错,结合协调设置检查点和同步卷回等机制设计了基于检查点的卷回恢复系统MPIChaRR,该系统应用干Linux集群机,MPICH应用程序运行中的节点故障恢复是对用户透明的。 展开更多
关键词 mpi 容错 检查点 卷回
下载PDF
快速训练支持向量机的并行结构 被引量:1
15
作者 曹丽娟 王小明 《微电子学与计算机》 CSCD 北大核心 2006年第10期96-99,103,共5页
序列最小优化(SMO)是一种常见的训练支持向量机(SVM)的算法,但在求解大规模问题时,它需要耗费大量的计算时间。文章提供SMO的一种并行实现方法。并行SMO是利用信息传递接口(MPI)开发的。首先将整个训练数据集分为多个小的子集,然后同时... 序列最小优化(SMO)是一种常见的训练支持向量机(SVM)的算法,但在求解大规模问题时,它需要耗费大量的计算时间。文章提供SMO的一种并行实现方法。并行SMO是利用信息传递接口(MPI)开发的。首先将整个训练数据集分为多个小的子集,然后同时运行多个CPU处理器处理每一个分离的数据集。实验结果表明,当采用多处理器时,在Adult数据集上并行SMO有较大的加速比。 展开更多
关键词 支持向量机 序列最小优化方法 信息传递接口 并行算法
下载PDF
基于MPI的大规模栅格影像并行瓦片化算法 被引量:6
16
作者 刘世永 陈荦 +2 位作者 熊伟 吴烨 李军 《计算机工程与应用》 CSCD 北大核心 2018年第1期48-53,111,共7页
当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化... 当前主流GIS软件以及互联网地图应用在Web GIS(网络地理信息系统)解决方案中都广泛采用地图切片(又称瓦片),切片处理服务是实现影像在Web GIS上快速无缝浏览的关键技术。针对目前传统算法以及商业GIS软件在大数据量栅格影像快速瓦片化方面的不足,提出一种名为ParaTile的高效栅格影像快速瓦片化方法,ParaTile基于MPI共享外存的并行技术,利用多进程对原始栅格影像进行数据划分,每个进程对其所划分的区域进行独立读写和计算,而后再按照TMS或者Google Tile定义的标准将瓦片进行编码输出。实验采用不同级别大小的遥感影像进行测试,结果表明ParaTile在面对不同规模的数据时,无论从速度还是算法稳定性上都较现有算法和工具具有显著优势,特别是当数据量越大时,这种优势愈加明显。 展开更多
关键词 栅格影像 并行瓦片化 消息传递接口(mpi)
下载PDF
流水线并行JFNK方法及在中子k本征值问题中的应用 被引量:2
17
作者 刘礼勋 张汉 +2 位作者 邬颖杰 郭炯 李富 《核动力工程》 EI CAS CSCD 北大核心 2023年第5期15-22,共8页
JFNK(Jacobian-free Newton-Krylov)方法是求解中子k本征值和反应堆多物理场耦合等非线性问题的高效加速方法,其中的Krylov迭代常用广义极小残差法(简称GMRES)。并行JFNK方法是实现更大规模问题求解的必要手段,其核心是解决GMRES中Gram-... JFNK(Jacobian-free Newton-Krylov)方法是求解中子k本征值和反应堆多物理场耦合等非线性问题的高效加速方法,其中的Krylov迭代常用广义极小残差法(简称GMRES)。并行JFNK方法是实现更大规模问题求解的必要手段,其核心是解决GMRES中Gram-Schmidt (简称GS)正交化过程集合通信多、并行效率低的问题。本文以三维中子k本征值问题为研究对象,开发了基于消息传递接口并行编程模型和空间区域分解技术的并行JFNK方法。针对GS正交化过程并行可扩展性差的问题,分析讨论了流水线方法,以提高并行JFNK的并行效率,并对比了采用经典GS正交化的并行JFNK、采用修正GS正交化的并行JFNK和采用流水线方法的并行JFNK的计算时间和并行效率。最后选用三维扩散基准题IAEA-3D进行了数值测试,测试结果表明采用流水线方法的并行JFNK并行效率显著高于使用经典或修正GS正交化的并行JFNK,且收敛性未受影响。 展开更多
关键词 流水线方法 并行JFNK 消息传递接口(mpi) 集合通信 非阻塞通信 并行效率
原文传递
基于MPI的鲲鹏CPU核间通信研究
18
作者 周岩 王鹏 王琨予 《西南民族大学学报(自然科学版)》 CAS 2024年第3期328-335,共8页
核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通... 核间通信延时是影响高性能计算系统整体运行效率的重要因素.国产鲲鹏CPU在高性能计算领域应用日益广泛,针对鲲鹏CPU的缓存架构及多核间接口互联进行分析,研究影响鲲鹏CPU核间通信延时的因素.在消息传递接口(MPI)环境下进行节点内核间通信实验,对包括跨三级缓存、跨物理CPU通信等不同模式下通信延时进行对比,发现通信数据包大于500 KB后,跨L3 Cache TAG的通信延时反优于共享L3 Cache TAG的通信延时.针对通信数据包在64 KB大小时的通信延迟异常,分析得出是MPI的Eager模式和Rendezvous模式的默认切换阈值所造成.对这两种模式进行实验对比,验证不同大小的通信数据包在不同模式下和跨核通信时的延时特征,Eager模式更适合低延时的小消息发送.在实际应用中可根据通信数据包大小调整两种模式的默认切换阈值,以达到更好的传输效果.实验结果表明由于鲲鹏CPU存在复杂的多核结构,在并行计算程序设计时可以进行针对性优化,以提升程序的运行效率. 展开更多
关键词 鲲鹏CPU 核间通信 消息传递接口 高性能计算 共享缓存
下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:2
19
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
下载PDF
不同炸药量在工事中爆炸的三维数值模拟 被引量:6
20
作者 任会兰 宁建国 许香照 《高压物理学报》 CAS CSCD 北大核心 2013年第2期216-222,共7页
基于消息传递接口(Message Passing Interface,MPI)模式,阐述了采用Euler方法的PMMIC-3D并行程序基本原理及并行设计策略,并对工事模型进行了数值模拟,数值模拟结果与实际现象及物理规律相符。工事内炸药爆炸产生的爆炸冲击波既有较高... 基于消息传递接口(Message Passing Interface,MPI)模式,阐述了采用Euler方法的PMMIC-3D并行程序基本原理及并行设计策略,并对工事模型进行了数值模拟,数值模拟结果与实际现象及物理规律相符。工事内炸药爆炸产生的爆炸冲击波既有较高的超压峰值,又有较长的作用时间,遇到墙壁时会发生反射,产生反射高压,并会发生绕射汇聚,在墙后面一定区域内产生局部高压,与空中爆炸产生的爆炸冲击波相比,杀伤破坏作用更大。通过数值模拟能够清晰地看到爆炸冲击波的传播过程及其相互作用,可以确定爆炸冲击波到达各个位置处的时间。通过对比各个位置处的峰值超压,可以确定能有效毁伤一个确定工事的最佳药量。 展开更多
关键词 消息传递接口 EULER方法 爆炸与冲击 数值模拟
原文传递
上一页 1 2 7 下一页 到第
使用帮助 返回顶部