期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
基于MPI的大规模遥感影像金字塔并行构建方法 被引量:24
1
作者 赫高进 熊伟 +2 位作者 陈荦 吴秋云 景宁 《地球信息科学学报》 CSCD 北大核心 2015年第5期515-522,共8页
影像金字塔是实现影像数据多分辨率组织的重要方式,是提高影像可视化性能的有效手段。传统串行金字塔构建算法,对大规模影像数据的构建性能已无法满足遥感影像快速浏览的预处理需求。故此,其成为一个亟待解决的问题,而利用多核、多节点... 影像金字塔是实现影像数据多分辨率组织的重要方式,是提高影像可视化性能的有效手段。传统串行金字塔构建算法,对大规模影像数据的构建性能已无法满足遥感影像快速浏览的预处理需求。故此,其成为一个亟待解决的问题,而利用多核、多节点的高性能集群计算环境和并行机制是一个重要的技术途径。本文在共享外存的高性能集群环境下,提出使用消息传递接口(MPI)的金字塔并行构建算法,对构建遥感影像金字塔过程中的重采样与I/O过程进行并行处理,大大缩短了遥感影像金字塔构建时间。实验结果表明:(1)该算法比传统串行构建方法的加速效果明显,对于单波段遥感影像,其加速效果可达到GDAL的5倍以上,而对于多波段遥感影像,加速效果可达到GDAL的2倍以上;(2)遥感影像数据量越大,并行构建算法加速效果越显著,对于大规模的遥感影像,本文提出的金字塔并行构建算法的速度可达到GDAL的10倍左右。 展开更多
关键词 遥感影像金字塔 消息传递接口 并行 集群
原文传递
基于PC机群并行环境的构建方法 被引量:4
2
作者 花嵘 傅游 《山东科技大学学报(自然科学版)》 CAS 2002年第3期28-30,共3页
介绍一种用于高性能计算的并行环境 PC机群 ,从硬件平台和软件环境两个方面讲述了它的构建方法 ,并简单介绍了MPICH并行环境的使用方法。
关键词 并行环境 构建方法 并行计算 硬件平台 软件环境 开放式机群系统 PC机群系统 mpiCH
下载PDF
基于MPI+CUDA的异构并行可压缩流求解器 被引量:7
3
作者 刘枫 李桦 +1 位作者 田正雨 潘沙 《国防科技大学学报》 EI CAS CSCD 北大核心 2014年第1期6-10,共5页
在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数... 在CPU/GPU异构体系结构计算集群上,建立了基于MPI+CUDA的异构并行可压缩流求解器。讨论了异构结构上的可压缩流并行算法的并行模式,在CPU上执行计算密集度低、指令复杂的计算任务,在GPU上执行计算密集度高、指令单一的计算任务。通过数个算例,对比了异构并行计算和传统CPU并行计算计算结果和计算效率。将该算法运用于高超声速流动的数值模拟中,数值结果显示,基于MPI+CUDA的异构并行可压缩流求解器鲁棒性好,计算效率较CPU同构并行计算提高10倍以上。 展开更多
关键词 消息传递接口 统一计算设备架构 异构计算 可压缩流
下载PDF
中等雷诺数方柱绕流的直接数值模拟及涡系分析 被引量:6
4
作者 王建春 吴乘胜 +1 位作者 王星 徐金秀 《船舶力学》 EI CSCD 北大核心 2019年第8期893-905,共13页
作为一种典型的钝体绕流,方柱绕流具有物体几何外形简单而流场结构非常复杂的特性,常规的基于RANS的数值计算方法难以准确模拟。DNS不使用任何湍流模型,直接求解完整的非定常流动控制方程组,模拟包括脉动在内的湍流所有非定常流动量的... 作为一种典型的钝体绕流,方柱绕流具有物体几何外形简单而流场结构非常复杂的特性,常规的基于RANS的数值计算方法难以准确模拟。DNS不使用任何湍流模型,直接求解完整的非定常流动控制方程组,模拟包括脉动在内的湍流所有非定常流动量的时空演变过程,是湍流数值模拟中最精确的方法,在复杂流动数值模拟方面的应用潜力巨大。本文自主设计和编制并行数值模拟程序,使用基于"神威·太湖之光"国产CPU架构的大规模并行计算,开展了中等雷诺数(Re=10 000)方柱绕流的直接数值模拟。其中:不可压N-S方程组采用基于交错网格的有限体积法离散;压力-速度耦合采用SIMPLE算法处理;离散得到的代数方程组采用Gauss-Seidel迭代求解;时间步进采用Euler隐式格式,对流项采用QUICK格式,耗散项采用中心差分格式;数值模拟程序的并行化使用MPI方法处理。文中重点分析了方柱绕流的复杂涡系结构,同时给出了部分湍流统计结果,并通过与RANS和LES模拟结果的对比分析,展现了DNS在复杂精细流场模拟方面的优势。 展开更多
关键词 直接数值模拟 方柱绕流 涡系结构 mpi并行 国产CPU架构
下载PDF
模型加力室大涡模拟的并行计算 被引量:4
5
作者 邵茂敏 颜应文 +1 位作者 刘勇 赵坚行 《航空动力学报》 EI CAS CSCD 北大核心 2006年第3期497-501,共5页
采用基于M P I(消息传递库)的并行算法,在贴体网格下对带V形槽稳定器模型加力燃烧室紊流化学反应流场进行数值模拟,湍流模型采用k方程亚网格尺度模型,燃烧模型采用亚网格EBU模型,采用热通量辐射模型估算辐射通量。在程序设计中,采用动... 采用基于M P I(消息传递库)的并行算法,在贴体网格下对带V形槽稳定器模型加力燃烧室紊流化学反应流场进行数值模拟,湍流模型采用k方程亚网格尺度模型,燃烧模型采用亚网格EBU模型,采用热通量辐射模型估算辐射通量。在程序设计中,采用动态内存分配、分区算法和多点重合交错网格系统,并行计算的结果与单机运行结果的对比表明计算结果是正确的,可以明显的提高运算效率,是解决复杂燃烧流动大规模数值模拟的有效手段。 展开更多
关键词 航空 航天推进系统 mpi(message passing interface) 大涡模拟 并行计算 加力燃烧室
下载PDF
基于MPI的并行PC集群搭建的实现 被引量:3
6
作者 曲兆伟 余文华 《中国传媒大学学报(自然科学版)》 2007年第2期18-22,共5页
本文阐述了在Linux和Windows系统下,搭建基于MPI的并行PC集群的过程,实现了各个节点的互通和基于MPI的并行计算。
关键词 高性能计算 mpi(消息传递接口) 并行集群 PC
下载PDF
MPICH在PC集群系统中的应用 被引量:3
7
作者 徐巍 李玉榕 《福建工程学院学报》 CAS 2006年第4期448-450,467,共4页
采用MPICH并行技术,建立了基于PC局域网平台的并行集群系统,并通过VC++6.0调用消息传递库MPI函数编写并行遗传算法,完成了相关并行计算实例。计算结果表明:在现有并行集群系统下能有效地利用现有计算机资源,大幅度提高计算效率,并可获... 采用MPICH并行技术,建立了基于PC局域网平台的并行集群系统,并通过VC++6.0调用消息传递库MPI函数编写并行遗传算法,完成了相关并行计算实例。计算结果表明:在现有并行集群系统下能有效地利用现有计算机资源,大幅度提高计算效率,并可获得可观的加速比,为一些复杂问题的求解提供了可行方案。 展开更多
关键词 并行计算 并行遗传算法 mpiCH mpi
下载PDF
MPI环境下基于边界校正方法的海洋模型的并行化 被引量:2
8
作者 符晓单 李洪平 《海洋科学》 CAS CSCD 北大核心 2015年第5期62-67,共6页
基于区域分解技术,设计了一种针对海洋模型的边界校正方法,该方法不需要对原有海洋模型进行较大改动,只需要利用消息传递接口(message passing interface,MPI)编写子区域间的数据传输模块,即可实现原有海洋模型的并行化。相对于重新开... 基于区域分解技术,设计了一种针对海洋模型的边界校正方法,该方法不需要对原有海洋模型进行较大改动,只需要利用消息传递接口(message passing interface,MPI)编写子区域间的数据传输模块,即可实现原有海洋模型的并行化。相对于重新开发并行系统,该方法能够较快把原有模型的串行解决方案转化为并行解决方案,并且并行化后的海洋模型能够获得较高的加速比。 展开更多
关键词 边界校正 并行化 区域分解 消息传递接口(message passing interface mpi)
下载PDF
基于曙光-2000的MPI循环并行方法 被引量:1
9
作者 韩丛英 贺国平 张广梅 《计算机工程》 CAS CSCD 北大核心 2003年第3期47-49,共3页
曙光-2000并行机系统是分布式存储系统,在此类系统上直接写并行程序是很困 难的。该文通过详细分析书写MPI程序的各种模式,结合曙光-2000并行机,给出一种将串行 程序改写成MPI并行程序的方法:分析串行程序的循环体,考虑数据依赖关... 曙光-2000并行机系统是分布式存储系统,在此类系统上直接写并行程序是很困 难的。该文通过详细分析书写MPI程序的各种模式,结合曙光-2000并行机,给出一种将串行 程序改写成MPI并行程序的方法:分析串行程序的循环体,考虑数据依赖关系,加以适当的 M PI函数,使之并行化。 展开更多
关键词 曙光—2000 消息传送接口 数据依赖 mpi 循环并行方法 分布式存储系统 并行计算机
下载PDF
网格环境下期权定价BSDE模型的并行实现 被引量:1
10
作者 刘辉 彭滢 +2 位作者 龚斌 代斌 魏代政 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期201-204,共4页
提出了一种在CNGrid网格服务环境下解决期权定价问题的并行应用方法.这种方法基于BSDE(backward stochastic differential equation)模型.根据异构计算资源的特点,使用CUDA和MPI分别在GPU计算节点和CPU计算节点上实现并行算法,比较不同... 提出了一种在CNGrid网格服务环境下解决期权定价问题的并行应用方法.这种方法基于BSDE(backward stochastic differential equation)模型.根据异构计算资源的特点,使用CUDA和MPI分别在GPU计算节点和CPU计算节点上实现并行算法,比较不同编程在异构计算节点上的实现效率.通过监控计算节点上计算任务的负载状况,利用CNGrid所提供的计算服务,灵活地在异构计算节点上完成期权定价计算任务. 展开更多
关键词 网格 并行算法 消息传递接口 CUDA BSDE 期权定价
原文传递
地震预报加卸载响应比方法的并行计算
11
作者 冯仰德 迟学斌 尹祥础 《科研信息化技术与应用》 2008年第2期15-21,14,共8页
加卸载响应比理论是近年来提出的地震预报的新方法,在中国大陆地区的实际地震预测中取得了较好的效果。但随着预测空间增加及其经度和纬度的细化、以及时间的增加,计算量将变得很大,单个CPU计算时间达到无法容忍的地步,而数据的生成达... 加卸载响应比理论是近年来提出的地震预报的新方法,在中国大陆地区的实际地震预测中取得了较好的效果。但随着预测空间增加及其经度和纬度的细化、以及时间的增加,计算量将变得很大,单个CPU计算时间达到无法容忍的地步,而数据的生成达到GB数量级。这些都随着并行计算的实施得到解决。我们应用区域分解技术,通过调用MPI库,开发了加卸载响应比的时空扫描的并行程序。 展开更多
关键词 加卸载响应比(LURR) 时空扫描 区域分解 mpi
原文传递
MPI程序中两种通信原语相关性研究
12
作者 张小红 《河南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第3期155-157,共3页
基于并行计算中将相同数据模块传递给所有处理器的实验,评估并比较了MPI-1标准化库中点对点通信与广播通信的性能.在延迟方面性能的比较是通过改变处理器的数目和数据模块大小来实现的,而工具Jump-shot-4则用于MPI通信程序性能的详细测试.
关键词 并行编程 mpi 通信原语 集群计算机
下载PDF
mRNA可变剪接问题的并行化研究
13
作者 牛北方 郎显宇 +1 位作者 陆忠华 迟学斌 《计算机应用研究》 CSCD 北大核心 2008年第3期705-708,共4页
对mRNA可变剪接问题进行了并行化分析和研究,解决了原AltSplice程序中Nbest参数选取欠合理的问题,结合实验实现了基于MPI平台的并行AltSplice版本MPI_AltSplice,并在5万亿次的联想深腾6800高性能计算机上获得了较好的运行性能。
关键词 可变剪接 AltSplice 并行化 表达序列标签(EST)序列库 消息传送接口
下载PDF
并行计算通信库测试方法研究及实践
14
作者 熊玉庆 张云泉 《软件学报》 EI CSCD 北大核心 2000年第12期1681-1684,共4页
并行计算通信库的测试在并行计算系统中起着重要的作用 .对通信库的测试一般都是通过设计一些测试程序对库的各个或几个部分分别进行单独隔离测试 .但是有许多库中的错误用这种隔离测试方法测不出来 ,只有当库的多个部分以某种复杂的、... 并行计算通信库的测试在并行计算系统中起着重要的作用 .对通信库的测试一般都是通过设计一些测试程序对库的各个或几个部分分别进行单独隔离测试 .但是有许多库中的错误用这种隔离测试方法测不出来 ,只有当库的多个部分以某种复杂的、有机的方式组合运行时才会暴露出来 .而这种复杂的、有机的组合方式 ,从设计库的测试角度看很难形成 .提出两种新的测试方法 ,根据通信库结构的分层特性 ,利用可移植的上层库的测试程序来测试下层库 .上层库的测试程序也可看做是下层库的应用程序 ,但与一般的下层库应用程序不同 ,它几乎覆盖了下层库的各个部分 ,且有机地将它们组合起来 ,运行时形成某种复杂的形态 ,而仅用下层库的测试程序往往达不到这种形态 .这样 。 展开更多
关键词 测试方法 并行计算通信库 并行计算系统
下载PDF
JPEG2000编码在数字电影中的优化研究与实现
15
作者 石丹 章立生 王贞松 《计算机应用研究》 CSCD 北大核心 2007年第10期185-187,共3页
讨论了数字电影行业对图像处理技术的要求,分析了提高数字电影图像处理性能的几个关键技术点。首先实现了符合数字电影规范的JPEG2000图像编码;然后通过优化小波变换的cache命中率、采用MPI并行计算、优化文件系统以及优化编译等方法,... 讨论了数字电影行业对图像处理技术的要求,分析了提高数字电影图像处理性能的几个关键技术点。首先实现了符合数字电影规范的JPEG2000图像编码;然后通过优化小波变换的cache命中率、采用MPI并行计算、优化文件系统以及优化编译等方法,对数字电影中的图像处理技术进行了全面的研究和实现,大幅度提高了图像的处理效率。 展开更多
关键词 JPEG2000 数字电影 消息传递接口 优化
下载PDF
用三维并行时域有限差分算法研究光子晶体薄板W3波导传输特性 被引量:7
16
作者 朱志宏 叶卫民 +2 位作者 季家镕 袁晓东 曾淳 《光子学报》 EI CAS CSCD 北大核心 2006年第6期815-818,共4页
构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率... 构建了用于高性能并行计算的PC机群环境,将基于此机群环境的三维并行时域有限差分算法用于光子晶体薄板W3波导传输特性研究·性能分析表明:对于大规模问题,机群并行FDTD算法能够获得较理想的加速比·具体计算了W3波导的透射率频谱和光场分布·结果表明:光子晶体薄板W3波导能够实现光的三维约束,其导带中存在着微小禁带(mini-gap)· 展开更多
关键词 光子晶体 时域有限差分 并行计算 消息传递接口 W3波导
下载PDF
基于共面标记点的AR跟踪系统
17
作者 朱方文 李德强 +2 位作者 袁政鹏 吴家麒 成霞 《上海大学学报(自然科学版)》 CAS CSCD 2004年第5期458-462,共5页
该文讨论基于视觉的、用于AR系统的动态目标实时跟踪系统设计.通过两个摄像头实时跟踪安装在动态目标上的人工标识物,通过图像处理和立体视觉理论获取被跟踪目标物体在空间中的姿态.在跟踪算法中采用了卡尔曼滤波器预测跟踪窗口的运动轨... 该文讨论基于视觉的、用于AR系统的动态目标实时跟踪系统设计.通过两个摄像头实时跟踪安装在动态目标上的人工标识物,通过图像处理和立体视觉理论获取被跟踪目标物体在空间中的姿态.在跟踪算法中采用了卡尔曼滤波器预测跟踪窗口的运动轨迹,同时利用MPI技术在两台普通性能的计算机上并行执行目标跟踪的程序,实现了低成本的动态跟踪功能. 展开更多
关键词 跟踪窗口 卡尔曼滤波 消息传递接口 并行运算
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部