期刊文献+
共找到56篇文章
< 1 2 3 >
每页显示 20 50 100
基于DEM的分布式并行通视分析算法研究 被引量:11
1
作者 张刚 汤国安 +1 位作者 宋效东 杨坤 《地理与地理信息科学》 CSCD 北大核心 2013年第4期81-85,共5页
从负载均衡的角度详细分析了数据并行的特征,提出一种通用且有效数据可达的DEM数据划分策略。基于该方法设计了分布式并行通视分析算法,以全国90mSRTM作为数据源,对算法的执行效率进行实验,结果表明:基于海量地形数据进行分布式并行通... 从负载均衡的角度详细分析了数据并行的特征,提出一种通用且有效数据可达的DEM数据划分策略。基于该方法设计了分布式并行通视分析算法,以全国90mSRTM作为数据源,对算法的执行效率进行实验,结果表明:基于海量地形数据进行分布式并行通视分析的计算效率与进程数具有一定的关系。另外,算法的并行性能在一定程度上受到地形数据的影响。该文提出的方法有效地提高了海量数据的通视分析算法的计算效率,动态数据划分方案有望为并行环境下地形分析提供新的思路。 展开更多
关键词 DEM通视分析 分布式并行 加速比
下载PDF
二维叠前深度偏移的并行算法 被引量:6
2
作者 王真理 杨长春 +4 位作者 张洪宙 张得顺 符基昕 匡兵 王建立 《石油地球物理勘探》 EI CSCD 北大核心 1997年第6期784-788,817,共6页
王真理,杨长春,张洪审,张得顺,符基昕,匡兵,王建立.二维叠前深度偏移的并行算法.石油地球物理勘探,1997,32(6):784~788,817鉴于PVM软件是一种几乎能够在所有流行的计算机体系结构上运行的并行环境,本文提出了单程序多... 王真理,杨长春,张洪审,张得顺,符基昕,匡兵,王建立.二维叠前深度偏移的并行算法.石油地球物理勘探,1997,32(6):784~788,817鉴于PVM软件是一种几乎能够在所有流行的计算机体系结构上运行的并行环境,本文提出了单程序多数据流(SPMD)方式的二维叠前深度偏移的并行其法,即走时表计算采用炮点循环并行方式,成像过程采用炮检距并行算法。采用PVM并行环境提供的消息传递方式进行进程间通讯,在SGIPowerChallenge和IBMSP2两种并行机上实现了其二维叠前深度偏移的并行其法。测试结果表明:本文的二维叠前深度偏移并行化算法效率是比较高的,在SGIPowerChallenge机上,当CPU数为4时,测得的加速比达3.91,并行效率达到0.98;在IBMSP2机上,当书点数为3时,测得的加速比为2.94,效率达到0.98。 展开更多
关键词 叠前深度偏移 并行算法 地质体 区域构造
下载PDF
基于图形处理器的电力系统稀疏线性方程组求解方法 被引量:9
3
作者 周挺辉 赵文恺 +2 位作者 严正 徐得超 江涵 《电力系统自动化》 EI CSCD 北大核心 2015年第2期74-80,共7页
针对电力系统大规模线性方程组的稀疏特点,提出了基于图形处理器(GPU)的直接求解方法。该方法首先利用基于先排序的分块对角加边形式(BBDF)划分方法对方程组系数矩阵进行分割,形成具有粗粒度和细粒度两层并行结构的线性方程组,然后... 针对电力系统大规模线性方程组的稀疏特点,提出了基于图形处理器(GPU)的直接求解方法。该方法首先利用基于先排序的分块对角加边形式(BBDF)划分方法对方程组系数矩阵进行分割,形成具有粗粒度和细粒度两层并行结构的线性方程组,然后利用GPU的线程块和线程并行特性对其分别予以求解。将上述方法应用到电力系统暂态稳定计算中,并对其加速效果进行了测试。测试结果表明,在目前普及的设备上,所提方法可获得3~4倍的加速比;在高端设备上,能够获得7~8倍的加速比。 展开更多
关键词 电力系统 并行计算 暂态稳定计算 图形处理器 稀疏技术 加速比
下载PDF
天气雷达资料实时并行处理方法 被引量:8
4
作者 王志斌 陈波 +3 位作者 万玉发 吴涛 罗兵 沃伟峰 《计算机工程》 CAS CSCD 北大核心 2009年第23期255-257,共3页
利用共享存储多处理器的集群环境,研究高频度实时多部天气雷达资料处理的并行计算方法,根据单部天气雷达的计算特点和多部雷达混合处理的方法,提出一种粗粒度消息传递接口分布式内存和细粒度OpenMP共享内存混合编程的2级并行方法。实验... 利用共享存储多处理器的集群环境,研究高频度实时多部天气雷达资料处理的并行计算方法,根据单部天气雷达的计算特点和多部雷达混合处理的方法,提出一种粗粒度消息传递接口分布式内存和细粒度OpenMP共享内存混合编程的2级并行方法。实验结果表明,该方法使系统资料处理速度得到较大提高。 展开更多
关键词 天气雷达 资料处理 加速比
下载PDF
两种策略下的最短路径并行算法研究与实现 被引量:6
5
作者 隽志才 倪安宁 +1 位作者 贾洪飞 李杰 《系统工程理论方法应用》 北大核心 2006年第2期123-127,共5页
随着智能交通运输系统的研究与应用,对在大规模交通网络上求解最短路径的实时性提出了更高的要求。为了找出适用于实际交通网络的高效最短路径并行算法,首先选取了3种最短路径标号串行算法,以此为基础分别实现了网络复制及网络分割两种... 随着智能交通运输系统的研究与应用,对在大规模交通网络上求解最短路径的实时性提出了更高的要求。为了找出适用于实际交通网络的高效最短路径并行算法,首先选取了3种最短路径标号串行算法,以此为基础分别实现了网络复制及网络分割两种策略下求解最短路径的并行算法。最后,从基于G IS的交通规划软件T ransCAD中提取了实际交通路网数据,同时还随机产生了不同规模的稀疏格网,在这些网络中对并行算法的性能进行了测试和分析。结果表明,在8台机器上求解含5 181个节点的实际交通网络中32个源点的最短路径时,基于网络分割的双队列标号修正并行算法的加速比可达到6.32,在其他网络中也表现出较好的加速比及可扩展性。 展开更多
关键词 最短路径 并行算法 加速比
原文传递
无量纲最小二乘有限元法GPU实现及其在变压器绕组流场仿真中的应用研究 被引量:1
6
作者 靳立鹏 刘刚 +2 位作者 任增强 李浩 武卫革 《华北电力大学学报(自然科学版)》 CAS 北大核心 2024年第3期56-64,共9页
为了提高变压器流体场的计算效率,利用统一计算设备架构(compute unified device architecture,CUDA)实现流场的并行计算。首先基于C语言实现无量纲最小二乘有限元法的串行计算方法。然后在Visual Studio 2019+CUDA 10.2的环境下实现并... 为了提高变压器流体场的计算效率,利用统一计算设备架构(compute unified device architecture,CUDA)实现流场的并行计算。首先基于C语言实现无量纲最小二乘有限元法的串行计算方法。然后在Visual Studio 2019+CUDA 10.2的环境下实现并行运算,对于串行程序中最耗时的线性方程组求解部分调用了CUDA自带的函数库进行优化;在大规模模型的数值计算中使用了十字链表格式存储整体刚度阵形成时的非零元素,以解决满阵存储时的内存不足问题。为验证所提方法的有效性,针对方腔模型,分析了不同剖分网格数量下的加速比,分析结果表明,数据规模越大并行效果越好,验证了无量纲最小二乘有限元并行程序的准确性和高效性。最后将该方法应用到大型变压器绕组的流体场分析中,取得了18.3倍的加速效果,为产品级变压器的流体场仿真奠定了基础。 展开更多
关键词 变压器 绕组 无量纲最小二乘有限元 流场 GPU 加速比
下载PDF
掺氢天然气管网数值仿真轻量化算法 被引量:1
7
作者 石国赟 宇波 《天然气工业》 EI CAS CSCD 北大核心 2024年第2期156-165,共10页
目前针对管网数值仿真算法的优化主要集中在代数方程组的求解上。针对管网流动数值仿真算法提升计算效率方案中缺少针对封闭关系与状态方程的优化,分析了目前优化方案各模块的耗时情况,发现了仿真程序中耗时模块为封闭关系与状态方程求... 目前针对管网数值仿真算法的优化主要集中在代数方程组的求解上。针对管网流动数值仿真算法提升计算效率方案中缺少针对封闭关系与状态方程的优化,分析了目前优化方案各模块的耗时情况,发现了仿真程序中耗时模块为封闭关系与状态方程求解。最后,结合计算机库函数的缺点以及现代CPU中SIMD (Single Instruction Multiple Data)模型的特点,提出了针对封闭关系与状态方程的轻量化算法,并验证了算法的高效性。研究结果表明:(1)封闭关系与状态方程模型中的耗时原因为直接调用库函数的次幂运算、指数运算、对数运算以及除法运算;(2)由于次幂运算效率远低于其他运算,通过变换消除了模型中几乎所有的次幂运算;(3)利用SIMD指令来计算指数运算与对数运算,实现了在单核CPU上同时计算多个数据的指数与对数,最后通过数学变换将所有除法转换为乘法;(4)轻量化算法加速效果显著,其整体加速比为18,而在状态方程求解模块的加速比更是高达70以上。结论认为,该轻量化算法在不影响计算精度的条件下提高了计算速度,对于提高掺氢天然气管网在线仿真与智能管网的建设具有重要的理论价值和技术支撑。 展开更多
关键词 天然气管网 数值仿真 计算效率 状态方程 加速比 掺氢
下载PDF
面向D-TIN并行构建的动态条带数据划分方法与实验分析 被引量:6
8
作者 齐琳 沈婕 +1 位作者 郭立帅 周侗 《地球信息科学学报》 CSCD 北大核心 2012年第1期55-61,共7页
数据划分是并行算法设计的重要步骤,其结果的均衡性与高效性是提高并行算法性能的重要前提。对于集聚分布的点集数据,传统的D-TIN(Delaunay Triangulation)并行算法尚未给出划分结果均衡、划分效率高效的理想解决方案。针对上述问题,本... 数据划分是并行算法设计的重要步骤,其结果的均衡性与高效性是提高并行算法性能的重要前提。对于集聚分布的点集数据,传统的D-TIN(Delaunay Triangulation)并行算法尚未给出划分结果均衡、划分效率高效的理想解决方案。针对上述问题,本文在传统D-TIN并行算法规则条带划分方法的基础上,提出采用动态条带实现针对集聚分布点集数据的均衡、高效划分方法。首先,获取点集的最小外接矩形,并使用规则矩形条带按照同一方向进行点集粗分,然后,按顺序进行相邻条带的合并,必要时需动态调整合并区域边界以达到满足负载均衡的要求。为了提高划分效率,尽量减少边界移动次数,采用了对半移动的规则进行边界的动态调整。为了验证动态条带划分方法的适用性,本文使用人工模拟点集数据,进行加速比测试,使用实验区域真实数据进行D-TIN并行构建效率的统计,实验证明,采用该数据划分方法可以获得更高、更稳定的并行加速比,并且数据分布形态和数据规模对加速比的影响较小,进行D-TIN构建可以获得更好的执行效率,并且加速效果更加明显。 展开更多
关键词 D-TIN 并行计算 数据划分 负载均衡 加速比
原文传递
π形山脉主山脊线风速加速效应研究
9
作者 鲍旭明 楼文娟 +3 位作者 廖孙策 林晨琦 陈科技 卞荣 《湖南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第1期170-179,共10页
为研究真实地形的加速效应,提取真实地形的几何特征建立理想简化地形,提出一种π形山脉模型.采用CFD数值模拟研究顺子山脉风向下子山脉间距、长度及坡度对主山脊线加速效应的影响,结合地形特征比较π形山脉与三维余弦山脉的主山脊线加... 为研究真实地形的加速效应,提取真实地形的几何特征建立理想简化地形,提出一种π形山脉模型.采用CFD数值模拟研究顺子山脉风向下子山脉间距、长度及坡度对主山脊线加速效应的影响,结合地形特征比较π形山脉与三维余弦山脉的主山脊线加速比差异,在后者基础上获得π形山脉主山脊线特征点的风速加速比简化计算公式,并通过一处真实π形山脉加以验证.结果表明:π形山脉主山脊线中点的加速比受子山脉间距、长度影响较大,而山脊线交点的加速比受子山脉长度、坡度影响较大;与三维余弦山脉相比,π形山脉主山脊线加速比在山脊线端部相同,但整体偏小,尤其受子山脉遮挡的部分显著偏小,超过离地70 m高度后差异基本消失;通过与真实π形山脉的风场比较,发现简化地形和简化计算公式能较好反映真实地形主山脊线特征点的加速效应. 展开更多
关键词 山脉 简化地形 加速比 计算流体力学(CFD) 数值模拟
下载PDF
基于多核并行计算的无人机CFD数值模拟 被引量:5
10
作者 姜悦宁 贾宏光 厉明 《计算机工程与应用》 CSCD 北大核心 2018年第7期221-225,238,共6页
随着计算机系统向多处理器多核架构发展,针对航空工程技术高精度大规模求解问题,提出了一种高效、准确的无人机CFD(Computational Fluid Dynamics)数值模拟多核并行计算方法。对典型机翼进行了串行解法和并行解法的数值校验,验证了以N-S... 随着计算机系统向多处理器多核架构发展,针对航空工程技术高精度大规模求解问题,提出了一种高效、准确的无人机CFD(Computational Fluid Dynamics)数值模拟多核并行计算方法。对典型机翼进行了串行解法和并行解法的数值校验,验证了以N-S(Navier-Stokes)方程为主控方程的数值求解方法的正确性。接着对比了串行计算和并行计算的时间、加速比等性能,最终获得了针对无人机整机的一种高效的并行计算方法,并对某无人机整机纵向气动特性进行了数值计算。采用FLUENT脚本记录功能,实现不同工况按编译顺序自动计算、保存数据和切换,提高了计算效率。从模块角度详细介绍了CFD串行、并行计算的工作原理,为采用并行计算的方法提供了依据。 展开更多
关键词 计算流体力学(CFD) 并行计算 气动布局 数值模拟 加速比
下载PDF
三次插值样条曲线拟合多核并行算法 被引量:5
11
作者 苗莎 郑晓薇 《计算机应用》 CSCD 北大核心 2010年第A12期3194-3196,共3页
充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短... 充分利用多核技术提升多核处理器的资源利用率,缩短执行时间,发挥多核系统的优异性能。在多核计算机上设计了解三对角方程组的奇偶约化多线程并行程序,实现了三次样条曲线拟合的快速计算。通过实验结果的加速比对比,可以看出并行后缩短了求解方程组的时间,多核资源得到充分利用。结果表明,奇偶约化多核并行算法在三次样条曲线拟合中的应用是有效及可行的。 展开更多
关键词 多核 三对角方程组 并行算法 样条曲线 加速比
下载PDF
Cholesky分解并行算法的性能评测 被引量:5
12
作者 刘青昆 聂晓娜 +1 位作者 马丽 宫利东 《辽宁师范大学学报(自然科学版)》 CAS 2009年第1期58-60,共3页
完成对ABEEMσπ模型电荷分布计算的Cholesky分解并行算法的性能评测.在评测过程中,利用通信性能基准测试工具MPBench及其改进后的测试程序分析了该算法中的通信对并行性能的影响.分析结果表明在cpu增长到一定数目后,此算法的通信开销... 完成对ABEEMσπ模型电荷分布计算的Cholesky分解并行算法的性能评测.在评测过程中,利用通信性能基准测试工具MPBench及其改进后的测试程序分析了该算法中的通信对并行性能的影响.分析结果表明在cpu增长到一定数目后,此算法的通信开销严重影响了并行性能的提高,应该采取相应的解决措施. 展开更多
关键词 CHOLESKY分解 加速比 MPBench
下载PDF
并行处理中节点间通信对加速比的影响 被引量:3
13
作者 申鼎才 董必昌 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第7期764-767,共4页
加速比是衡量并行处理性能的重要指标之一;较高加速比的获得除与任务的划分、并行算法的选择等有关外,还与各节点间的通信有关;在大多数并行系统中,在数据规模确定的情况下,程序的加速比随节点数的增加而增加,但是大多数机群系统的节点... 加速比是衡量并行处理性能的重要指标之一;较高加速比的获得除与任务的划分、并行算法的选择等有关外,还与各节点间的通信有关;在大多数并行系统中,在数据规模确定的情况下,程序的加速比随节点数的增加而增加,但是大多数机群系统的节点间是共享物理传输介质的,这就使得许多并行程序的加速比在节点数目超过某一个值之后会随着节点数的增加而减少;文章通过数值实验研究,分析了节点间通信对加速比的影响,进一步论证了节点间通信对加速比的重要影响。 展开更多
关键词 并行处理 加速比 并行效率
下载PDF
Transputer并行计算机体系方案选择 被引量:5
14
作者 郑世荣 《小型微型计算机系统》 CSCD 北大核心 1992年第2期1-8,15,共9页
本文从并行处理及VLSI技术发展观点,对多机系统的体系结构和性能进行了分析讨论,在此基础上,提出了采用T9000高速处理器芯片构成并行计算机系统的几个实现方案。
关键词 TRANSPUTER 并行计算机 计算机
下载PDF
基于SPMD的粗粒度并行遗传算法在立体仓库路径优化中的应用 被引量:4
15
作者 陈荣虎 何运杰 《软件导刊》 2018年第12期108-112,共5页
为了提高粗粒度并行遗传算法性能,缩短对立体仓库路径优化问题的求解时间,将一种单程序多数据流(简称SPMD)并行结构运用到粗粒度并行遗传算法中,并对算法进行改进。通过对自动化立体仓库拣选路径优化模型的求解,得到串行与并行计算两种... 为了提高粗粒度并行遗传算法性能,缩短对立体仓库路径优化问题的求解时间,将一种单程序多数据流(简称SPMD)并行结构运用到粗粒度并行遗传算法中,并对算法进行改进。通过对自动化立体仓库拣选路径优化模型的求解,得到串行与并行计算两种情况下的运算时间与加速比,并在求解精度相差不大的情况下,将改进算法的计算时间与遗传算法、蚁群遗传算法进行比较。对比结果表明,并行计算能有效提高算法优化效率,缩短程序执行时间。该研究对于解决自动化立体仓库堆垛拣选路径优化问题有着重要的现实意义。 展开更多
关键词 粗粒度并行遗传算法 SPMD并行结构 自动化立体仓库 并行计算 加速比
下载PDF
信号实时采集系统的最佳并行线程数的研究 被引量:4
16
作者 王科特 王力生 《计算机应用》 CSCD 北大核心 2011年第10期2593-2596,共4页
为解决多核环境下,信号采集系统的数据处理实时性问题,提高波形数据采集和数据显示速度,提出使用裸线程构建数据采集模块和数据处理模块的最佳线程分配数量的最优线程分配算法,其目的在于合理分配线程给各个模块,达到系统的最佳性能。... 为解决多核环境下,信号采集系统的数据处理实时性问题,提高波形数据采集和数据显示速度,提出使用裸线程构建数据采集模块和数据处理模块的最佳线程分配数量的最优线程分配算法,其目的在于合理分配线程给各个模块,达到系统的最佳性能。该算法基于生产者-消费者模式、操作系统多线程时间片轮转调度策略,根据各模块的工作量酌情调节线程比例,使应用程序达到最高加速比。实验表明,在双核环境下,该最佳线程数算法计算出最佳线程组合,使采集波形数据和数据显示合理并行化,相对于其他的线程组合分配方式完成程序花费的时间更少,提高了系统加速比、运算性能以及实时性。通过最优线程分配算法,提供了最优的线程数量分配方案,提高并行程序执行效率,减少了不必要的线程开销,提高了波形信号采集实时性。 展开更多
关键词 多核 多线程 实时信号采集 最佳线程数 现场可编程门阵列 加速比
下载PDF
二维沙丘迎风坡沙粒跃移运动的数值模拟 被引量:3
17
作者 武生智 郭为进 《中国沙漠》 CSCD 北大核心 2014年第2期307-311,共5页
为了研究沙丘迎风坡面上沙粒的跃移运动,本文根据风工程和空气动力学的最新理论,给出了沙丘迎风坡面上风场的空间分布规律,在此基础上对沙粒跃移运动进行了数值计算。由于沙丘周围流场情况较为复杂,各处的风速廓线也不同,故选取不同的... 为了研究沙丘迎风坡面上沙粒的跃移运动,本文根据风工程和空气动力学的最新理论,给出了沙丘迎风坡面上风场的空间分布规律,在此基础上对沙粒跃移运动进行了数值计算。由于沙丘周围流场情况较为复杂,各处的风速廓线也不同,故选取不同的坡面位置进行跃移计算,其中各处的起沙率由已有的实验结果或拟合公式给出。计算结果表明:从坡脚到坡顶,平均风速加速比和摩阻风速逐渐增加,到沙丘顶部达到最大值;同时沿坡面向上,各截面处单宽输沙率和距离当地地面相同高度处输沙浓度逐渐加强,这与已有文献报道的结果吻合良好。 展开更多
关键词 加速因子 迎风坡 单宽输沙率 输沙浓度
原文传递
基于GPU的并行非结构网格生成技术研究 被引量:3
18
作者 齐龙 肖素梅 +2 位作者 刘云楚 廖玲玲 蔡云龙 《机械设计与制造》 北大核心 2013年第2期184-186,共3页
为了解决非结构网格生成在时间和内存上的问题,研究了非结构网格的并行生成方法,提出了一种基于CUDA架构的GPU并行非结构网格生成技术。该技术结合了GPU的高速并行性和并行Delaunay网格生成技术的优点,在CUDA编程框架下,将非结构网格生... 为了解决非结构网格生成在时间和内存上的问题,研究了非结构网格的并行生成方法,提出了一种基于CUDA架构的GPU并行非结构网格生成技术。该技术结合了GPU的高速并行性和并行Delaunay网格生成技术的优点,在CUDA编程框架下,将非结构网格生成的技术应用到GPU并行环境中。通过分析此方法的加速比和效率,对其性能进行了评估。实验结果表明,所提出的方法具备有高效性,与传统方法相比,在保证网格质量的同时,大幅度减少了其时间消耗。 展开更多
关键词 非结构网格 网格并行生成 DELAUNAY三角化 GPU 加速比
下载PDF
基于CUDA的海洋监测数据并行压缩技术研究 被引量:3
19
作者 李浩琦 王海斌 汪俊 《海洋技术学报》 北大核心 2014年第1期39-44,共6页
为了提高海底观测网系统的运行效率,针对海洋仪器设备中海量监测数据的存储及传输问题,进行无损数据压缩算法的并行化技术研究。根据海洋监测数据的特点,进行压缩测试,选取出适合并行化的压缩算法,针对原有算法执行速度慢的问题,创新性... 为了提高海底观测网系统的运行效率,针对海洋仪器设备中海量监测数据的存储及传输问题,进行无损数据压缩算法的并行化技术研究。根据海洋监测数据的特点,进行压缩测试,选取出适合并行化的压缩算法,针对原有算法执行速度慢的问题,创新性地提出一种在CUDA架构上利用GPU并行加速平台,多线程分块并行实现数据压缩的方法。实验结果表明并行压缩算法的执行速度有大幅度的提升,压缩加速比最高可提高一个数量级,满足了海洋仪器设备中无损数据压缩的实时性需求。 展开更多
关键词 海洋监测数据 并行数据压缩 加速比 图形处理器
下载PDF
地下水流动三维有限差分模型并行计算 被引量:3
20
作者 杨多兴 李国敏 +1 位作者 董艳辉 黎明 《西南大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第10期149-153,共5页
基于高速内联网落InfiniBand构建(IBA),采用分布式虚拟共亨内存(DVSM),利用Linux PC机群系统,根据地下水流动的有限差分模型MODFLOW,通过并行计算来模拟三维复杂几何形状的非均质各向异性地下孔隙介质含水系统的水流问题.对于给定的边... 基于高速内联网落InfiniBand构建(IBA),采用分布式虚拟共亨内存(DVSM),利用Linux PC机群系统,根据地下水流动的有限差分模型MODFLOW,通过并行计算来模拟三维复杂几何形状的非均质各向异性地下孔隙介质含水系统的水流问题.对于给定的边值问题,计算出不同计算节点的加速比和效率.模拟结果显示,IBA可以通过远程直接内存访问(RDMA)和在硬件中自动运行的方式支持共亨内存进程,在DVSM系统上使计算节点与管理节点之间的通讯时间消耗最小.通过IBA,DVSM能够在很大程度上提高MODFLOW的并行计算效率.结果表明:对于1 000万有限差分计算单元,4,8,16,32,64个计算节点分别参与计算,并行效率分别为32.75%,59.63%,63.63%,58.88%,55.23%.实验证实了基于Linux PC机群系统的MODFLOW并行计算的有效性. 展开更多
关键词 并行计算 INFINIBAND 分布式虚拟共享内存 加速比 MODFLOW Linux PC机群
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部