期刊文献+
共找到103篇文章
< 1 2 6 >
每页显示 20 50 100
并行程序分布式监控方法的研究 被引量:3
1
作者 张延园 刘敏 +1 位作者 叶军 蒋立源 《西北工业大学学报》 EI CAS CSCD 北大核心 1995年第1期82-85,共4页
提出了一种用于并行程序符号调试系统的分布式监控方法。首先在并行程序中插入可监控的"探针",并将并行程序的受控运行分为用户状态、活跃状态、通讯状态和等待状态,在分析这些状态的基础上设计了对并行程序进行分布式管理的监控算... 提出了一种用于并行程序符号调试系统的分布式监控方法。首先在并行程序中插入可监控的"探针",并将并行程序的受控运行分为用户状态、活跃状态、通讯状态和等待状态,在分析这些状态的基础上设计了对并行程序进行分布式管理的监控算法。这一算法已经在PD-100并行计算机上实现,实践表明这种监控机制是简便而有效的. 展开更多
关键词 并行程序 并行计算机 监控
下载PDF
基于CUDA的离散粒子系统模拟仿真及其实现 被引量:3
2
作者 江顺亮 黄强强 +1 位作者 董添文 徐少平 《南昌大学学报(工科版)》 CAS 2011年第3期290-294,共5页
使用CUDA(compute unified device architecture,统一计算架构),利用GPU(graphic processing unit,图像处理器)强大的并行能力实现DEM(discrete element method,离散单元法)的离散粒子系统模拟仿真。邻域搜索时使用基于哈希表排序的邻... 使用CUDA(compute unified device architecture,统一计算架构),利用GPU(graphic processing unit,图像处理器)强大的并行能力实现DEM(discrete element method,离散单元法)的离散粒子系统模拟仿真。邻域搜索时使用基于哈希表排序的邻域搜索算法,依据CUDA内存模型的特点对系统做出有效的内存规划,并使用CUDA流技术通过将粒子碰撞和数据输出分割成4个流异步执行,来隐藏数据拷贝的部分延迟。通过使用CUDA的事件作为GPU计时器监测,实验证明本文中的并行搜索算法的执行效率很高,而使用合理的内存策略和流技术也可以有效的提高系统的性能。 展开更多
关键词 GPU 并行程序设计 CUDA 粒子系统
下载PDF
MPI并行的节点大地电磁三维有限元正演 被引量:1
3
作者 马驹 肖调杰 王赟 《物探化探计算技术》 CAS CSCD 2016年第3期289-296,共8页
用fortran语言编程实现了有限元三维大地电磁正演,通过层状介质模型、二维棱柱体模型及三维低阻体模型结果的对比,验证了所编写程序的正确性。首先通过加入第一类边界条件,减少了最终求解方程组的维数,同时对系数矩阵的存储采用非零存... 用fortran语言编程实现了有限元三维大地电磁正演,通过层状介质模型、二维棱柱体模型及三维低阻体模型结果的对比,验证了所编写程序的正确性。首先通过加入第一类边界条件,减少了最终求解方程组的维数,同时对系数矩阵的存储采用非零存储技术,大大降低了对计算机内存的需求;最后在串行程序的基础上,基于MPI实现了频点间的并行,并对一个三维模型进行计算,并行后开启4进程时加速比达到了2.328,有效地减少了所需时间。 展开更多
关键词 大地电磁 三维 正演 并行 MPI
下载PDF
Bellman-Ford算法性能可移植的GPU并行优化 被引量:7
4
作者 刘磊 王燕燕 +2 位作者 申春 李玉祥 刘雷 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第5期1559-1564,共6页
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AM... 提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。 展开更多
关键词 计算机软件 Bellman-Ford算法 GPU并行编程及优化技术 并行归约算法 性能可移植性
下载PDF
基于MPI的并行程序设计 被引量:9
5
作者 张翠莲 刘方爱 王亚楠 《计算机技术与发展》 2006年第8期72-74,76,共4页
在介绍消息传递接口标准(MPI)和分析并行程序设计方法的基础上,提出了在并行程序设计中需要进行算法级分析和程序级测试,以此来对影响具体的并行程序执行效率的因素进行分析,并用实例验证了分析结果。最后对MPI的实现之一———MPICH1.... 在介绍消息传递接口标准(MPI)和分析并行程序设计方法的基础上,提出了在并行程序设计中需要进行算法级分析和程序级测试,以此来对影响具体的并行程序执行效率的因素进行分析,并用实例验证了分析结果。最后对MPI的实现之一———MPICH1.2.5版本的不足,提出了改进的方法。 展开更多
关键词 消息传递 通信 MPI 并行程序
下载PDF
IB-LB耦合格式模拟贯流式水轮机三维瞬变流 被引量:9
6
作者 李师尧 程永光 张春泽 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2016年第1期122-127,共6页
采用浸没边界-格子玻尔兹曼(IB-LB)格式模拟贯流式水轮机三维瞬变流.首先给出IB-LB模型以及处理转轮旋转和导叶运动强流固耦合问题的方法,然后对某贯流式水轮机过渡过程中的三维瞬变流进行模拟,分析了宏观量变化过程和瞬变流态.结果表明... 采用浸没边界-格子玻尔兹曼(IB-LB)格式模拟贯流式水轮机三维瞬变流.首先给出IB-LB模型以及处理转轮旋转和导叶运动强流固耦合问题的方法,然后对某贯流式水轮机过渡过程中的三维瞬变流进行模拟,分析了宏观量变化过程和瞬变流态.结果表明:贯流式水轮机在甩负荷和增负荷两种工况下的压力、速度、轴推力变化规律与常规认识一致,由此说明IB-LB格式能模拟包括水轮机三维瞬变流在内的更实际的流固耦合问题. 展开更多
关键词 浸没边界-格子玻尔兹曼耦合格式 流固耦合 三维瞬变流 贯流式水轮机 并行计算
原文传递
分蓄洪区洪水演进的并行计算方法研究 被引量:7
7
作者 崔占峰 张小峰 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2005年第5期24-29,共6页
通过网络计算机群,采用信息传递接口(MPI)为通讯库,建立了分蓄洪区洪水演进计算的并行数值模拟方法.以荆江分洪区为对象,模拟计算了实施分洪后洪水的演进过程.计算表明,网络并行计算系统机群的计算速度与计算规模、进程数等因素有关;并... 通过网络计算机群,采用信息传递接口(MPI)为通讯库,建立了分蓄洪区洪水演进计算的并行数值模拟方法.以荆江分洪区为对象,模拟计算了实施分洪后洪水的演进过程.计算表明,网络并行计算系统机群的计算速度与计算规模、进程数等因素有关;并行计算相对于单机计算能够提高计算速度,并且加速比及并行效率会随着计算规模的加大而加大;同时,加速比会随着进程数的增加而先增加后减小,存在着一个最优的进程数. 展开更多
关键词 并行计算 并行程序 MPI 洪水演进
下载PDF
基于OpenMP的电磁场FDTD并行程序性能分析 被引量:7
8
作者 李正浩 周俊 刘大刚 《现代电子技术》 2008年第14期135-138,共4页
OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其... OpenMP是共享内存并行程序设计的工业标准,它通过一些编译指导语句能方便地将程序并行化,特别适合于在多线程的计算机上使用。针对一个采用电磁场FDTD算法的二维波导问题,首先对其计算方法和计算过程进行简单描述,其次讨论了几个影响其并行程序执行效率的几个因素。结果表明,采取不同的并行方式,设定不同的调度策略,设置并行区线程数的大小均会影响并行程序的性能。因此,在使用OpenMP编写电磁场并行程序时,需要综合考虑各种因素的影响才能设计出高效的程序。 展开更多
关键词 OPENMP 并行程序 FDTD 影响因素
下载PDF
基于 PN 的并行程序设计方法 被引量:3
9
作者 蒋昌俊 张兆庆 乔如良 《高技术通讯》 EI CAS CSCD 1998年第1期28-32,共5页
首先分析了并行程序的特点,在此基础上,提出并行程序设计的若干Petri网方法。这些方法在一定程度上有助于减少或避免一些逻辑错误的出现,从而减轻了程序验证的负担。最后通过例子显示了这些方法的作用。
关键词 并行程序 设计方法 PETRI网 组合法 精炼法
下载PDF
微机网络环境下提高PVM并行程序性能的策略 被引量:2
10
作者 尚月强 《计算机工程与设计》 CSCD 北大核心 2007年第13期3100-3102,3129,共4页
网络并行计算是并行计算与分布式计算技术非常重要的发展方向之一,结合具体的数值试验,探讨了Windows操作系统下基于PVM的网络并行数值计算中影响PVM并行程序性能的几个重要因素,包括负载平衡、通信开销、网络性能、任务粒度、处理机个... 网络并行计算是并行计算与分布式计算技术非常重要的发展方向之一,结合具体的数值试验,探讨了Windows操作系统下基于PVM的网络并行数值计算中影响PVM并行程序性能的几个重要因素,包括负载平衡、通信开销、网络性能、任务粒度、处理机个数、精度要求及处理机内存容量问题等,并提出了提高PVM并行程序性能的相应策略,以高效快速地实现问题的求解。 展开更多
关键词 网络并行环境 并行计算 并行程序 性能 并行虚拟机
下载PDF
并行程序的时序测试
11
作者 梁煜 李舒 +1 位作者 张辉 韩承德 《计算机研究与发展》 EI CSCD 北大核心 1999年第9期1062-1068,共7页
并行程序的错误可分为进程间错误(interprocess fault)和进程内部错误(intraprocess fault).其中, 进程内部错误是由控制流错误造成的, 而进程间错误是由进程间的不合理时序关系造成的.... 并行程序的错误可分为进程间错误(interprocess fault)和进程内部错误(intraprocess fault).其中, 进程内部错误是由控制流错误造成的, 而进程间错误是由进程间的不合理时序关系造成的. 文中主要探讨了关于并行程序(以基于消息传递的分布式并行程序为主)时序测试中的一系列关键技术.为了能够简捷、较完备地反映并行程序的运行流程,文中首先构筑了一个同步序列模型,所有问题均在此模型的基础上进行讨论. 为了检测分布式并行程序同步序列的合法性,文中构筑了有效同步序列的形式规范.为使问题更加明了, 还提供了两个典型的聚类操作——树型广播与归并的有效同步序列的形式规范, 并总结了两个操作中的各同步事件间的时序约束规律.庞大的时序组合使得并行程序的测试难以实现, 因此文中提出了一种现实可行的测试策略——原子事件测试方法, 其思想方法是线性化同步序列使其仅由串行的原子同步事件组成。 展开更多
关键词 时序测试 并行程序 同步事件 软件工程
下载PDF
支持多核并行程序确定性重放的高效访存冲突记录方法 被引量:5
12
作者 刘磊 黄河 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第1期64-75,共12页
多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确... 多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确定冲突访存操作在执行中所处happens-before序关系的位置,可以抑制部分记录信息的产生,从而有效减少记录信息.与其他方式方法相比,可以进一步压缩17%的记录条数.采用逻辑向量时钟描述冲突访存操作间的happens-before关系,与采用标量时钟相比,可以避免happens-before关系的误识,降低重放执行时并行度的损失. 展开更多
关键词 确定性重放 缓存一致性协议 访存冲突 多核 并行程序
下载PDF
从河内塔的并行解到UNITY程序设计 被引量:3
13
作者 袁崇义 屈婉玲 《计算机学报》 EI CSCD 北大核心 1998年第S1期195-200,共6页
从事并行程序设计实践的人往往把精力耗费在为变量分配内存,为循环体寻求并行上,却忽略对问题本身的分析.其实能否并行的决定因素是应用问题本身.人们往往急于得到能够运行的代码,一开始就把复杂的问题和复杂的并行环境掺和起来了... 从事并行程序设计实践的人往往把精力耗费在为变量分配内存,为循环体寻求并行上,却忽略对问题本身的分析.其实能否并行的决定因素是应用问题本身.人们往往急于得到能够运行的代码,一开始就把复杂的问题和复杂的并行环境掺和起来了.河内塔(HanoiTower)问题看似无法并行,实际上却允许极大的并行.它的并行解及求解过程对并行程序设计应有一定的启发. 展开更多
关键词 河内塔问题 并行程序 UNITY程序 程序组合
下载PDF
MPI环境下并行程序准确性验证及效率分析 被引量:3
14
作者 江小松 刘建军 《航空动力学报》 EI CAS CSCD 北大核心 2007年第12期2043-2049,共7页
把已有的串行数值模拟程序改编成消息传递接口(MPI)下并行环境的并行数值模拟程序,模拟了基于NASA-TP1680单级透平的4种不同组合的流场,验证了并行程序的有效性和较好的并行效率.同时,分析了影响并行效率的主要因素.
关键词 航空 航天推进系统 消息传递接口(MPI) 并行程序 并行效率 数值模拟
下载PDF
用Petri网分析串行程序的并行性
15
作者 乐晓波 黄敏 《小型微型计算机系统》 CSCD 北大核心 2001年第11期1391-1395,共5页
为把串行程序转换为并行程序 ,最重要且最基本的工作是数据相关性分析 ,而数据相关性分析最主要的内容之一是循环程序中数组元素间的数据相关性分析 .传统的分析方法是通过数组的下标进行分析计算 ,但这种计算每次只能对两个语句间的相... 为把串行程序转换为并行程序 ,最重要且最基本的工作是数据相关性分析 ,而数据相关性分析最主要的内容之一是循环程序中数组元素间的数据相关性分析 .传统的分析方法是通过数组的下标进行分析计算 ,但这种计算每次只能对两个语句间的相关性作出结论 ,而无法知道是否有第三个或更多的语句在这同一数据处相关 ,从而很难确定这两个语句是否可以并行 .将 Petri网用于数据相关性分析理论中 ,可以从全局的观点分析出同一数据处所有语句的相关性 。 展开更多
关键词 PETRI网 串行程序 并行程序 并行性 计算机 分析
下载PDF
系统噪音影响的量化分析 被引量:4
16
作者 武林平 魏勇 +1 位作者 徐小文 刘旭 《计算机研究与发展》 EI CSCD 北大核心 2015年第5期1146-1152,共7页
尽管系统噪音对单个进程的影响有限,但对于大规模并行程序性能的影响不容忽视.提出一种基于并行程序计算-通信特征的噪音影响定量评估方法FWQ-MPI,并给出噪音影响的4个量化指标.选取求解稀疏线性代数方程组的3种迭代方法作为研究对象... 尽管系统噪音对单个进程的影响有限,但对于大规模并行程序性能的影响不容忽视.提出一种基于并行程序计算-通信特征的噪音影响定量评估方法FWQ-MPI,并给出噪音影响的4个量化指标.选取求解稀疏线性代数方程组的3种迭代方法作为研究对象,抽取迭代方法的计算、同步通信特征形成微测试程序;在实际系统上的测试数据明确了系统噪音对并行程序性能的影响机理,并得到系统噪音对并行程序性能影响的若干规律:1)BSP并行程序运行过程中,系统噪音量比例不大,约为2%~6%;2)但系统噪音对BSP并行程序的性能有着较大的影响(当并行规模在1024,2048,4096时,噪音影响比例约为30%~70%);3)其影响随着并行程序规模的扩大而增加,随着2次同步通信间隔内计算量的增加而降低;4)系统噪音的影响主要体现在BSP并行程序的“实际计算通信时间比”要远小于“理想计算通信时间比”. 展开更多
关键词 系统噪音 系统噪音影响 量化分析 负载平衡 数值模拟 并行程序
下载PDF
A Method to Detect the Abnormal Phenomenonin PVM Program Based on Petri Net 被引量:2
17
作者 JIANG Chanaiun(Department of Computer Science, Shandong Mining Institute, Tat’an 271019)(Department of Computer Science, Tough University, Shanghai 200092)LI Caiwei(Institute of Automation, Chinese Acadamy of Sciences, Beijing 100080)ZHANG Zhaoqing and QI 《Systems Science and Systems Engineering》 CSCD 1999年第2期165-178,共14页
The parallel program verification can be divided into two aspects, the communicationand computation verification. In this paper, we mainly study the communication verification. First,we establish the Petri net specifi... The parallel program verification can be divided into two aspects, the communicationand computation verification. In this paper, we mainly study the communication verification. First,we establish the Petri net specification for communication functions and basic statements of PVM;then, we give the steps of designing program verification model and abstract the abnormal phenomenonthat users often meet in the PVM parallel program into the characters of Petri net (including soleinformation, insufficient information, deadlock and livelock); finally, we give some detection algorithmto help users to eliminate these errors. In order to decrease the complexity of verification, we proposeseveral rules to simple the verification model. 展开更多
关键词 parallel program VERIFICATION Petri net verification model verification algorithm
原文传递
WRF三维变分同化并行程序性能分析 被引量:2
18
作者 卢风顺 宋君强 朱小谦 《计算机工程与科学》 CSCD 2007年第11期149-151,156,共4页
并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF... 并行程序性能分析在科学计算程序设计和优化中发挥着重要作用,通过它可以了解并行程序运行效率,分析计算瓶颈,从而改进和优化程序设计,更好地发挥高性能计算机效能。本文介绍了WRF三维变分同化原理和并行策略,采用性能分析工具TAU对WRF三维变分同化并行程序运行效率进行了量化分析,确定了程序的计算热点和瓶颈,并提出了相应的优化方案。 展开更多
关键词 WRF三雏变分同化 并行程序 性能分析 TAU
下载PDF
面向同步规范的并行代码自动生成 被引量:3
19
作者 胡凯 张腾 +2 位作者 尚利宏 杨志斌 Jean-Pierre TALPIN 《软件学报》 EI CSCD 北大核心 2017年第7期1698-1712,共15页
随着对安全攸关实时系统功能与非功能要求的日益增加,使用多核技术将成为发展趋势.如何在多核平台条件下保证系统运行的可信任性及可靠性是学术上和应用上的关键问题.目前基于形式化方法的系统设计、验证以及自动代码生成已在单核平台... 随着对安全攸关实时系统功能与非功能要求的日益增加,使用多核技术将成为发展趋势.如何在多核平台条件下保证系统运行的可信任性及可靠性是学术上和应用上的关键问题.目前基于形式化方法的系统设计、验证以及自动代码生成已在单核平台上形成很多研究成果,但在多核平台上的研究仍面临许多科学问题.同步语言SIGNAL是一种被广泛应用于安全攸关实时系统功能设计的形式化方法,适用于对系统确定性并发行为的描述.SIGNAL编译器也支持将同步规范(synchronous specification)生成仿真代码,以对其进行验证与分析.然而,现有研究较少关注从SIGNAL同步规范到支持跨平台并行代码的生成方法.研究了面向SIGNAL同步规范的并行自动代码生成方法.提出了方程依赖图EDG的概念,将SIGNAL规范转换为EDG以分析其全局数据依赖关系;研究了对EDG进行任务划分获取规范中可以并行执行部分的算法;最后,以跨平台并行编程API-Open MP作为对象,结合程序中信号的时钟关系,将并行任务映射到Open MP并行代码,并进行了实例验证. 展开更多
关键词 同步规范 SIGNAL 并行程序 代码生成 OPENMP
下载PDF
PC实验室的高性能运算平台的实施 被引量:2
20
作者 张澜宇 邹溪 《实验室科学》 2016年第5期53-56,62,共5页
随着对复杂计算的需求越来越多,HPC的数量已满足不了现阶段的需求。同时许多大学中的PC机房面临使用率过低问题。对利用机房中使用率较低的PC和局域网,通过某些系统及软件在机房不被使用的时候将机房中现有的PC以网络技术组合起来协同... 随着对复杂计算的需求越来越多,HPC的数量已满足不了现阶段的需求。同时许多大学中的PC机房面临使用率过低问题。对利用机房中使用率较低的PC和局域网,通过某些系统及软件在机房不被使用的时候将机房中现有的PC以网络技术组合起来协同完成任务,即组成PC集群进行了研究。在需要使用机房的时候将PC还原,恢复机房的原有功能。以此来解决这个矛盾。 展开更多
关键词 HPC 并行程序 ROCKS
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部