期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
Implementing Higher-Order Gamma on a Massively Parallel computer-A Case study
1
作者 Linpeng Huang Kam Wing Ng, Yongqiang Sun(Department of Computer Science and EngineeringShanghai Jiao Tong University, Shanghai 200030, P. R. China)(Department of Computer Science, The Chinese University of Hong Kong, Hong Kong) 《Journal of Systems Engineering and Electronics》 SCIE EI CSCD 1995年第3期56-62,共7页
Gamma is a kernel programming language with an elegant chemical reaction metaphor in whichprograms are described in terms of multiset rewriting. Gamma formalism allows one to describe analgorithm without introducing a... Gamma is a kernel programming language with an elegant chemical reaction metaphor in whichprograms are described in terms of multiset rewriting. Gamma formalism allows one to describe analgorithm without introducing artificial sequentiality and leads to the derivation of a parallel solution to agiven problem naturally. However, the difficulty of incorporating control strategies makes Gamma not onlyhard for one to define any sophisticated approaches but also impossible to reach a decent level of efficiencyin any direct implementation. Recently, a higherorder multiset programming paradigm, named higher--order Gamma, is introduced by Metayer to alleviate these problems. In this paper, we investigate the possibility of implementing higherorder Gamma on Maspar, a massively data parallel computer. The results showthat a program written in higher--order Gamma can be transformed naturally toward an efficientimplementation on a real parallel machine. 展开更多
关键词 massively parallel computation GAMMA programming paradigm
下载PDF
能散度与发射度模块在太赫兹FWTWT模拟中的应用 被引量:1
2
作者 董烨 董志伟 +2 位作者 杨温渊 张芳 周海京 《太赫兹科学与电子信息学报》 2013年第5期664-669,共6页
研制了三维全电磁粒子模拟大规模并行程序NEPTUNE3D的能散度和发射度模块,主要用于评估电子出射速度和方向分布对太赫兹折叠波导行波管(FWTWT)性能的影响。将能散度和发射度模块应用到0.22 THz的FWTWT器件粒子模拟中,结果表明:能散度主... 研制了三维全电磁粒子模拟大规模并行程序NEPTUNE3D的能散度和发射度模块,主要用于评估电子出射速度和方向分布对太赫兹折叠波导行波管(FWTWT)性能的影响。将能散度和发射度模块应用到0.22 THz的FWTWT器件粒子模拟中,结果表明:能散度主要通过改变器件束压范围,使其偏离束波互作用共振电压范围,导致器件性能下降;发射度反映电子发射角的发散,同时影响纵向与横向电子速度,电子横向速度的增加导致其更易碰撞通道内壁,使电子总数下降,导致器件性能下降;若束压保持不变,电子横向速度的增加势必导致轴向速度的减小,破坏束波同步条件,导致器件性能进一步下降。 展开更多
关键词 三维全电磁粒子模拟 能散度与发射度模块 太赫兹折叠波导行波管 大规模并行计算
下载PDF
面向时间序列大数据海量并行贝叶斯因子化分析方法 被引量:9
3
作者 高腾飞 刘勇琰 +2 位作者 汤云波 张垒 陈丹 《计算机研究与发展》 EI CSCD 北大核心 2019年第7期1567-1577,共11页
时间序列大数据记录着复杂系统在时间和空间上大尺度的演化过程,详细描述了系统不同部分之间的相互作用和相互联系.提取时间序列大数据中潜在的低维因子对研究复杂系统的整体机制有着至关重要的作用.大数据的超高维和大尺度导致许多传... 时间序列大数据记录着复杂系统在时间和空间上大尺度的演化过程,详细描述了系统不同部分之间的相互作用和相互联系.提取时间序列大数据中潜在的低维因子对研究复杂系统的整体机制有着至关重要的作用.大数据的超高维和大尺度导致许多传统因子分析方法难以适应,先验知识缺乏更增加了研究难度.针对这一巨大挑战,提出了一种面向时间序列大数据的海量并行贝叶斯因子化分析方法(the massively parallel Bayesian factorization approach, G -BF).在缺失先验知识的情况下,通过贝叶斯算法导出因子矩阵,将算法映射至CUDA(compute unified device architecture)模型,以大规模并行的方式更新因子矩阵.该方法支持对任意维度张量的因子分解.实验结果表明:1)与通过GPU加速化的因子分解算法G -HALS(GPU-hierarchical alternative least square)相比,G -BF具有更好的运行性能,且随着数据规模的增加,其性能优越性更加明显;2)G -BF在数据处理规模、秩及维度方面都具有良好的可扩展性;3)将G -BF应用于现有子因子融合框架(hierarchical-parallel factor analysis, H-PARAFAC),可将“巨型”张量作为一个整体进行因子化分解(在2个节点上处理10 11 个数据元素),其能力较常规方法高出2个数量级. 展开更多
关键词 贝叶斯模型 时间序列大数据 张量分解 海量并行计算 统一计算设备架构
下载PDF
民机飞发集成构型中机翼多目标优化设计 被引量:8
4
作者 薛帮猛 张文升 张志雄 《空气动力学学报》 CSCD 北大核心 2018年第6期941-948,共8页
利用超级计算机资源求解雷诺平均N-S方程(RANS),计算评估大量外形方案性能,在可接受的时间周期内完成民机飞发集成构型下机翼多目标优化设计。搭建了集成机翼CST参数化、复杂外形网格变形、快速CFD流场解算和自动后处理等关键环节,用遗... 利用超级计算机资源求解雷诺平均N-S方程(RANS),计算评估大量外形方案性能,在可接受的时间周期内完成民机飞发集成构型下机翼多目标优化设计。搭建了集成机翼CST参数化、复杂外形网格变形、快速CFD流场解算和自动后处理等关键环节,用遗传算法全局寻优的优化系统。合理的流程设计使该系统可在"天河2号"超级计算机上同时对数百个方案实施计算评估。在并行计算、加速收敛等技术的综合运用下,使用包含800万单元的多块结构化网格,对NASA CRM (Common Research Model)机翼/机身/短舱/吊挂构型的计算分析可在15min内结束。在3点3目标优化案例中,用90个设计变量表达CRM机翼9个控制剖面的中弧线和扭转角,60h内完成了超过10000个外形方案的计算分析,遗传进化40代。与初始外形相比,PARETO前缘上选择的最优解的各设计点取得了2~10count(1count=阻力系数0.0001)的减阻效果。 展开更多
关键词 飞机/发动机集成 多目标优化设计 大规模并行计算 计算流体力学 网格变形
下载PDF
基于JASMIN的地下水流大规模并行数值模拟 被引量:6
5
作者 程汤培 莫则尧 邵景力 《计算物理》 CSCD 北大核心 2013年第3期317-325,共9页
针对具有精细网格剖分、长时间跨度特征的地下水流模拟中计算时间长、存储开销大等瓶颈问题,基于MODFLOW三维非稳定流计算方法,提出基于网格片的核心算法以及基于影像区的通信机制,并在JASMIN框架上研制了大规模地下水流并行数值模拟程... 针对具有精细网格剖分、长时间跨度特征的地下水流模拟中计算时间长、存储开销大等瓶颈问题,基于MODFLOW三维非稳定流计算方法,提出基于网格片的核心算法以及基于影像区的通信机制,并在JASMIN框架上研制了大规模地下水流并行数值模拟程序JOGFLOW.通过河南郑州市中牟县雁鸣湖水源地地下水流的模拟,对程序正确性和性能进行了验证;通过建立一个具有精细网格剖分的假想地下水概念模型对可扩展性进行测试.相对于32核的并行程序,在512以及1 024个处理机上的并行效率分别可达77.2%和67.5%.数值模拟结果表明,JOGFLOW具有较好的计算性能与可扩展性,能够有效使用数百上千计算核心,支持千万量级以上网格剖分的地下水流模型的大规模并行计算. 展开更多
关键词 高仿真地下水流模拟 大规模并行计算 JOGFLOW MODFLOW JASMIN框架
下载PDF
基于场景驱动的交通信号控制一体化仿真平台设计 被引量:3
6
作者 张立立 王力 《重庆交通大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第1期1-7,共7页
针对传统城市道路交通信号控制仿真存在的仿真规模小、速度慢、信号策略难于实现等问题和未来多场景交叠的交通信号控制仿真所提出的大规模并行实时演化计算需求的矛盾,笔者通过重构开源交通仿真引擎和信号控制设备软硬件框架,设计和开... 针对传统城市道路交通信号控制仿真存在的仿真规模小、速度慢、信号策略难于实现等问题和未来多场景交叠的交通信号控制仿真所提出的大规模并行实时演化计算需求的矛盾,笔者通过重构开源交通仿真引擎和信号控制设备软硬件框架,设计和开发了基于场景驱动的交通信号控制一体化仿真平台,通过设计的标准化API接口可模拟实现多场景驱动的城市道路交通控制仿真需求。以顺义区和潍坊市路网为基础,通过不同规模车队的仿真测试了一体化仿真平台的性能。研究结果表明:仿真平台的路网仿真规模大、实时性能良好,性能稳定、运行可靠,可用于需要大规模实时性仿真的城市交通信号控制。 展开更多
关键词 交通工程 场景驱动 交通仿真引擎 交通控制 大规模并行演化计算 一体化仿真
下载PDF
几种主流大规模并行计算机实现技术的对比分析 被引量:1
7
作者 寿标 李晓峰 《计算机研究与发展》 EI CSCD 北大核心 1996年第6期469-472,共4页
本文主要分析了CM-5E、KSR2、ParagonXP/S和曙光1000这几种当前国内外典型的大规模并行计算机(MPC)的系统结构、互连网络等方面的一些基本情况。
关键词 大规模 并行计算机 系统结构 互连网络
下载PDF
对称正定问题多搜索方向共轭梯度法的收敛性理论 被引量:1
8
作者 谷同祥 刘兴平 迟学斌 《计算数学》 CSCD 北大核心 2004年第1期117-128,共12页
In this paper, we give the convergence and consistence theory of multiple search direction conjugate gradient method (see [10]) and give some upper bound estimations of iterative value and error of our method.
关键词 共轭梯度法 收敛性 稀疏线性方程组 对称正定性 内积
原文传递
基于宏观粒子方法直接数值模拟的气固系统大规模并行计算 被引量:1
9
作者 熊勤钢 葛蔚 《科研信息化技术与应用》 2008年第3期12-19,共8页
气固系统由于其时空多尺度结构和非线性非平衡特性特征,其机理还远未认识清楚。本文从直接数值模拟的角度论述了宏观粒子方法在气固系统机理探索中的应用。首先论述了宏观粒子方法的发展过程及其初期应用,随后介绍此方法的大规模并行计... 气固系统由于其时空多尺度结构和非线性非平衡特性特征,其机理还远未认识清楚。本文从直接数值模拟的角度论述了宏观粒子方法在气固系统机理探索中的应用。首先论述了宏观粒子方法的发展过程及其初期应用,随后介绍此方法的大规模并行计算的算法框架和性能,最后回顾了利用此方法的大规模并行模拟上千个固体颗粒的结果及所得到的重要结论。在本文的结尾,对宏观粒子方法对气固系统的未来工作做了一点展望。 展开更多
关键词 气固系统 直接数值模拟 大规模并行计算 宏观粒子方法
原文传递
湍流模拟壁面距离MPI/OpenMP混合并行计算方法 被引量:3
10
作者 赵钟 何磊 +2 位作者 张健 徐庆新 张来平 《空气动力学学报》 CSCD 北大核心 2019年第6期883-892,共10页
针对计算流体力学在湍流数值模拟过程中壁面距离计算效率不高的问题,设计了一种基于ADT数据结构搜索的MPI/OpenMP混合并行计算方法,以大幅提高大规模网格壁面距离的计算效率,降低因内存消耗而对网格规模的限制。首先分析了壁面距离计算... 针对计算流体力学在湍流数值模拟过程中壁面距离计算效率不高的问题,设计了一种基于ADT数据结构搜索的MPI/OpenMP混合并行计算方法,以大幅提高大规模网格壁面距离的计算效率,降低因内存消耗而对网格规模的限制。首先分析了壁面距离计算精度对湍流模拟的重要性,介绍了壁面距离计算的几何基础。随后基于区域分解思想,将计算域划分为不同的子分区,服务器进程收集全局壁面面元网格信息后发送给其他所有进程,各进程根据全局壁面信息,基于ADT数据结构搜索其网格分区内的单元,精确计算壁面距离。为了解决全局壁面信息内存过大的问题,采用MPI/OpenMP混合并行算法,使得各计算节点中仅有一个或少数几个壁面信息备份,这些壁面信息备份被节点内的其他各进程所共享。最后采用大规模网格进行了壁面距离计算测试,网格规模最大达到33.2亿,结果表明,该方法的计算精度和直接搜索法一致,内存耗费下降70%,计算时间减少约1个量级,能满足大规模CFD数值模拟的需求。 展开更多
关键词 湍流壁面距离 ADT搜索 大规模并行计算 风雷软件
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部