期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
大规模结构动力学并行计算与软件研发进展 被引量:6
1
作者 范宣华 肖世富 +3 位作者 陈璞 刘青凯 王柯颖 牛红攀 《力学季刊》 CSCD 北大核心 2016年第3期421-432,共12页
以大型复杂装备研制过程中对大规模精细动力学数值模拟的迫切需求为背景,对大规模模态分析及后续相关动力学并行计算的国内外研究进展进行了概述,并对团队在JAUMIN框架和PANDA软件平台上开展的结构动力学并行计算相关研发工作进行了介绍... 以大型复杂装备研制过程中对大规模精细动力学数值模拟的迫切需求为背景,对大规模模态分析及后续相关动力学并行计算的国内外研究进展进行了概述,并对团队在JAUMIN框架和PANDA软件平台上开展的结构动力学并行计算相关研发工作进行了介绍.基于神光III大型光机装备的展示算例表明,PANDA软件的动力学并行可扩展能力达到"上亿自由度、上万核"的水平,万核并行效率高达50%以上,远超国内现有商业软件的分析能力;"基于框架研发应用软件"的设计理念已经成为大规模有限元程序研发的主流理念,对于提升软件研发效率,促进软件实用化和并行可扩展性将起到关键作用. 展开更多
关键词 结构动力学 并行计算 有限元 软件研发 并行可扩展性
下载PDF
基于多绘制管线的大规模并行体绘制性能优化技术
2
作者 王华维 刘若妍 +1 位作者 艾志玮 曹轶 《计算机工程》 CAS CSCD 北大核心 2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担... 针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。 展开更多
关键词 体绘制 多管线 两级并行 并行可扩展性 性能优化
下载PDF
几类典型应用的代数多重网格算法并行可扩展瓶颈分析
3
作者 毛润彰 杜皓 +3 位作者 田鸿运 黄思路 张鹏 徐小文 《计算物理》 CSCD 北大核心 2024年第4期403-417,共15页
对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展... 对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。 展开更多
关键词 代数多重网格 并行预条件算法 并行可扩展性 性能分析 性能瓶颈
原文传递
大规模单点基础激励随机振动分析及并行计算 被引量:5
4
作者 范宣华 于晨阳 +2 位作者 王柯颖 方叶 肖世富 《重庆理工大学学报(自然科学)》 CAS 2017年第10期56-61,89,共7页
基础激励作用下的随机振动分析为结构动力学有限元计算中的一种主要分析类型,在实际结构分析中得到了广泛应用。基于模态叠加法,对基础运动激励下的随机振动核心算法理论进行了系统推导。基于JAUMIN框架并行数据结构,在PANDA平台下完成... 基础激励作用下的随机振动分析为结构动力学有限元计算中的一种主要分析类型,在实际结构分析中得到了广泛应用。基于模态叠加法,对基础运动激励下的随机振动核心算法理论进行了系统推导。基于JAUMIN框架并行数据结构,在PANDA平台下完成了大规模算法设计和并行程序研发。结合数值算例对随机振动响应分析模块进行了对比验证和大规模并行可扩展性测试。研究结果表明:所研发的随机振动分析软件与商业软件的计算结果完全吻合,在并行求解能力上可达到上亿自由度、上万核,远超出商业有限元软件的计算水平。 展开更多
关键词 单点基础激励 并行计算 随机振动 PANDA平台 并行可扩展性 模态叠加法
下载PDF
基于深腾7000系统的大规模CFD并行计算 被引量:3
5
作者 周磊 谭伟伟 +1 位作者 张凯宁 韩俊杰 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第S1期87-90,共4页
从基本流动控制方程及数值离散、多重网格、并行算法等方面详细阐述了混合网格框架下计算流体力学软件的基本原理,提出了采用三重嵌套循环结构在时间推进格式中实现多重网格加速及并行计算技术的主流程设计方案;同时给出了高精度混合网... 从基本流动控制方程及数值离散、多重网格、并行算法等方面详细阐述了混合网格框架下计算流体力学软件的基本原理,提出了采用三重嵌套循环结构在时间推进格式中实现多重网格加速及并行计算技术的主流程设计方案;同时给出了高精度混合网格并行计算软件在深腾7000系统上的大规模并行测试结果以及在某型民用飞机高升力流场数值模拟中的应用.结果表明:此高精度混合网格并行计算软件在采用千万网格点规模的大型飞机高升力复杂流场计算时,不仅计算结果与实验结果符合较好,且在2 048核并行计算时仍具有很好的并行可扩展性,计算效率不低于80%. 展开更多
关键词 计算流体力学 并行计算 并行可扩展性 多重网格 深腾7000系统
原文传递
基于JASMIN三维势场快速多极子算法的并行实现 被引量:3
6
作者 左风丽 刘旭 +1 位作者 张宝印 胡晓燕 《计算物理》 CSCD 北大核心 2013年第1期140-147,共8页
在JASMIN上,基于进程/线程两级并行实现策略,研制三维Laplace核函数FMM(fast multipole method)的解法器模块"JASMIN-3DLapFMM".该解法器已成功应用于三维静电场远场势的并行计算.固定单机问题规模,在上万个处理器核上运行百... 在JASMIN上,基于进程/线程两级并行实现策略,研制三维Laplace核函数FMM(fast multipole method)的解法器模块"JASMIN-3DLapFMM".该解法器已成功应用于三维静电场远场势的并行计算.固定单机问题规模,在上万个处理器核上运行百亿粒子的大规模问题,获得进程级几乎线性的并行可扩展性.固定总的问题规模和1 024个进程,4个线程时,获得大约3倍的加速. 展开更多
关键词 JASMIN 三维Laplace核函数 JASMIN-3DLapFMM 并行可扩展性
下载PDF
求解Maxwell线性棱元鞍点系统的并行Uzawa算法
7
作者 王俊仙 舒适 冯春生 《计算机工程与科学》 CSCD 北大核心 2009年第11期110-112,131,共4页
本文针对一类Maxwell方程组鞍点问题的第一类N啨d啨lec线性棱元离散系统,设计了一种基于节点辅助空间预条件子的并行Uzawa算法(HX-Uzawa-p)。数值实验结果表明,不论是对光滑系数还是对有无浮动子区域及有无内交叉点的跳系数情形,我们所... 本文针对一类Maxwell方程组鞍点问题的第一类N啨d啨lec线性棱元离散系统,设计了一种基于节点辅助空间预条件子的并行Uzawa算法(HX-Uzawa-p)。数值实验结果表明,不论是对光滑系数还是对有无浮动子区域及有无内交叉点的跳系数情形,我们所设计的并行算法HX-Uzawa-p的迭代次数都基本不依赖于网格规模及系数跳幅,且具有很好的并行可扩展性。 展开更多
关键词 Maxwell鞍点系统 辅助空间预条件子 UZAWA算法 跳系数 并行可扩展性
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部