期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
大规模结构动力学并行计算与软件研发进展
被引量:
6
1
作者
范宣华
肖世富
+3 位作者
陈璞
刘青凯
王柯颖
牛红攀
《力学季刊》
CSCD
北大核心
2016年第3期421-432,共12页
以大型复杂装备研制过程中对大规模精细动力学数值模拟的迫切需求为背景,对大规模模态分析及后续相关动力学并行计算的国内外研究进展进行了概述,并对团队在JAUMIN框架和PANDA软件平台上开展的结构动力学并行计算相关研发工作进行了介绍...
以大型复杂装备研制过程中对大规模精细动力学数值模拟的迫切需求为背景,对大规模模态分析及后续相关动力学并行计算的国内外研究进展进行了概述,并对团队在JAUMIN框架和PANDA软件平台上开展的结构动力学并行计算相关研发工作进行了介绍.基于神光III大型光机装备的展示算例表明,PANDA软件的动力学并行可扩展能力达到"上亿自由度、上万核"的水平,万核并行效率高达50%以上,远超国内现有商业软件的分析能力;"基于框架研发应用软件"的设计理念已经成为大规模有限元程序研发的主流理念,对于提升软件研发效率,促进软件实用化和并行可扩展性将起到关键作用.
展开更多
关键词
结构动力学
并行
计算
有限元
软件研发
并行
可扩展性
下载PDF
职称材料
基于多绘制管线的大规模并行体绘制性能优化技术
2
作者
王华维
刘若妍
+1 位作者
艾志玮
曹轶
《计算机工程》
CAS
CSCD
北大核心
2024年第8期207-215,共9页
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担...
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。
展开更多
关键词
体绘制
多管线
两级
并行
并行
可扩展性
性能优化
下载PDF
职称材料
几类典型应用的代数多重网格算法并行可扩展瓶颈分析
3
作者
毛润彰
杜皓
+3 位作者
田鸿运
黄思路
张鹏
徐小文
《计算物理》
CSCD
北大核心
2024年第4期403-417,共15页
对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展...
对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。
展开更多
关键词
代数多重网格
并行
预条件算法
并行
可扩展性
性能分析
性能瓶颈
原文传递
大规模单点基础激励随机振动分析及并行计算
被引量:
5
4
作者
范宣华
于晨阳
+2 位作者
王柯颖
方叶
肖世富
《重庆理工大学学报(自然科学)》
CAS
2017年第10期56-61,89,共7页
基础激励作用下的随机振动分析为结构动力学有限元计算中的一种主要分析类型,在实际结构分析中得到了广泛应用。基于模态叠加法,对基础运动激励下的随机振动核心算法理论进行了系统推导。基于JAUMIN框架并行数据结构,在PANDA平台下完成...
基础激励作用下的随机振动分析为结构动力学有限元计算中的一种主要分析类型,在实际结构分析中得到了广泛应用。基于模态叠加法,对基础运动激励下的随机振动核心算法理论进行了系统推导。基于JAUMIN框架并行数据结构,在PANDA平台下完成了大规模算法设计和并行程序研发。结合数值算例对随机振动响应分析模块进行了对比验证和大规模并行可扩展性测试。研究结果表明:所研发的随机振动分析软件与商业软件的计算结果完全吻合,在并行求解能力上可达到上亿自由度、上万核,远超出商业有限元软件的计算水平。
展开更多
关键词
单点基础激励
并行
计算
随机振动
PANDA平台
并行
可扩展性
模态叠加法
下载PDF
职称材料
基于深腾7000系统的大规模CFD并行计算
被引量:
3
5
作者
周磊
谭伟伟
+1 位作者
张凯宁
韩俊杰
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S1期87-90,共4页
从基本流动控制方程及数值离散、多重网格、并行算法等方面详细阐述了混合网格框架下计算流体力学软件的基本原理,提出了采用三重嵌套循环结构在时间推进格式中实现多重网格加速及并行计算技术的主流程设计方案;同时给出了高精度混合网...
从基本流动控制方程及数值离散、多重网格、并行算法等方面详细阐述了混合网格框架下计算流体力学软件的基本原理,提出了采用三重嵌套循环结构在时间推进格式中实现多重网格加速及并行计算技术的主流程设计方案;同时给出了高精度混合网格并行计算软件在深腾7000系统上的大规模并行测试结果以及在某型民用飞机高升力流场数值模拟中的应用.结果表明:此高精度混合网格并行计算软件在采用千万网格点规模的大型飞机高升力复杂流场计算时,不仅计算结果与实验结果符合较好,且在2 048核并行计算时仍具有很好的并行可扩展性,计算效率不低于80%.
展开更多
关键词
计算流体力学
并行
计算
并行
可扩展性
多重网格
深腾7000系统
原文传递
基于JASMIN三维势场快速多极子算法的并行实现
被引量:
3
6
作者
左风丽
刘旭
+1 位作者
张宝印
胡晓燕
《计算物理》
CSCD
北大核心
2013年第1期140-147,共8页
在JASMIN上,基于进程/线程两级并行实现策略,研制三维Laplace核函数FMM(fast multipole method)的解法器模块"JASMIN-3DLapFMM".该解法器已成功应用于三维静电场远场势的并行计算.固定单机问题规模,在上万个处理器核上运行百...
在JASMIN上,基于进程/线程两级并行实现策略,研制三维Laplace核函数FMM(fast multipole method)的解法器模块"JASMIN-3DLapFMM".该解法器已成功应用于三维静电场远场势的并行计算.固定单机问题规模,在上万个处理器核上运行百亿粒子的大规模问题,获得进程级几乎线性的并行可扩展性.固定总的问题规模和1 024个进程,4个线程时,获得大约3倍的加速.
展开更多
关键词
JASMIN
三维Laplace核函数
JASMIN-3DLapFMM
并行
可扩展性
下载PDF
职称材料
求解Maxwell线性棱元鞍点系统的并行Uzawa算法
7
作者
王俊仙
舒适
冯春生
《计算机工程与科学》
CSCD
北大核心
2009年第11期110-112,131,共4页
本文针对一类Maxwell方程组鞍点问题的第一类N啨d啨lec线性棱元离散系统,设计了一种基于节点辅助空间预条件子的并行Uzawa算法(HX-Uzawa-p)。数值实验结果表明,不论是对光滑系数还是对有无浮动子区域及有无内交叉点的跳系数情形,我们所...
本文针对一类Maxwell方程组鞍点问题的第一类N啨d啨lec线性棱元离散系统,设计了一种基于节点辅助空间预条件子的并行Uzawa算法(HX-Uzawa-p)。数值实验结果表明,不论是对光滑系数还是对有无浮动子区域及有无内交叉点的跳系数情形,我们所设计的并行算法HX-Uzawa-p的迭代次数都基本不依赖于网格规模及系数跳幅,且具有很好的并行可扩展性。
展开更多
关键词
Maxwell鞍点系统
辅助空间预条件子
UZAWA算法
跳系数
并行
可扩展性
下载PDF
职称材料
题名
大规模结构动力学并行计算与软件研发进展
被引量:
6
1
作者
范宣华
肖世富
陈璞
刘青凯
王柯颖
牛红攀
机构
中国工程物理研究院总体工程研究所
北京大学工学院力学与工程科学系
北京应用物理与计算数学研究所
出处
《力学季刊》
CSCD
北大核心
2016年第3期421-432,共12页
基金
国家自然科学基金(11472256)
中国工程物理研究院院长基金项目(YZ2015011)
中国工程物理研究院"双百人才"基金项目(ZX04003)
文摘
以大型复杂装备研制过程中对大规模精细动力学数值模拟的迫切需求为背景,对大规模模态分析及后续相关动力学并行计算的国内外研究进展进行了概述,并对团队在JAUMIN框架和PANDA软件平台上开展的结构动力学并行计算相关研发工作进行了介绍.基于神光III大型光机装备的展示算例表明,PANDA软件的动力学并行可扩展能力达到"上亿自由度、上万核"的水平,万核并行效率高达50%以上,远超国内现有商业软件的分析能力;"基于框架研发应用软件"的设计理念已经成为大规模有限元程序研发的主流理念,对于提升软件研发效率,促进软件实用化和并行可扩展性将起到关键作用.
关键词
结构动力学
并行
计算
有限元
软件研发
并行
可扩展性
Keywords
structural dynamics
parallel computation
finite element method
software development
parallel scalability
分类号
O32 [理学—一般力学与力学基础]
O342 [理学—力学]
下载PDF
职称材料
题名
基于多绘制管线的大规模并行体绘制性能优化技术
2
作者
王华维
刘若妍
艾志玮
曹轶
机构
北京应用物理与计算数学研究所计算物理重点实验室
中物院高性能数值模拟软件中心
出处
《计算机工程》
CAS
CSCD
北大核心
2024年第8期207-215,共9页
基金
国家重点研发计划(2017YFB0202203)。
文摘
针对数值模拟输出的大规模科学数据,体绘制方法为了刻画复杂物理特征,会进行高密度光线采样,但由此带来了极大的计算开销和数据增量。在国产自主CPU高性能计算机上,由于处理器单核的计算能力低于商业CPU,只能使用更多的处理器核来分担体绘制任务,从而引起了采样数据并行通信的可扩展性瓶颈。为充分利用国产自主CPU高性能计算机来高效完成体绘制任务,针对大规模并行体绘制提出一种基于多绘制管线的性能优化技术,通过多管线、多进程的两级并行模式来降低单条管线的并行规模。在大规模并行体绘制中,该技术将绘制目标图像划分成多个子区域,绘制进程则相应分组,每个进程组独立执行一条绘制管线,以完成图像相应子区域的绘制,最后再收集所有的图像子区域,形成完整图像并输出。实验结果表明,优化后的体绘制算法在国产自主CPU高性能计算机上可以扩展到万核规模,并能有效完成体绘制任务。
关键词
体绘制
多管线
两级
并行
并行
可扩展性
性能优化
Keywords
volume rendering
multiple pipelines
two-level parallelism
parallel scalability
performance optimization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
几类典型应用的代数多重网格算法并行可扩展瓶颈分析
3
作者
毛润彰
杜皓
田鸿运
黄思路
张鹏
徐小文
机构
中国工程物理研究院研究生院
北京应用物理与计算数学研究所
南京大学匡亚明学院
中国工程物理研究院高性能数值模拟软件中心
出处
《计算物理》
CSCD
北大核心
2024年第4期403-417,共15页
基金
国家自然科学基金项目(62032023)资助。
文摘
对于大规模稀疏线性代数方程组,代数多重网格(AMG)是具有最优计算复杂度的求解算法,但由于其算法流程复杂,导致难以取得理想的并行可扩展性能,难以定位和分析其并行可扩展瓶颈。通过分析AMG算法的性能骨架和通信模式,归纳了三类可扩展性能瓶颈,并引入稀疏矩阵通信域的概念来刻画稀疏模式对并行通信性能的影响。针对辐射流体力学、结构力学、航空发动机三类实际应用的6个具有不同稀疏模式特征的典型算例,实现了多粒度并行可扩展性能瓶颈的定位与分析,总结了未来AMG并行性能优化方向。
关键词
代数多重网格
并行
预条件算法
并行
可扩展性
性能分析
性能瓶颈
Keywords
algebraic multigrid
parallel preconditioning algorithms
parallel scalability
performance analysis
performance bottleneck
分类号
O246 [理学—计算数学]
原文传递
题名
大规模单点基础激励随机振动分析及并行计算
被引量:
5
4
作者
范宣华
于晨阳
王柯颖
方叶
肖世富
机构
中国工程物理研究院总体工程研究所
出处
《重庆理工大学学报(自然科学)》
CAS
2017年第10期56-61,89,共7页
基金
国家自然科学基金面上资助项目(11472256)
科技部"高性能计算"重大专项课题(2016YFB0201005)
+5 种基金
国防基础科研计划项目(C1520110002)
中国工程物理研究院院长基金
院发展基金
双百人才基金资助项目(YZ2015011
2014B0202025
ZX04003)
文摘
基础激励作用下的随机振动分析为结构动力学有限元计算中的一种主要分析类型,在实际结构分析中得到了广泛应用。基于模态叠加法,对基础运动激励下的随机振动核心算法理论进行了系统推导。基于JAUMIN框架并行数据结构,在PANDA平台下完成了大规模算法设计和并行程序研发。结合数值算例对随机振动响应分析模块进行了对比验证和大规模并行可扩展性测试。研究结果表明:所研发的随机振动分析软件与商业软件的计算结果完全吻合,在并行求解能力上可达到上亿自由度、上万核,远超出商业有限元软件的计算水平。
关键词
单点基础激励
并行
计算
随机振动
PANDA平台
并行
可扩展性
模态叠加法
Keywords
single-point base excitation
parallel computation
random vibration
PANDA platform
parallel scalability
mode superposition method
分类号
TB132 [理学—物理]
下载PDF
职称材料
题名
基于深腾7000系统的大规模CFD并行计算
被引量:
3
5
作者
周磊
谭伟伟
张凯宁
韩俊杰
机构
中国航空计算技术研究所
出处
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第S1期87-90,共4页
基金
国家高技术研究发展计划资助项目(2009AA01A139)
航空基金资助项目(20081431003)
文摘
从基本流动控制方程及数值离散、多重网格、并行算法等方面详细阐述了混合网格框架下计算流体力学软件的基本原理,提出了采用三重嵌套循环结构在时间推进格式中实现多重网格加速及并行计算技术的主流程设计方案;同时给出了高精度混合网格并行计算软件在深腾7000系统上的大规模并行测试结果以及在某型民用飞机高升力流场数值模拟中的应用.结果表明:此高精度混合网格并行计算软件在采用千万网格点规模的大型飞机高升力复杂流场计算时,不仅计算结果与实验结果符合较好,且在2 048核并行计算时仍具有很好的并行可扩展性,计算效率不低于80%.
关键词
计算流体力学
并行
计算
并行
可扩展性
多重网格
深腾7000系统
Keywords
computational fluid dynamics
parallel computing
parallel scalability
multigrid
DeepComp 7000 system
分类号
N55 [自然科学总论]
原文传递
题名
基于JASMIN三维势场快速多极子算法的并行实现
被引量:
3
6
作者
左风丽
刘旭
张宝印
胡晓燕
机构
北京应用物理与计算数学研究所
出处
《计算物理》
CSCD
北大核心
2013年第1期140-147,共8页
基金
国家自然科学基金重点项目(61033009)
国家自然科学基金(60873005)
+2 种基金
国家重点基础研究发展计划(2011CB309702)
国家高技术研究发展计划(2012AA01A309
2010AA012303)资助项目
文摘
在JASMIN上,基于进程/线程两级并行实现策略,研制三维Laplace核函数FMM(fast multipole method)的解法器模块"JASMIN-3DLapFMM".该解法器已成功应用于三维静电场远场势的并行计算.固定单机问题规模,在上万个处理器核上运行百亿粒子的大规模问题,获得进程级几乎线性的并行可扩展性.固定总的问题规模和1 024个进程,4个线程时,获得大约3倍的加速.
关键词
JASMIN
三维Laplace核函数
JASMIN-3DLapFMM
并行
可扩展性
Keywords
JASMIN
three-dimensional Laplace kernel functions
JASMIN-3DLapFMM
parallel scalability
分类号
TP338.6 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
求解Maxwell线性棱元鞍点系统的并行Uzawa算法
7
作者
王俊仙
舒适
冯春生
机构
湘潭大学数学与计算科学学院
出处
《计算机工程与科学》
CSCD
北大核心
2009年第11期110-112,131,共4页
基金
国家自然科学基金资助项目(10771178)
高性能科学计算研究资助项目(2005CB321702)
湘潭大学一般项目(08XZX04)
文摘
本文针对一类Maxwell方程组鞍点问题的第一类N啨d啨lec线性棱元离散系统,设计了一种基于节点辅助空间预条件子的并行Uzawa算法(HX-Uzawa-p)。数值实验结果表明,不论是对光滑系数还是对有无浮动子区域及有无内交叉点的跳系数情形,我们所设计的并行算法HX-Uzawa-p的迭代次数都基本不依赖于网格规模及系数跳幅,且具有很好的并行可扩展性。
关键词
Maxwell鞍点系统
辅助空间预条件子
UZAWA算法
跳系数
并行
可扩展性
Keywords
Maxwell saddle-point system
auxiliary space preconditioner
Uzawa algorithm
jump coefficient
parallelization scalability
分类号
O241.82 [理学—计算数学]
O246 [理学—数学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
大规模结构动力学并行计算与软件研发进展
范宣华
肖世富
陈璞
刘青凯
王柯颖
牛红攀
《力学季刊》
CSCD
北大核心
2016
6
下载PDF
职称材料
2
基于多绘制管线的大规模并行体绘制性能优化技术
王华维
刘若妍
艾志玮
曹轶
《计算机工程》
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
3
几类典型应用的代数多重网格算法并行可扩展瓶颈分析
毛润彰
杜皓
田鸿运
黄思路
张鹏
徐小文
《计算物理》
CSCD
北大核心
2024
0
原文传递
4
大规模单点基础激励随机振动分析及并行计算
范宣华
于晨阳
王柯颖
方叶
肖世富
《重庆理工大学学报(自然科学)》
CAS
2017
5
下载PDF
职称材料
5
基于深腾7000系统的大规模CFD并行计算
周磊
谭伟伟
张凯宁
韩俊杰
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
3
原文传递
6
基于JASMIN三维势场快速多极子算法的并行实现
左风丽
刘旭
张宝印
胡晓燕
《计算物理》
CSCD
北大核心
2013
3
下载PDF
职称材料
7
求解Maxwell线性棱元鞍点系统的并行Uzawa算法
王俊仙
舒适
冯春生
《计算机工程与科学》
CSCD
北大核心
2009
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部