期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
快速多极子方法在申威众核处理器上的实现和优化 被引量:3
1
作者 王武 王舒扬 +1 位作者 姜金荣 孟虹松 《计算机工程与科学》 CSCD 北大核心 2019年第7期1161-1167,共7页
快速多极子方法(FMM)是一种求解N体问题的快速高效数值算法,在宇宙学和分子动力学等模拟中具有广泛的应用。申威SW26010是一款国产众核异构处理器,含260核心(4核组)。基于申威SW26010的众核架构设计和实现了快速多极子方法,并对核心函数... 快速多极子方法(FMM)是一种求解N体问题的快速高效数值算法,在宇宙学和分子动力学等模拟中具有广泛的应用。申威SW26010是一款国产众核异构处理器,含260核心(4核组)。基于申威SW26010的众核架构设计和实现了快速多极子方法,并对核心函数(尤其是最耗时的粒子对相互作用)系统地进行了性能优化,包括异步DMA、SIMD向量化、循环展开、内联汇编指令调整等。以粒子对相互作用为例,优化后代码的计算速度约为主核上运行的原始代码的400倍,每个核组上的浮点性能达到250GFLOPS,即理论峰值性能的32.5%。 展开更多
关键词 快速多极子方法 异构众核处理器 N体问题 性能优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部