期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于GPU的LARED-P算法加速 被引量:3
1
作者 刘来国 徐炜遐 +1 位作者 杨灿群 陈娟 《计算机工程与科学》 CSCD 北大核心 2009年第A01期59-63,103,共6页
GPU拥有几百GFlops甚至上TFlops的浮点计算能力,将GPU应用于粒子模拟,可有效提高大规模粒子模拟的速度,降低计算成本。本文利用GPU加速三维激光等离子体模拟算法LARED-P,提出了基于CPU+GPU的任务划分、GPU上任务分解、大规模计算核心的... GPU拥有几百GFlops甚至上TFlops的浮点计算能力,将GPU应用于粒子模拟,可有效提高大规模粒子模拟的速度,降低计算成本。本文利用GPU加速三维激光等离子体模拟算法LARED-P,提出了基于CPU+GPU的任务划分、GPU上任务分解、大规模计算核心的分解方法,结合使用了寄存器、纹理内存对算法进行加速。在双精度条件下,移植后的算法在工作频率为1.44GHz的NVIDIA Tesla S1070的单个GPU上获得了相当于主频2.4GHz的Intel(R)Core(TM)2 Quad CPU Q6600单核的6倍加速比。 展开更多
关键词 GpU 粒子模拟 lared-p 加速
下载PDF
基于Intel Xeon Phi的激光等离子体粒子模拟研究 被引量:1
2
作者 姚文科 杜云飞 +1 位作者 吴强 杨灿群 《计算机工程与科学》 CSCD 北大核心 2014年第5期809-813,共5页
激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模... 激光等离子体粒子模拟广泛用于探索极端物质状态下的科学问题。将一种基于粒子云网格方法的三维等离子体粒子模拟程序LARED-P移植到Intel Xeon Phi协处理器上。在移植的过程中,综合运用了Native和Offload两种编程模式:首先运用Native模式对LARED-P程序中热点计算任务进行优化研究,通过采用SIMD扩展指令使该计算任务获得了4.61倍的加速;然后运用Offload模式将程序移植到CPU-Intel Xeon Phi异构系统上,并通过使用异步数据传输和双缓冲技术分别提升了程序性能9.8%和21.8%。 展开更多
关键词 lared-p INTEL XEON pHI Native模式 Offload模式 512位SIMD扩展指令 异步数据传输 双缓冲
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部