摘要
展示了一个Intel众核处理架构上优化的N体内核代码,该优化版本在传统处理器上也获得了性能提升;探讨如何快速为优化过程确定一个目标,最终的优化版本达到了峰值上界的89%,因此这是一个较为合理的终点;还展示了在Intel Xeon Phi协处理器上的所有这些优化也能够在Intel Xeon处理器上获得性能提升。
This paper presents a N kernel code optimized Intel the kernel architecture,which also achieves performance improvements on traditional processors.It explores how to quickly set a goal for the optimization process,and the final optimization version reaches 89%of the peak upper bound,so this is a more reasonable end point.It also shows that all these optimizations on Intel Xeon Phi coprocessors can also achieve performance improvements on Intel Xeon processors.
作者
李忠武
明道洋
魏再超
Li Zhongwu;Ming Daoyang;Wei Zaichao(Baoshan University,Baoshan Yunnan 678000)
出处
《保山学院学报》
2020年第2期29-37,共9页
JOURNAL OF BAOSHAN UNIVERSITY
基金
2019年云南省教育厅科学研究基金项目(项目编号:2019J0340)
云南省2018年高校本科教育教学改革研究项目(项目编号:JG2018226)
保山学院教学质量与教学改革工程项目(项目编号:ZXZ201802)。
关键词
N体内核
粒子
单精度
双精度
[N]kernel
Particle
Single precision
Double precision