期刊文献+

基于KNL众核处理器平台的并行矩量法性能优化

Optimization of parallel method of moments based on KNL many-core processors
下载PDF
导出
摘要 基于Intel第二代Xeon Phi代号为Knights Landing(KNL)众核处理器平台,利用MPI+OpenMP混合编程策略对并行矩量法(Method of Moments, MoM)进行了优化.利用OpenMP编程技术和KNL的计算资源,提高了CPU(Center Processing Unit)使用率;线程的引入,大幅度减少了矩阵填充过程中进程间的冗余积分;为发挥KNL的512位矢量宽度优势,通过向量化优化进一步提高了循环结构的执行效率;对计算密集型、CPU利用率高的矩阵求解过程,通过引入的OpenMP编程策略,减少了MPI(Message Passing Interface)通信时间,加速了求解.数值结果表明,通过在KNL众核处理器平台上的优化,可以极大地提升矩量法计算复杂电磁问题的效率. The parallel method of moments(MoM)is successfully optimized using the MPI+OpenMP hybrid programming strategy,based on the second-generation Intel Xeon Phi many-core processor platform,codenamed Knights Landing(KNL).Using OpenMP programming technology,the utilization rate of the CPU(Center Processing Unit)is increased,and the computing resources of KNL are fully utilized.The introduction of threads substantially reduces the inter-process redundant integrals in the filling matrix process.In order to give full play to the advantage of KNL’s 512-bit vector width,the efficiency of the loop structure is further enhanced through vector optimization.For the matrix solution process,which typically requires intensive computation and high CPU utilization,MPI(Message Passing Interface)communication time is reduced and the solution process is accelerated by introducing an OpenMP programming strategy.Numerical results show that the efficiency of solving complex electromagnetic problems by parallel MoM is greatly improved through optimization on the KNL many-core processor platform.
作者 顾宗静 赵勋旺 刘莹玉 林中朝 张玉 赵玉萍 GU Zong-jing;ZHAO Xun-wang;LIU Ying-yu;LIN Zhong-chao;ZHANG Yu;ZHAO Yu-ping(School of Electronic Engineering,XiDian University,Xian 710071,China;Intel (China) Limited,Beijing 100013,China)
出处 《华东师范大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第1期105-114,共10页 Journal of East China Normal University(Natural Science)
基金 国家重点研发计划(2017YFB0202102 2016YFE0121600) 中国博士后科学基金(2017M613068) NSFC-广东联合基金超级计算科学应用研究专项(第二期)
关键词 众核处理器 MPI+OPENMP 并行矩量法 向量化 many-core processor MPI+OpenMP parallel method of moments(MoM) vectorization
  • 相关文献

参考文献7

二级参考文献24

  • 1奥本海姆,谢弗,巴克.离散时间信号处理(第2版)[M].刘树棠,黄建国,译.西安:西安交通大学出版社,2001:376,380,666-667. 被引量:4
  • 2罗克吉,刘辉,俸志刚,纪禄平.计算机组成原理(第二版),电子工业出版社,2010. 被引量:1
  • 3李惠安.XOR映象cache的分析.中国科学院研究生院(计算技术研究所),1995. 被引量:1
  • 4曹晋华,程侃.可靠性数学引论[M].北京:高等教育出版社,2012. 被引量:16
  • 5莫勒.MATLAB数值计算[M].北京:机械工业出版社,2006. 被引量:5
  • 6王跃科,邢克飞,杨俊,等.空间电子仪器单粒子效应防护技术[M].北京:国防工业出版社,2010. 被引量:4
  • 7刘瑞.宇航处理器Cache系统的可靠性分析和加固研究[D].上海:上海交通大学,2011. 被引量:2
  • 8Geer D. Chip makers turn to multi-core processor [ J ] Computer, 2005,38 ( 5 ) : 11 -13. 被引量:1
  • 9Dally W J, Towles B. Route packets, not wires: On-chip interconnection networks [ C ]// Proc. Design Automation Conference. Las Vegas, Nevada, 2001:684-689. 被引量:1
  • 10Binder D, Smith E C, Holamn A B. Satellite anomalies from galactic cosmic rays [ J ]. IEEE Transactions on Nu- clear Science, 2007,22(6) : 2675-2680. 被引量:1

共引文献39

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部