-
题名通用图形处理器缓存子系统性能优化方法综述
被引量:4
- 1
-
-
作者
张军
谢竟成
沈凡凡
谭海
汪吕蒙
何炎祥
-
机构
东华理工大学江西省放射性地学大数据技术工程实验室
东华理工大学信息工程学院
东华理工大学创新创业学院
武汉大学计算机学院
南京审计大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第6期1191-1207,共17页
-
基金
国家自然科学基金项目(61662002,61972293,61902189)
江西省放射性地学大数据技术工程实验室项目(JELRGBDT201905)
江苏省基础研究计划(自然科学基金)项目(BK20180821)。
-
文摘
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义.
-
关键词
通用图形处理器
缓存子系统
性能优化
延迟隐藏
缓存争用
-
Keywords
general purpose graphics processing units(GPGPU)
cache subsystem
performance optimization
latency hiding
cache contention
-
分类号
TP303.1
[自动化与计算机技术—计算机系统结构]
-