期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
通用图形处理器缓存子系统性能优化方法综述 被引量:4
1
作者 张军 谢竟成 +3 位作者 沈凡凡 谭海 汪吕蒙 何炎祥 《计算机研究与发展》 EI CSCD 北大核心 2020年第6期1191-1207,共17页
随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大... 随着工艺和制程技术的不断发展以及体系架构的日趋完善,通用图形处理器(general purpose graphics processing units,GPGPU)的并行计算能力得到了很大的提升,其在高性能、高吞吐量等通用计算应用场景的使用越来越广泛.GPGPU通过支持大量线程的并发执行,可以较好地隐藏长延时访存操作,从而获得高并行计算能力.然而,GPGPU在处理计算和访存不规则的应用时,其存储子系统的效率受到很大影响,尤其是片上缓存的争用情况尤为突出,难以及时提供计算操作所需的数据,使得GPGPU的高并行计算能力不能得到充分发挥.解决片上缓存的争用问题、优化缓存子系统的性能,是优化GPGPU性能的主要解决方案之一,也是目前研究GPGPU性能优化的主要热点之一.目前,针对GPGPU缓存子系统的性能优化研究主要集中在线程级并行度(thread level parallelism,TLP)调节、访存顺序调节、数据通量增强、最后一级缓存(last level cache,LLC)优化和基于非易失性存储(non-volatile memory,NVM)的GPGPU缓存新架构设计等5个方面.也从这5个方面重点分析讨论了目前主要的GPGPU缓存子系统性能优化方法,并在最后指出了未来GPGPU缓存子系统优化需要进一步探讨的问题,对GPGPU缓存子系统性能优化的研究有重要意义. 展开更多
关键词 通用图形处理器 缓存子系统 性能优化 延迟隐藏 缓存争用
下载PDF
一种基于流水线的指令CACHE优化设计 被引量:3
2
作者 田芳芳 樊晓桠 +1 位作者 靖朝鹏 靳战鹏 《微电子学与计算机》 CSCD 北大核心 2006年第1期93-96,共4页
在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到... 在现代微处理器的设计中,CACHE是整个微处理器性能的决定性因素。本文详细介绍了32位RISC微处理器“龙腾”R2中指令CACHE的体系结构,着重研究了其设计和实现问题。为了提高性能,采用了预取技术和流水线技术来优化设计,仿真结果表明得到了预期的效果。 展开更多
关键词 指令cache 流水线 存储子系统
下载PDF
基于Cadence CHI和IVD VIP的多核SoC系统数据一致性验证 被引量:1
3
作者 范君健 晁张虎 +3 位作者 杨庆娜 刘琪 朱红 单建旗 《电子技术应用》 2020年第8期72-76,共5页
在多核的SoC系统中,不同的处理器核对内存空间和设备空间进行着大量的数据读写操作,维护Cache一致性面临严峻挑战。集中于控制流方面的验证环境搭建已非常复杂,而包含数据正确性检查的验证由于控制流程复杂、数据量大等问题而更加困难... 在多核的SoC系统中,不同的处理器核对内存空间和设备空间进行着大量的数据读写操作,维护Cache一致性面临严峻挑战。集中于控制流方面的验证环境搭建已非常复杂,而包含数据正确性检查的验证由于控制流程复杂、数据量大等问题而更加困难。针对这一问题,基于Cadence公司提供CHI VIP、AXI VIP和IVD VIP,实现多核环境下的系统级数据一致性验证。搭建的验证平台中采用CHI VIP通过笔者开发的CHI协议转换桥发出访存请求,使用AXI VIP收集到达主存的数据,由IVD VIP对CHI端口的请求数据与AXI端口的访存数据进行实时分析比对,实现在较高抽象层次上的激励产生和响应检查。该验证平台能够在子系统级及系统级进行数据一致性验证,具有验证环境搭建快速和功能点覆盖完备的优点。 展开更多
关键词 cache一致性 子系统级验证 VIP 模块化验证
下载PDF
基于共享Cache划分的电力芯片能耗优化技术 被引量:3
4
作者 姚浩 黄开天 +1 位作者 余宏洲 王轲 《电力科学与技术学报》 CAS 北大核心 2021年第5期28-34,共7页
提高电力终端芯片工作效率的同时降低其能耗,是优化智能电网系统的研究方向之一。首先针对MPSoC中高速缓存数据的高效管理问题,开展多处理器共享高速缓存划分(CP)技术研究,利用曲线拟合技术对高速缓存建模,通过数学方法求解CP问题;然后... 提高电力终端芯片工作效率的同时降低其能耗,是优化智能电网系统的研究方向之一。首先针对MPSoC中高速缓存数据的高效管理问题,开展多处理器共享高速缓存划分(CP)技术研究,利用曲线拟合技术对高速缓存建模,通过数学方法求解CP问题;然后基于得到的缺失率曲线,根据共享高速缓存的缺失率与子系统能耗之间的数学关系,得出子系统能耗的数学表达;最后结合处理器能耗模型,综合全局求出最优的CP方案。实验验证表明使用求得的CP方法,处理器子系统能耗是进行优化前的子系统能耗的27.9%。 展开更多
关键词 共享高速缓存划分技术 缺失率 曲线拟合 子系统能耗
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部