期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
CPU-GPU融合架构上的缓存性能分析与优化 被引量:3
1
作者 孙传伟 安虹 +1 位作者 孙荪 陈俊仕 《计算机工程与应用》 CSCD 北大核心 2017年第2期47-52,57,共7页
现今CPU和GPU的发展已经出现新的瓶颈,将两者"结合"在同一块芯片上成为一种新的趋势。这种新的异构架构给片上共享资源的管理带来压力。而共享末级缓存(LLC)的管理对性能的影响非常关键。由于CPU程序和GPU程序的不同特性,给CP... 现今CPU和GPU的发展已经出现新的瓶颈,将两者"结合"在同一块芯片上成为一种新的趋势。这种新的异构架构给片上共享资源的管理带来压力。而共享末级缓存(LLC)的管理对性能的影响非常关键。由于CPU程序和GPU程序的不同特性,给CPU和GPU间共享的末级缓存管理带来新的挑战。通过分析GPU程序访存特征,借鉴之前的缓存管理方案,提出对CPU-GPU融合系统的末级缓存进行等量的静态划分和最优静态划分的方案。实验结果表明:通过缓存划分可以有效避免CPU和GPU程序间的干扰。与传统LRU策略相比,等量静态划分和最优静态划分可以使系统整体性能分别提高7.68%和11.62%。 展开更多
关键词 异构架构 融合 共享末级缓存 静态缓存划分
下载PDF
片上多核处理器末级共享Cache可重用数据预测机制 被引量:1
2
作者 韩立敏 高德远 +2 位作者 樊晓桠 史莉雯 安建峰 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第6期1505-1509,共5页
为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问... 为了减少片上多核处理器(Clip multi-processor,CMP)末级共享Cache中的干扰,根据应用程序的存储访问频率特性,提出了一种基于替换算法的可重用数据预测机制。当末级共享Cache的数据将被替换时,先检测此数据的历史访问信息,根据历史访问信息过滤出会被重复使用的数据,并将其保存在片上专用存储器中。仿真结果表明:本文的可重用数据预测机制将IPC(Instruction per clock)平均提高了2.9%,平均减少了应用程序中22.69%的有害替换,有效地减少了Cache抖动。 展开更多
关键词 计算机系统结构 多核处理器 冲突缺失 cache抖动 末级共享cache
下载PDF
片上多核处理器共享末级缓存动静结合地址映射机制 被引量:1
3
作者 曹非 刘志勇 《计算机科学》 CSCD 北大核心 2012年第8期304-310,共7页
片上多核处理器(CMP)通常采用私有或者共享的末级高速缓存(cache)结构,而共享末级cache一般使用静态地址映射机制。该机制将各处理器临时私有访问的数据映射于分布在其他处理器的末级cache中,使得各处理器对临时私有数据的访问延时增加... 片上多核处理器(CMP)通常采用私有或者共享的末级高速缓存(cache)结构,而共享末级cache一般使用静态地址映射机制。该机制将各处理器临时私有访问的数据映射于分布在其他处理器的末级cache中,使得各处理器对临时私有数据的访问延时增加。针对该问题,提出了一种动静结合的共享末级cache地址映射方法。该方法可将原来静态映射于其他处理器末级cache中的临时私有数据动态映射于访问者处理器的本地末级cache中,减少了大量静态映射所造成的长延时非本地末级cache访问,从而有效降低了整个共享末级cache的访问延时,在提高性能的同时降低了功耗和带宽使用。实验结果表明,动静结合的地址映射方式应用于采用环连接互连结构和侦听顺序环协议的CMP结构时,可获得的平均性能提升为9%,最大性能提升为38%。 展开更多
关键词 片上多核处理器 共享末级高速缓存 地址映射机制 侦听顺序环协议
下载PDF
一种面向包含式缓存的共享末级缓存管理策略
4
作者 娄冕 肖建青 +2 位作者 张洵颖 吴龙胜 关刚强 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第1期75-80,共6页
针对传统LRU替换策略无法感知包含式缓存时间局部性的问题,提出一种适用于包含式缓存的共享末级缓存(SLLC)管理策略.通过提前将无用数据存储于一个开销较小的旁路缓存,可以避免其与复用频率较高数据对SLLC的资源竞争,同时维护了包含属性... 针对传统LRU替换策略无法感知包含式缓存时间局部性的问题,提出一种适用于包含式缓存的共享末级缓存(SLLC)管理策略.通过提前将无用数据存储于一个开销较小的旁路缓存,可以避免其与复用频率较高数据对SLLC的资源竞争,同时维护了包含属性.为进一步寻找复用性最低的数据作为替换对象,构建一种局部性检测电路,有助于将此类数据尽早驱逐出SLLC,文中提出一种统一的管理算法,受益于两种预测器的相互校准,从而达到无用块旁路和低重用块替换的目的.实验结果表明,所提策略将SLLC缺失率平均降低21.67%,预测精度提升至72%,而硬件开销不到SLLC的1%. 展开更多
关键词 包含式缓存 管理策略 共享末级缓存 多核
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部