-
题名提升稀疏目录缓存一致性系统性能的方法
被引量:3
- 1
-
-
作者
张轮凯
宋风龙
王达
范东睿
孙凝晖
-
机构
中国科学院计算技术研究所高性能计算机研究中心
中国科学院大学
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第9期1955-1970,共16页
-
基金
国家"九七三"重点基础研究发展计划基金项目(2011CB302501)
国家自然科学基金项目(61173007
+2 种基金
61100013
61100015
61202059)
-
文摘
稀疏目录技术在缓存一致性非一致存储访问(cache coherent non-uniform memory access,ccNUMA)系统中有广泛应用.但是,稀疏目录技术的一个主要缺陷在于目录项替换在目录热点存在的情况下会严重降低系统的性能.针对此问题,研究如何提升稀疏目录性能.首先,从定性和定量的角度对主流的稀疏目录替换算法进行了分析,并且发现最为原始的最久未使用(least-recent-used,LRU)算法的性能实际上要优于一些近期提出的目录替换算法,如最少共享者(least-sharer-count,LSC)算法.其次,将victim cache的思想应用到稀疏目录上,提出了victim目录(victim directory),该技术在主稀疏目录模块上加入了一个小的全相联二级目录存储.最后,提出了选择性victim目录(selective victim directory)技术,使得victim目录选择性地仅存储有用的目录项,从而进一步减少了目录替换的数量.选择性victim目录通过向所有节点的cache发出探查消息(probe messages),从而选择性地存储较为有用的目录项.实验证明,选择性victim目录取得了比简单victim目录更好的性能;而且在仅增加了1KB左右的硬件开销的代价下,选择性victim目录节省了35.7%的程序运行时间.
-
关键词
ccNUMA系统
稀疏目录
替换算法
victim目录
选择性victim目录
-
Keywords
ccNUMA system
sparse directory
replacement policy
victim directory
selective victim directory
-
分类号
TP33
[自动化与计算机技术—计算机系统结构]
-
-
题名多核处理器目录缓存结构设计
被引量:2
- 2
-
-
作者
王恩东
唐士斌
陈继承
王洪伟
倪璠
赵雅倩
-
机构
高效能服务器和存储技术国家重点实验室(浪潮集团有限公司)
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2015年第6期1242-1253,共12页
-
基金
国家"八六三"高技术研究发展计划基金项目(2013AA011701)
-
文摘
随着物联网、云计算与网络舆情分析等应用的快速发展,大数据处理的应用已经成为数据中心的核心负载.数据中心服务器普遍采用多核处理器,而目录缓存作为多核处理器结构中维护缓存一致性的关键部件,对其结构研究(如稀疏目录)更多地关注于目录缓存的容量与可扩展性,更适合处理高性能计算等计算密集型应用.然而,当多核处理器执行延迟敏感的大数据应用程序时,目录缓存的高访存延迟严重制约了数据中心的服务质量.针对该问题,新型主从目录缓存结构优化了数据访问过程中的一致性协议通路,其中主目录区分共享与私有数据,管理私有数据的访存操作,降低私有数据的访存延迟,提高了从目录的容量利用率;从目录维护共享数据的缓存一致性,采用有限位标签结构,提高了从目录的存储效率.实验在Simics+GEMS模拟平台上对大数据程序测试集Cloudsuite-v1.0进行评估.结果表明在以大数据应用程序为主的运行环境下,与2倍容量的稀疏目录相比,主从目录缓存结构降低了24.39%的硬件开销,降低了28.45%的缓存缺失延时,提升了3.5%的处理器IPC;与缓存内目录相比,主从目录结构虽然损失了5.14%的缓存缺失延时与1.1%的处理器IPC,但是降低了42.59%的硬件开销.
-
关键词
大数据
多核处理器
缓存一致性
目录缓存
稀疏目录
-
Keywords
big data
multi-core processor
cache coherence
directory cache
sparse directory
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名多核Cache稀疏目录性能提升方法综述
被引量:2
- 3
-
-
作者
吴健虢
陈海燕
刘胜
邓让钰
陈俊杰
-
机构
国防科技大学计算机学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第3期385-392,共8页
-
基金
国家自然科学基金(61472432)
-
文摘
受限于功耗,十多年前通用微处理器就停止追求更高的主频转而向集成更多处理器核的方向发展;同时,随着晶体管密度按摩尔定律不断提高,单片可集成的处理器核数成倍增长,片上多核、众核处理器已成为高性能微处理器发展的主流。未来千核级通用众核处理器支持共享存储编程模型是一种必然趋势,但传统的Cache一致性目录结构面临着查找延迟高、目录项替换频繁以及硬件代价和功耗可扩展性有限等问题。稀疏目录实现了传统目录结构硬件开销与一致性维护效率的折衷,被认为是众核处理器维护Cache一致性的一种高能效、可扩展结构。综述了近年来提高稀疏目录性能的相关研究与方法,并对其在面积、访问延迟、功耗和实现复杂性等方面进行分析,归纳出这些方法各自的优点和存在的不足,对创新设计未来高性能众核处理器共享存储体系结构具有一定的参考价值。
-
关键词
单片多核
CACHE一致性
稀疏目录
相联度
可扩展
-
Keywords
chip multi-processor(CMP)
cache coherence
sparse directory
associativity
scalable
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-