期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
Hierarchical Cache Directory for CMP 被引量:4
1
作者 郭松柳 王海霞 +2 位作者 薛一波 李崇民 汪东升 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期246-256,共11页
As more processing cores are integrated into one chip and feature size continues to shrink, the average access la- tency for remote nodes using directory-based coherence protocol becomes higher, which greatly impacts ... As more processing cores are integrated into one chip and feature size continues to shrink, the average access la- tency for remote nodes using directory-based coherence protocol becomes higher, which greatly impacts system performance. Previous techniques such as data replication and data migration optimize the performance of the requesting core, but offer little improvement for neighbor nodes. Other techniques such as in-transit optimization try to reduce latency at the cost of increased storage. This paper introduces hierarchical cache directory into CMP (chip multiprocessor), which divides CMP tiles into multiple regions hierarchically, and combines it with data replication. A new directory organization is proposed to record the share status within a region and assist the regional home to complete operation efficiently. Simulation results show that for a 16-core CMP, compared to traditional directory, hierarchical cache directory reduces average access latency by 9% and on-chip network traffic by 34% on average with less storage. Theoretical analyses show that for a 2^n × 2^n tiled CMP, the average access latency in hierarchical cache directory asymptotically approaches a function that is independent of n, hence the architecture is highly scalable. 展开更多
关键词 cache coherence protocol hierarchical directory chip multiprocessor
原文传递
一种基于自更新的简单高效Cache一致性协议 被引量:4
2
作者 何锡明 马胜 +2 位作者 黄立波 陈微 王志英 《计算机研究与发展》 EI CSCD 北大核心 2019年第4期719-729,共11页
随着片上多处理器系统核数的增加,当前一致性协议上存在的许多问题使共享存储系统复杂而低效.目前一些一致性协议极其复杂,例如MESI(modified exclusive shared or invalid)协议,存在众多的中间状态和竞争.并且这些协议还会导致额外失... 随着片上多处理器系统核数的增加,当前一致性协议上存在的许多问题使共享存储系统复杂而低效.目前一些一致性协议极其复杂,例如MESI(modified exclusive shared or invalid)协议,存在众多的中间状态和竞争.并且这些协议还会导致额外失效通信,以及大量记录共享信息的目录存储开销(目录协议)或广播消息的网络开销(监听协议).对数据无竞争的程序实现了一种简单高效一致性协议VISU(valid/invalid states based on self-updating),这种协议基于自更新操作(self-updating)、只包含2个稳定状态(valid/invalid).所设计的两状态VISU协议消除了目录和间接事务.首先基于并行编程的数据无竞争(data race free, DRF)模型,采用在同步点进行自更新共享数据来保证正确性.其次利用动态识别私有和共享数据的技术,提出了对私有数据进行写回、对共享数据进行写直达的方案.对于私有数据,简单的写回策略能够简化不必要的片上通信.在L1 cache中,对于共享数据的写直达方式能确保LLC(last level cache)中数据最新从而消除了几乎所有的一致性状态.实现的VISU协议开销低、不需要目录、没有间接传输和众多的一致性状态,且更加容易验证,同时获得了与MESI目录协议几乎相当甚至更优的性能. 展开更多
关键词 共享存储 片上多处理器 cache一致性协议 自更新 VISU协议
下载PDF
片上多核处理器Cache一致性协议优化研究综述 被引量:5
3
作者 胡森森 计卫星 +3 位作者 王一拙 陈旭 付文飞 石峰 《软件学报》 EI CSCD 北大核心 2017年第4期1027-1047,共21页
现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速... 现代晶体管技术在单芯片上集成多个处理器已经成为现实.近年来,随着多核处理器集成核数的不断增加,高速缓存的一致性问题凸显出来,已成为多核处理器的性能瓶颈之一,亟待解决.介绍了片上多核处理器一致性问题的由来.总结了多核时代高速缓存一致性协议设计的关键问题,综述了近年来学术界对一致性的研究.从程序访存行为模式、目录组织结构、一致性粒度、一致性协议流量、目录协议的可扩展性等方面,阐述了近年来缓存一致性协议性能优化的方向.对目前片上多核处理器缓存一致性协议设计中存在的问题进行了讨论,并指出了未来进一步研究的方向. 展开更多
关键词 片上多核处理器 缓存一致性协议 性能优化
下载PDF
支持多核并行程序确定性重放的高效访存冲突记录方法 被引量:5
4
作者 刘磊 黄河 唐志敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第1期64-75,共12页
多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确... 多核系统中并行程序执行过程的不确定性给程序调试带来了很大的困难.准确记录初始执行中冲突访存的次序是并行程序确定性重放的基础.提出了通过建立精确happens-before关系记录访存冲突的方法.此方法利用简洁高效的地址冲突检测机制确定冲突访存操作在执行中所处happens-before序关系的位置,可以抑制部分记录信息的产生,从而有效减少记录信息.与其他方式方法相比,可以进一步压缩17%的记录条数.采用逻辑向量时钟描述冲突访存操作间的happens-before关系,与采用标量时钟相比,可以避免happens-before关系的误识,降低重放执行时并行度的损失. 展开更多
关键词 确定性重放 缓存一致性协议 访存冲突 多核 并行程序
下载PDF
支持多机环境的片上Cache的设计与实现 被引量:1
5
作者 邹代红 高德远 张盛兵 《计算机工程》 CAS CSCD 北大核心 2007年第23期249-251,共3页
Cache是高性能微处理器解决CPU和存储器速度差异问题的有效措施之一。在共享存储器的多机环境下,共享数据在多个处理器的片上Cache中分布,Cache间维持数据一致性成为关键。该文讨论了32位嵌入式微处理器"龙腾R2"的Cache的设... Cache是高性能微处理器解决CPU和存储器速度差异问题的有效措施之一。在共享存储器的多机环境下,共享数据在多个处理器的片上Cache中分布,Cache间维持数据一致性成为关键。该文讨论了32位嵌入式微处理器"龙腾R2"的Cache的设计和实现和支持多机环境的Cache一致性实现方法,并给出了实现的结果。 展开更多
关键词 cache cache一致性 MEI协议 总线侦听
下载PDF
A Lock-Based Cache Coherence Protocol for Scope Consistency
6
作者 胡伟武 water.chpc.ict.ac.cn +5 位作者 施巍松 water.chpc.ict.ac.cn 唐志敏 water.chpc.ict.ac.cn 李明 water.chpc.ict.ac.cn 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第2期97-109,共13页
Directory protocols are widely adopted to maintain cache coherence of distributed shared memory multiprocessors. Although scalable to a certain extent, directory protocols are complex enough to prevent it from being u... Directory protocols are widely adopted to maintain cache coherence of distributed shared memory multiprocessors. Although scalable to a certain extent, directory protocols are complex enough to prevent it from being used in very large scale multiprocessors with tens of thousands of nodes. This paper proposes a lock-based cache coherence protocol for scope conyistency. It does not rely on directory information to maintain cache coherence. Instead, cache coherence is mailltained through requiring the releasing processor of a lock to store all write-notices generated in the associated critical section to the lock and the acquiring processor invalidates or updates its locally cached data copies according to the write notices of the lock. To evaluate the performance of the lock-based cache coherence protocol, a software DSM system named JIAJIA is built on network of workstations. Besides the lockbased cache coherence protocol, JIAJIA also characterizes itself with its shared memory organization scheme which combines the physical memories of multiple workstations to form a large shared space. Performance measurements with SPLASH2 program suite and NAS benchmarks indicate that, compared to recent SVM systems such as CVM, higher speedup is achieved by JIAJIA.Besides, JIAJIA can solve large scale problems that cannot be solved by other SVM systems due to memory size limitation. 展开更多
关键词 Memory consistency cache coherence lock-based protocol directorybased protocol scope consistency
原文传递
基于伪临界值的Cache一致性协议验证方法 被引量:3
7
作者 屈婉霞 郭阳 +1 位作者 庞征斌 杨晓东 《国防科技大学学报》 EI CAS CSCD 北大核心 2008年第6期47-52,共6页
针对Cache一致性协议状态空间爆炸问题,提出共享集合伪临界值(Pseudo-cutoff)的概念,并以采用释放一致性模型的CC-NUMA系统为例,分析了共享数据的分布情况,推导出在一定条件下共享集合伪临界值为4的结论,有效优化了目录Cache协议状态空... 针对Cache一致性协议状态空间爆炸问题,提出共享集合伪临界值(Pseudo-cutoff)的概念,并以采用释放一致性模型的CC-NUMA系统为例,分析了共享数据的分布情况,推导出在一定条件下共享集合伪临界值为4的结论,有效优化了目录Cache协议状态空间,并提出了解决小概率的宽共享事件的方法。实验数据表明,基于伪临界值的协议模型优化,能够有效缩小Cache协议状态空间,加快验证速度,扩大验证规模。 展开更多
关键词 形式化验证 模型检验 多处理机系统 cache一致性协议
下载PDF
基于多级一致性协议的多核处理器WCET分析方法 被引量:1
8
作者 朱怡安 史先琛 +4 位作者 姚烨 李联 任鹏远 董威振 李佳钰 《计算机研究与发展》 EI CSCD 北大核心 2023年第1期30-42,共13页
由于多核处理器优越的计算性能,多核处理器现已广泛应用在嵌入式实时系统中.相对于单核处理器,多核处理器存在资源共享竞争、并行任务干扰等因素,尤其是缓存(Cache)一致性问题,导致任务最坏情况执行时间(worst-case execution time,WCET... 由于多核处理器优越的计算性能,多核处理器现已广泛应用在嵌入式实时系统中.相对于单核处理器,多核处理器存在资源共享竞争、并行任务干扰等因素,尤其是缓存(Cache)一致性问题,导致任务最坏情况执行时间(worst-case execution time,WCET)的预测更加困难.基于以上因素,提出基于多级一致性协议的多核处理器WCET分析方法.该方法针对多级一致性协议体系架构,提出多级一致性域的概念,将多核处理器的数据访问分为域内访问和跨域访问2个层次,根据Cache读写策略和MESI(modify exclusive shared invalid)一致性协议,得出一致性域内部和跨一致性域的Cache状态更新函数,从而实现多级一致性协议嵌套情况下的WCET分析.实验结果表明,在改变Cache配置参数的情况下,该方法分析结果与GEM5仿真结果的变化趋势一致,经过相关性分析,GEM5仿真结果与该方法分析结果相关性系数不低于0.98;在分析精度方面,该方法的平均过估计率为1.30,相比现有方法降低了0.78. 展开更多
关键词 最坏情况执行时间 cache一致性协议 跨一致性域 静态分析 时序分析
下载PDF
Godson-T缓存一致性协议的Murphi建模和验证 被引量:3
9
作者 周琰 《计算机系统应用》 2013年第10期124-128,共5页
Godson-T缓存一致性协议是用于Godson-T众核处理器的缓存一致性协议.在Godson-T协议中,缓存一致性协议和存储一致性模型存在紧密的紧耦合关系,分析协议的一致性时发现该协议满足的缓存一致性不是强一致性,不满足传统意义上缓存透明的一... Godson-T缓存一致性协议是用于Godson-T众核处理器的缓存一致性协议.在Godson-T协议中,缓存一致性协议和存储一致性模型存在紧密的紧耦合关系,分析协议的一致性时发现该协议满足的缓存一致性不是强一致性,不满足传统意义上缓存透明的一致性要求.我们选取了Murphi模型检测工具作为我们建模的语言和验证工具.在对Godson-T缓存一致性协议建模的时候,由于协议的上述特点,我们需要对处理器核结点,高速缓存和内存作为一个整体建模,并成功地验证了协议的相关性质. 展开更多
关键词 众核处理器 内存一致性模型 缓存一致性协议 模型检测
下载PDF
用于减少远程Cache访问延迟的最后一次写访问预测方法 被引量:1
10
作者 夏军 徐炜遐 +2 位作者 庞征斌 张峻 常俊胜 《国防科技大学学报》 EI CAS CSCD 北大核心 2015年第1期14-20,共7页
为减少远程Cache访问延迟,提高共享存储系统的性能,提出了一种新的基于程序内在写突发特性的最后一次写访问预测方法,并对一个具体的目录协议进行了改造,以支持该预测方法。通过预测Cache块的最后一次写访问并提前对其进行降级,处理器... 为减少远程Cache访问延迟,提高共享存储系统的性能,提出了一种新的基于程序内在写突发特性的最后一次写访问预测方法,并对一个具体的目录协议进行了改造,以支持该预测方法。通过预测Cache块的最后一次写访问并提前对其进行降级,处理器能直接从主存中读取数据,从而减少了远程Cache访问所需的一个网络跳步数。与当前基于指令的预测方法相比,该方法能极大减少存储开销。基准测试程序的评测结果表明,该方法能获得83.1%的预测准确率,并且能提高8.57%的程序执行性能,同时与基于指令的预测方法相比,该方法能分别减少历史踪迹表69%的存储开销和签名表36%的存储开销。 展开更多
关键词 cache一致性协议 远程cache失效 写突发 最后一次写访问 自降级
下载PDF
CCNoC:Cache-Coherent Network on Chip for Chip Multiprocessors 被引量:1
11
作者 王惊雷 薛一波 +4 位作者 Member, CCF, IEEE 王海霞 李崇民 汪东升 Senior Member,CCF 《Journal of Computer Science & Technology》 SCIE EI CSCD 2010年第2期257-266,共10页
As the number of cores in chip multiprocessors (CMPs) increases, cache coherence protocol has become a key issue in integration of chip multiprocessors. Supporting cache coherence protocol in large chip multiprocess... As the number of cores in chip multiprocessors (CMPs) increases, cache coherence protocol has become a key issue in integration of chip multiprocessors. Supporting cache coherence protocol in large chip multiprocessors still faces three hurdles: design complexity, performance and scalability. This paper proposes Cache Coherent Network on Chip (CCNoC), a scheme that decouples cache coherency maintenance from processors and shared L2 caches and implements it completely in network on chip to free up processors and shared L2 caches from the chore of maintaining coherency, thereby reduces design complexity of CMPs. In this way, CCNoC also improves the performance of cache coherence protocol through reducing directory access latency and enhances scalability by avoiding massive directories overhead in shared L2 caches. In CCNoC, coherence state caches and active directory caches are implemented in the network interface components of network on chip to maintain cache coherence states for blocks in L1 caches and manage directory information for recently accessed blocks in L2 caches respectively. CCNoC provides a scalable CMP framework to tackle cache coherency which is the foundation of CMP. This paper evaluates the performance of CCNoC. Experimental results show that for a 16-core system, CCNoC improves performance by 3% on average over the conventional chip multiprocessor and by 10% at best, while reduces storage overhead by 1.8% and saves directory storage by 88%, showing good scalability. 展开更多
关键词 chip multiprocessor network on chip cache coherence protocol
原文传递
异构多处理器系统Cache一致性解决方案 被引量:2
12
作者 田芳 姜秀柱 +1 位作者 王书芹 李娜 《微计算机信息》 北大核心 2008年第29期126-128,共3页
SoC技术的发展使多个异构的处理器集成到一个芯片成为可能,这种结构已成为提高微处理器性能的重要途径。与传统的多处理器系统一样,Cache一致性问题也是片内异构多处理器系统必须首先解决的问题。本文在分析Cache一致性问题的基础上,对... SoC技术的发展使多个异构的处理器集成到一个芯片成为可能,这种结构已成为提高微处理器性能的重要途径。与传统的多处理器系统一样,Cache一致性问题也是片内异构多处理器系统必须首先解决的问题。本文在分析Cache一致性问题的基础上,对采用不同监听协议的多处理器的集成,以牺牲简单的硬件为代价来完成一致性协议的转化。将此方法并入多处理器芯片封装内来管理,可保证在异构多处理器系统中数据的一致性。 展开更多
关键词 异构多处理器系统 cache一致性 监听协议
下载PDF
支持线程级猜测的存储体系结构设计 被引量:2
13
作者 赖鑫 刘聪 王志英 《计算机工程》 CAS CSCD 2012年第24期228-234,共7页
在线程级猜测中进行数据依赖相关检测时,存在Cache一致性协议无法容忍线程切换引起的Cache块替换等问题。为此,通过分析推测线程数据管理模型,结合推测线程切概率低的特点,提出一种分布-共享式恢复缓冲区结构。该结构在进行Cache一致性... 在线程级猜测中进行数据依赖相关检测时,存在Cache一致性协议无法容忍线程切换引起的Cache块替换等问题。为此,通过分析推测线程数据管理模型,结合推测线程切概率低的特点,提出一种分布-共享式恢复缓冲区结构。该结构在进行Cache一致性检验时结合作废向量和版本优先级寄存器进行数据依赖检测,利用L2 Cache进行推测数据缓冲和恢复以支持推测线程切换。修改SESC模拟器以验证和评估该存储体系结构。实验结果表明,在保持模拟器理想加速比的情况下,该存储体系结构可以较好地支持推测线程切换。 展开更多
关键词 线程级猜测 cache一致性协议 存储系统设计 缓冲区恢复 作废向量 版本优先级寄存器
下载PDF
一种应用于多路直连CMP的混合一致性协议 被引量:1
14
作者 王云霏 王飙 +1 位作者 李媛 孙战先 《计算机工程》 CAS CSCD 北大核心 2017年第7期38-43,共6页
Cache一致性协议对系统性能和带宽需求具有重要影响,而当前广泛采用的广播协议带宽需求较高,目录协议访存延迟较大,均不适用于国产服务器CPU直连接口带宽较低及延迟较大的应用场景。针对上述问题,基于Token广播协议和目录协议,设计混合... Cache一致性协议对系统性能和带宽需求具有重要影响,而当前广泛采用的广播协议带宽需求较高,目录协议访存延迟较大,均不适用于国产服务器CPU直连接口带宽较低及延迟较大的应用场景。针对上述问题,基于Token广播协议和目录协议,设计混合一致性协议,采用Simics结合GEM S搭建多路直连片上多核处理器仿真系统,通过运行SPLASH-2测试协议的相关性能。实验结果表明,混合协议的系统性能优于目录协议,与Token协议相比,混合协议以较小的性能代价,大幅降低片间通信带宽需求,且在带宽资源受限系统中具有更好的系统性能。 展开更多
关键词 片间直连 cache一致性 Token协议 目录协议 混合协议
下载PDF
基于不变量查找的German协议验证 被引量:2
15
作者 曹燊 李勇坚 《计算机系统应用》 2015年第11期173-178,共6页
提出了一种通过查找缓存一致性协议不变量来验证带参协议正确性的新方法.缓存一致性协议验证的难点在于必须证明协议对于任意大小的带参系统都成立.我们通过寻找不变量和协议规则之间的对应关系来计算辅助不变量,从而帮助推导验证缓存... 提出了一种通过查找缓存一致性协议不变量来验证带参协议正确性的新方法.缓存一致性协议验证的难点在于必须证明协议对于任意大小的带参系统都成立.我们通过寻找不变量和协议规则之间的对应关系来计算辅助不变量,从而帮助推导验证缓存一致性协议.我们设计实现了一个不变量查找工具并将该工具应用到German协议上计算它们的辅助不变量并成功地验证了协议的安全性质. 展开更多
关键词 缓存一致性协议 带参系统 不变量查找 多核处理器
下载PDF
适用于多核环境的混合Cache一致性协议
16
作者 李静梅 杨鹏飞 +2 位作者 张健沛 门朝光 吴艳霞 《计算机工程》 CAS CSCD 北大核心 2011年第24期284-286,共3页
提出一种适用于多核环境的混合Cache一致性协议。该协议采用混合值传播策略,引入小容量目录D-Cache,克服传统监听一致性协议发送数据请求时盲目广播的缺点,通过数据块状态的扩展,有效避免乒乓现象的发生。仿真实验结果表明,该协议能减... 提出一种适用于多核环境的混合Cache一致性协议。该协议采用混合值传播策略,引入小容量目录D-Cache,克服传统监听一致性协议发送数据请求时盲目广播的缺点,通过数据块状态的扩展,有效避免乒乓现象的发生。仿真实验结果表明,该协议能减少测试程序的运行时间,降低多核处理器私有L1 Cache的失效率,提高系统性能。 展开更多
关键词 cache一致性协议 多核环境 目录 数据块状态 cache失效率
下载PDF
基于Simics的分布式一致性协议仿真
17
作者 郑志硕 郑存陆 曹宏徙 《计算机与现代化》 2011年第9期105-108,共4页
用于多种计算机系统和指令系统仿真的Virtutech Simics只提供一个简单的顺序扁平侦听式高速缓存一致性(Snoo-ping Cache Coherence Protocol)模型支持MESI协议,从而制约了可仿真的并行处理器个数。以下将基于目录的分布式高速缓存一致... 用于多种计算机系统和指令系统仿真的Virtutech Simics只提供一个简单的顺序扁平侦听式高速缓存一致性(Snoo-ping Cache Coherence Protocol)模型支持MESI协议,从而制约了可仿真的并行处理器个数。以下将基于目录的分布式高速缓存一致性协议(Distributed Directory-based Cache Coherence Protocol)模型应用于Simics中并给出基于Simics的分布式一致性协议的仿真结果。这一结果证实分布式协议能降低事件总数,减少网络中的事件。本文提出一个简单的基于目录的分布式高速缓存一致性协议,从而解决制约Simics的可扩放性问题。 展开更多
关键词 计算机系统仿真 全系统仿真平台 片上众核 高速缓存一致性协议 基于目录的高速缓存一致性协议
下载PDF
模型检测MESIF Cache一致性协议 被引量:1
18
作者 吕正 陈昊 +1 位作者 陈峰 吕毅 《计算机工程与应用》 CSCD 北大核心 2010年第17期66-68,152,共4页
在处理器从单核向多核演进的过程中,为了获得更好的性能和可扩展性,适用于多核处理器系统的Cache一致性协议变得越来越复杂。Cache一致性协议的验证一直是模型检测在工业界主要应用之一,被工业界和学术界关注。相对传统方法而言,微结构... 在处理器从单核向多核演进的过程中,为了获得更好的性能和可扩展性,适用于多核处理器系统的Cache一致性协议变得越来越复杂。Cache一致性协议的验证一直是模型检测在工业界主要应用之一,被工业界和学术界关注。相对传统方法而言,微结构级的模型检测能够描述和验证更多的协议细节。利用NuSMV工具对Intel公司的MESIF Cache一致性协议进行模型检测在微结构层次上进行了建模,并对该协议进行模型检测,试验结果证明了此方法的有效性。 展开更多
关键词 模型检测 cache一致性协议 形式验证
下载PDF
参数化系统二维抽象框架 被引量:1
19
作者 屈婉霞 庞征斌 +2 位作者 郭阳 李暾 杨晓东 《国防科技大学学报》 EI CAS CSCD 北大核心 2010年第1期95-100,共6页
针对参数化系统状态空间爆炸问题提出了一个通用的参数化系统二维抽象框架TDA。对所有进程单独进行抽象,利用参数化系统的设计思想,隐藏系统参数构建全系统的抽象模型,最大限度地剔除了原始系统中的冗余信息。建立的具有真并发语义的参... 针对参数化系统状态空间爆炸问题提出了一个通用的参数化系统二维抽象框架TDA。对所有进程单独进行抽象,利用参数化系统的设计思想,隐藏系统参数构建全系统的抽象模型,最大限度地剔除了原始系统中的冗余信息。建立的具有真并发语义的参数化系统的形式化模型,更适合描述一般意义上的并发系统,较好地解决了验证大规模同构和异构系统的空间激增问题。理论推导和实例均证实了TDA的正确性和合理性。 展开更多
关键词 参数化系统 模型检验 抽象 多处理机系统 cache一致性协议
下载PDF
基于访存局部性的一致性请求广播范围预测
20
作者 王云霏 李媛 王飙 《计算机工程》 CAS CSCD 北大核心 2017年第10期17-22,30,共7页
目前广泛采用的广播协议带宽需求较高,目录协议访存延迟较大,不适用于国产服务器处理器片间直连接口带宽相对较低、延迟较高的应用场景。为此,基于片内目录、片间Token广播的双层异构混合一致性协议,应用访存局部性原理,对片间请求广播... 目前广泛采用的广播协议带宽需求较高,目录协议访存延迟较大,不适用于国产服务器处理器片间直连接口带宽相对较低、延迟较高的应用场景。为此,基于片内目录、片间Token广播的双层异构混合一致性协议,应用访存局部性原理,对片间请求广播范围进行预测研究,提出一种HP-SRW协议。实验结果表明,与两级目录协议相比,该协议时间性能提高8.9%,带宽需求降低3.1%,与混合协议相比时间性能略有提升,带宽需求降低30.6%,与Token协议相比,HP-SRW协议以4.7%的时间性能为代价,带宽需求降低66.5%。 展开更多
关键词 片间直连 cache一致性 Token协议 目录协议 混合协议
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部