-
题名BTB索引散列算法的研究与设计
被引量:3
- 1
-
-
作者
王国澎
胡向东
尹飞
朱英
-
机构
国家高性能集成电路设计中心
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2014年第9期2003-2011,共9页
-
基金
"核高基"国家科技重大专项基金项目(2009ZX01028-002-001)
-
文摘
分支误预测是影响高性能处理器性能进一步提升的一个主要因素.现代处理器采用分支目标缓存(branch target buffer,BTB)预测分支指令的目标地址,BTB的预测精度受限于其命中率.由于程序中分支指令的分布并不均匀,传统的BTB索引方式无法充分利用BTB资源,从而造成不必要的冲突缺失,影响分支目标地址的预测精度,采用散列索引方式优化访问映射关系是有效解决方法之一.当前大量文献研究了cache的访问方式,但对BTB的散列索引算法的专门探讨则显不足.为了消除分支指令的分布空洞,离散分支指令和BTB条目的固有映射关系,设计了用于BTB索引的XOR散列算法和优化的bit-select索引算法,使用概率方法对BTB单组最大映射数期望的上界作了估计,并对这两种散列索引算法的效果进行了模拟评估.实验结果表明,散列映射方式能够较好地避免BTB冲突缺失造成的预测失败,XOR散列算法的离散效果更好.
-
关键词
分支目标缓冲
散列索引
xor散列函数
分支目标地址预测
分支预测
-
Keywords
branch target buffer(BTB)
hash index
xor-hash function
branch target prediction
branch prediction
-
分类号
TP393.08
[自动化与计算机技术—计算机应用技术]
-
-
题名共享指令缓存XOR散列索引的研究与设计
被引量:2
- 2
-
-
作者
刘骁
唐勇
郑方
丁亚军
-
机构
江南计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2019年第11期2499-2511,共13页
-
基金
国家重点研发计划(2016YFB0200500)资助~~
-
文摘
SPMD(Single Program Multiple Data)是高性能领域的主要工作模式之一,该模式下邻近核心执行相同的程序块,但根据处理数据或控制流的差异,临近核心的指令流并不完全相同.L1 ICache(Instruction Cache)共享技术通过将邻近核心的L1 ICache共享,能有效利用众核处理器SPMD工作模式的特点,同时能缓解片上资源紧张的问题.但共享结构会带来访问冲突,对性能有不利影响.本文基于排队网络对共享ICache的访问冲突进行了理论分析,该理论分析依据核心对共享ICache体的访问特性进行建模,避免了直接抽象物理节点导致的模型访存特性模糊问题.根据理论推导的指令缓存性能损失原因,本文设计了面向共享L1 ICache的低访问冲突XOR散列函数.函数的设计综合考虑搜索了代价和工程实现复杂性,在保证散列线性空间随机散列能力的前提下,对附加延迟、功耗开销进行控制.该散列函数基于异或操作,通过调整ICache排队网络模型的节点转换概率,降低了共享L1 ICache的访问冲突.实验结果表明,在指令缓存总容量为32 KB的四核心簇上,使用XOR散列的共享L1 ICache结构较私有L1 ICache结构性能平均优化11%,较使用低位交错策略的共享L1 ICache结构性能平均优化8%,较使用面向跨步访存散列策略的共享L1 ICache结构性能平均优化3.2%.
-
关键词
单程序多数据流模型
指令缓存
众核处理器
排队网络模型
xor散列函数
-
Keywords
single program multiple data
instruction cache
many-core processor
queueing network
xor-hash function
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-