-
题名基于Trace-Cache的多级动态优化框架设计
被引量:4
- 1
-
-
作者
唐遇星
邓鹍
周兴铭
-
机构
国防科学技术大学计算机学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2005年第11期1946-1951,共6页
-
基金
国家自然科学基金(No.90307001)
-
文摘
对指令集进行扩展和添加新功能部件是提高处理器性能的有效途径.为了充分利用新的体系结构扩展,已有应用必需经过全新的优化编译.对于跨体系结构优化而言,二进制翻译已经被证明是一种行之有效的技术.本文结合trace技术和动态二进制翻译优化技术,提出一种多级动态优化框架结构,无需静态重新优化编译,在程序动态运行期间,引入多级动态优化方法和扩展指令调度.模拟结果显示该结构具有能有效形成大尺寸的指令调度窗口,准确选择热点代码及优化方法,有效提升旧有应用性能的优点,并有实现灵活,可扩展好等特点.
-
关键词
TRACE
动态优化
指令调度
指令级并行
-
Keywords
trace
dynamic optimization
instruction scheduling
ILP
-
分类号
TP363
[自动化与计算机技术—计算机系统结构]
-
-
题名基于网络负载特征感知的数据流指令调度机制研究
被引量:2
- 2
-
-
作者
冯煜晶
欧焱
叶笑春
范东睿
谭旭
唐志敏
-
机构
中国科学院计算技术研究所计算机体系结构国家重点实验室
中国科学院大学计算机与控制学院
-
出处
《高技术通讯》
EI
CAS
北大核心
2018年第11期885-898,共14页
-
基金
国家重点研发计划(2017YFC0803401)
国家自然科学基金(61332009
+4 种基金
61732018)
计算机体系结构国家重点实验室创新课题(CARCH3303
CARCH3407
CARCH3502
CARCH3505)资助项目
-
文摘
研究了数据流架构的指令调度策略,基于当前普遍采用的数据流指令调度机制,提出了支持模式切换的动态指令调度机制。由于数据流架构执行模式具有并行化特点,同一时刻存在大量并行传递的数据和并行的计算,网络传输负载呈现出非均匀的分布模式。局部网络传输压力过大导致数据流节点中的处理单元内部出现流水线停顿,片上网络(NoC)的局部传输效率降低,从而影响数据流架构的网络传输延迟、计算部件的利用率和整体的执行效率,因此针对原有的指令调度策略提出改进方案。针对网络负载的动态变化实时调整指令调度策略,从而达到缓解网络局部拥塞,提高网络传输效率的目的。本研究使用数据流模拟器对提出的机制进行验证,实验结果表明,采用本文提出的指令调度机制,数据流网络的传输延迟平均降低了12. 8%,计算部件的利用率平均提高了14. 4%,数据流架构的整体性能平均提高了14. 7%。
-
关键词
数据流架构
动态指令调度
片上网络(NoC)
网络负载
单元利用率
-
Keywords
dataflow architecture
dynamic instruction scheduling
network-on-chip (NoC)
network loading
utilization of computational unit
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名动态二进制翻译中的指令调度技术研究与实现
- 3
-
-
作者
孙俊
文延华
漆锋滨
-
机构
江南计算技术研究所
-
出处
《计算机应用与软件》
CSCD
北大核心
2008年第1期17-19,共3页
-
基金
国家863高技术研究发展计划(2002AA112010)
-
文摘
动态二进制翻译提供了无需重新编译源代码就能将源机器生成的可执行代码自动转换到目标机器的方法,很好地解决了代码兼容性问题。其核心思想是根据程序的动态运行信息找到反复执行的代码序列,对代码序列进行翻译和优化,并将结果多次重用。指令调度作为一种有效的编译优化手段,也适用于动态二进制翻译。在对gcc的指令调度器分析研究的基础上,结合动态二进制翻译的实时性特点,提出了适合动态二进制翻译的效率高、开销小的指令调度算法。
-
关键词
动态二进制翻译
指令调度
列表调度
寄存器分配
-
Keywords
dynamic binary translation instruction scheduling List scheduling Register allocation
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名支持AltiVec技术的多媒体协处理单元的研究
- 4
-
-
作者
黄小平
樊晓桠
张盛兵
-
机构
西北工业大学计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2008年第10期3161-3164,共4页
-
基金
国家自然科学基金资助项目(60736012
60573107)
西北工业大学研究生创业种子基金资助项目(200755)
-
文摘
通过对嵌入式处理器进行多媒体处理能力的扩展可增强其对多媒体数据的处理能力。以32 bit龙腾嵌入式处理器为基础,研究AltiVec技术以及超标量技术,设计了该处理器中支持AltiVec技术的多媒体协处理单元。该单元采用五级流水线,将指令动态调度技术分配到不同的流水线中,在提高处理性能的同时保证了设计频率。通过多媒体基准程序测试,该单元的指令IPC为1.2,SMIC0.18μm工艺库下,频率为350 MHz,该协处理单元提高了龙腾处理器的性能。
-
关键词
龙腾处理器
ALTIVEC技术
动态指令调度技术
流水线
-
Keywords
Longtium processor
AltiVec technology
dynamic instruction scheduling technology
pipeline
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-