-
题名指令级并行编译器的数据预取及优化方法
被引量:8
- 1
-
-
作者
连瑞琦
张兆庆
乔如良
-
机构
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2000年第6期576-584,共9页
-
文摘
微处理器芯片的处理能力越来越强 .但是 ,存储器的速度却远远不能与其匹配 ,造成了整个系统的性能不理想 .为解决这个问题 ,编译器发展了局部性优化、数据预取等多种技术 .文中将介绍一种用于 IL P(Instructionlevel Parallelism)优化编译器的数据预取技术以及一种利用寄存器堆减少主存访问次数、对程序进行优化的方法 .利用它们可以提高平均存储性能 。
-
关键词
数据预取
寄存器堆
预取优化
指令级并行编译器
-
Keywords
data prefetching, temporal locality, register file, prefetching optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名代码优化与指令调度的集成
被引量:4
- 2
-
-
作者
连瑞琦
吴承勇
张兆庆
-
机构
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2001年第7期694-701,共8页
-
基金
国家自然科学基金 (6993 3 0 2 0 )
-
文摘
在开发指令级并行性的编译器中 ,如果代码优化和指令调度各自独立进行 ,将导致代码优化效果的下降甚至产生副作用 .文中针对这一问题 ,提出了代码优化和指令调度集成的思想 .在此思想的基础上 ,介绍了一个适合于代码优化集成的指令调度算法框架 ;并从优化的有效性、是否可逆和优化机会的产生等方面进行了分析 ,选出了适合集成入指令调度的传统优化种类 ;最后给出了这些优化的具体集成方法 .该文提出的方法已经在一个指令级并行编译器上进行了实验 ,实验数据证明 。
-
关键词
代码优化
指令调度
寄存器分配
集成
编译程序
-
Keywords
Optimization
Program compilers
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名多寄存器组网络处理器上的寄存器分配技术
被引量:1
- 3
-
-
作者
张军超
连瑞琦
张兆庆
-
机构
中国科学院计算技术研究所
中国科学院研究生院
-
出处
《计算机学报》
EI
CSCD
北大核心
2006年第1期66-72,共7页
-
文摘
针对传统的图着色寄存器分配算法不能直接处理网络处理器的操作问题,提出了一种多寄存器组网络处理上的寄存器分配技术.在依次分析了一个符号寄存器可能位于哪些寄存器组?如果没有候选组,该如何解决这种冲突?如果有多个候选组,该选用哪个组等问题的基础上,通过将这些方法与图着色寄存器分配算法相融合,在IXP上实现了这种多寄存器组的寄存器分配,提高了它的可编程性.这种方法也可运用到其它具有类似寄存器结构的处理器上.
-
关键词
寄存器分配
网络处理器
多寄存器组
-
Keywords
register allocation
network processor, multiple register banks
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名编译器的性能监控、分析和调试方案
被引量:2
- 4
-
-
作者
连瑞琦
干戈
吕方
-
机构
中国科学院计算技术研究所系统结构室
-
出处
《计算机工程》
CAS
CSCD
北大核心
2004年第12期37-39,42,共4页
-
基金
国家"863"计划软件重大专项"高性能编译系统"(2002AAIZ2104)
国家"863"计划基金资助项目(2001AA111061)
-
文摘
介绍了在基于IA64体系结构的高性能优化编译器ORC的性能调试阶段所开发的工具、利用的方法和积累的经验。实验数据部分给出了ORC性能调试阶段的实际情况,证明了文中介绍的工具、经验和方法在找到新的优化机会、快速定位并排除性能下降和保持性能稳步上升等多方面都是行之有效的。
-
关键词
编译器
性能监控
分析
调试
-
Keywords
Compiler
Performance monitoring
Analysis
Tuning
-
分类号
TP302.7
[自动化与计算机技术—计算机系统结构]
-
-
题名协作式全局指令调度与寄存器分配
被引量:3
- 5
-
-
作者
吴承勇
连瑞琦
张兆庆
乔如良
-
机构
中国科学院计算技术研究所高性能计算机研究中心
-
出处
《计算机学报》
EI
CSCD
北大核心
2000年第5期493-499,共7页
-
文摘
指令级并行是现代高性能处理器的重要特征 .对于发挥这类处理器所具有的并行处理能力来说 ,编译器有至关重要的影响 .文中讨论指令级并行编译中的核心问题——全局指令调度与寄存器分配 ,并以作者为一种新型的显式并行体系结构微处理器研制的编译系统为背景 ,介绍了此类编译器后端设计中面临的指令调度与寄存器分配的时序问题 。
-
关键词
指令级并行
全局指令调度
寄存器分配
编译系统
-
Keywords
instruction level parallelism, global instruction scheduling, instant register allocation
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
TP332
[自动化与计算机技术—计算机科学与技术]
-
-
题名一种增量式数据流分析方法
被引量:2
- 6
-
-
作者
连瑞琦
张兆庆
乔如良
-
机构
中国科学院计算技术研究所系统结构室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2002年第2期136-141,共6页
-
基金
国家自然科学基金项目资助 (6993 3 0 2 0 )
-
文摘
数据流分析是编译器中的重要部分 ,而增量式分析在程序开发环境和过程间优化编译器中有着相当实用的价值 .当程序发生变化时 ,它可以增量式地维护数据流信息 ,而不致因程序的任何小改动都重新进行数据流分析 .给出了一种增量式的消去数据流算法 ,它基于路径简化算法 ,具有和路径简化算法同样的复杂度 ,同样的通用性 (适用于不可归约流图和流函数不完备的情况 ) 。
-
关键词
数据流分析
消去算法
增量式算法
编译器
编译程序
-
Keywords
data flow analysis, elimination algorithm, incremental analysis
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名指令级并行中谓词分析技术的研究
被引量:2
- 7
-
-
作者
芦运照
张兆庆
连瑞琦
-
机构
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2003年第10期1337-1342,共6页
-
基金
国家"八六三"高技术研究发展计划软件重大专项 ( 2 0 0 2AA1Z2 10 4
2 0 0 1AA1110 61)资助
-
文摘
谓词支持是IA 6 4体系结构的新特征 ,它为发掘指令级并行提供了更多的机会 ,同时给编译器的设计者增加了难度 .谓词是条件执行的依据 ,是提高指令级并行的新途径 .该文介绍在ORC(IA 6 4OpenResearchCompiler)中首次设计实现的基于谓词划分图的谓词分析技术及其在指令调度中的应用 .利用谓词分析技术建立了谓词关系数据库、指令调度查询谓词关系数据库提高指令级并行 .文章着重论述了谓词关系数据库的核心———谓词划分图的建立 ,在谓词划分图的基础上实现了谓词关系的计算和查询 ,实际结果表明谓词分析技术有显著优化效果 .
-
关键词
指令级并行
谓词分析
谓词关系数据库
IA-64
体系结构
-
Keywords
Computer architecture
Optimization
Program compilers
Relational database systems
-
分类号
TP311.132
[自动化与计算机技术—计算机软件与理论]
-
-
题名支持有向有环图的微调度方法
被引量:1
- 8
-
-
作者
文严治
连瑞琦
吴承勇
冯晓兵
张兆庆
-
机构
中国科学院计算技术研究所计算机系统结构研究室
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2005年第3期387-393,共7页
-
基金
国家"八六三"高技术研究发展计划软件重大专项基金项目(2002AA1Z2104)国家"八六三"高技术研究发展计划基金项目(2001AA111061)
-
文摘
指令调度是编译器中的重要优化阶段.如何充分利用处理器结构相关的资源,发掘程序并行性,以提高编译优化性能和增强代码可适应性,一直是指令调度的研究难点之一.目前微调度已经取得了一定的效果,但对软件流水产生的有向有环图则未能提供支持.在ORC中提出并实现了一种基于IA-64体系结构的支持有向有环图的微调度方法,有效地减少了程序执行周期和流水线停顿,取得了较为满意的编译优化性能.
-
关键词
有向有环图
模调度
微调度
-
Keywords
directed cyclic graph
modulo scheduling
micro-scheduling
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名控制与数据投机优化技术的研究
被引量:1
- 9
-
-
作者
干戈
连瑞琦
张兆庆
-
机构
中国科学院计算技术研究所
-
出处
《计算机学报》
EI
CSCD
北大核心
2004年第7期881-887,共7页
-
基金
"八六三"高技术研究发展计划软件重大专项"高性能编译系统资助( 2 0 0 2AA1Z2 10 4)"
"面向机器结构的编译优化及二进制代码的动态优化资助 ( 2 0 01AA1110 61)"
英特尔公司的资助
-
文摘
控制投机和数据投机是提高程序指令级并行度的有效方法 .为了保证投机指令的正确执行 ,须解决两个问题 ,即延迟触发控制投机指令导致的异常和数据投机中的别名歧义 .这需要硬件的支持才能做到 ,所以以前在这方面的研究大多是在模拟器上进行的[1~ 6] ,侧重于描述对模拟器结构的扩展 .而IA 6 4是第一个同时支持这两种优化的体系结构[7] .基于此 ,作者用一个统一的框架在IA 6 4开放源码研究编译器 (ORC)中首次实现了控制与投机优化 .该文以编译器为侧重点 ,介绍了投机优化中的几个核心问题及其解决方法 ,其中包括一种新的用来维护投机代码正确性的算法 .实验结果表明这种方法是有效的 .
-
关键词
投机执行
控制投机
数据投机
投机链
恢复代码
瀑式投机
-
Keywords
Optimization
Parallel processing systems
Scheduling
-
分类号
TP302
[自动化与计算机技术—计算机系统结构]
-
-
题名低功耗编译的若干相关技术
- 10
-
-
作者
连瑞琦
张兆庆
-
机构
中国科学院计算技术研究所系统结构室
-
出处
《计算机科学》
CSCD
北大核心
2004年第8期164-167,共4页
-
文摘
本文综述低功耗编译相关技术。首先简要介绍了若干低功耗领域的基本术语之后,总结出了可用于降低功耗的三类编译手段:选取有助于降低功耗的传统优化,考虑功耗因素改造现有优化技术和通过编译制导配合硬件降低功耗。其次简单介绍了多线程系统和功耗模型的相关研究,最后,文章给出了低功耗编译领域研究的若干有潜力的方面,供有志进行这方面研究的研究人员参考。
-
关键词
低功耗
多线程系统
微处理器
能量
功率
编译优化
-
Keywords
Low-power
Compilation
Multi-thread
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-