-
题名基于深度学习的循环自动调度研究
- 1
-
-
作者
胡煜霄
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第7期1770-1777,共8页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助.
-
文摘
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索算法对循环调度空间进行高效的搜索,在搜索样本评估阶段,本文利用深度学习技术为循环调度构建了基于Tree-LSTM的代价模型对搜索过程进行指导以加速搜索过程.经实验验证,本文提出的自动调度框架能够达到优于前沿的启发式循环优化编译器Polly的优化效果,同时本文构建的代价模型能够在10%以内的调度性能损失的前提下显著提升调度搜索过程的效率.
-
关键词
自动调度
编译优化
蒙特卡洛树搜索
深度学习
长短期记忆网络
-
Keywords
auto-schedule
compilation optimization
Monte Carlo tree search
deep learning
long-short term memory
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名HXDSP异构计算框架的设计与优化
被引量:4
- 2
-
-
作者
宁成明
蔡恒雨
郑启龙
耿锐
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
安徽芯纪元科技有限公司
-
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第1期179-185,共7页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
-
文摘
由于CPU在处理海量数据时所面临的性能瓶颈,使得基于异构系统的异构并行计算成为并行计算领域的研究热点之一.HXDSP是中国电子科技集团第三十八所自主研制的DSP芯片,能满足多种高性能计算领域的需求.为了充分发挥HXDSP的计算能力以及多HXDSP设备并行计算的能力,本文设计了基于OpenCL的HXDSP异构计算框架.本文根据计算任务的特性设计了不同的OpenCL设备映射方式,使得HXDSP异构计算框架能适应不同的应用场景,充分利用HXDSP的计算资源并节省能耗.本文在HXDSP异构计算框架设计完成的基础上针对HXDSP异构计算应用程序进行优化,包括数据传输优化和数据访问优化.最后本文通过实验分析了HXDSP异构计算框架的程序性能,验证了HXDSP异构计算框架的可行性以及有效性.
-
关键词
HXDSP
异构计算
OPENCL
程序性能优化
-
Keywords
HXDSP
heterogeneous computing
OpenCL
program performance optimization
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于整数线性规划的VLIW DSP指令分簇调度
被引量:2
- 3
-
-
作者
周鹏
刘纯纲
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《计算机应用研究》
CSCD
北大核心
2022年第10期3078-3083,共6页
-
基金
国家核高基重大专项资助项目(2012ZX01034-001-001)。
-
文摘
在分簇VLIW DSP上,指令分簇是一项对程序性能有重要影响的编译优化,但现有的指令分簇算法只能处理顺序的程序区域,且难以获得最佳的分簇方案。针对这些问题,提出一种基于整数线性规划的统一指令分簇与指令调度的方法。该方法使用0-1决策变量表示函数中指令的分簇、指令的局部调度以及簇间传输指令的全局调度,并将指令之间的依赖关系和对处理器资源的竞争关系构造为线性约束,最终得到一个以最小化函数的估计执行时间为目标的整数线性规划模型。实验结果表明,求解该模型得到的分簇调度方案对程序性能的优化显著强于现有算法,并且求解模型所耗费的时间是可接受的。
-
关键词
数字信号处理器
超长指令字
指令分簇
指令调度
整数线性规划
-
Keywords
digital signal processor(DSP)
very long instruction word(VLIW)
cluster assignment
instruction scheduling
integer linear programming
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于Token语义构建的代码克隆检测
被引量:1
- 4
-
-
作者
王文杰
徐云
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《计算机系统应用》
2022年第11期60-67,共8页
-
基金
国家自然科学基金(61672480)
国家外专局111引智计划(BP0719016)
-
文摘
传统的基于Token的克隆检测方法利用代码字符串的序列化特性,可以在大型代码仓中快速检测克隆.但是与基于抽象语法树(AST)、程序依赖图(PDG)的方法相比,由于缺少语法及语义信息,针对文本有较大差异的克隆代码检测困难.为此,提出一种赋予语义信息的Token克隆检测方法.首先,分析抽象语法树,使用AST路径抽象位于叶子节点的Token的语义信息;然后,在函数名和类型名角色的Token上建立低成本索引,达到快速并有效地筛选候选克隆片段的目的.最后,使用赋予语义信息的Token判定代码块之间的相似性.在公开的大规模数据集BigCloneBench实验结果表明,该方法在文本相似度较低的Moderately Type-3和Weakly Type-3/Type-4类型克隆上显著优于主流方法,包括NiCad、Deckard、CCAligner等,同时在大型代码仓上需要更少的检测时间.
-
关键词
代码克隆检测
抽象语法树
语义信息
高效索引
源代码
-
Keywords
code clone detection
abstract syntax tree
semantic information
efficient index
source code
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于图神经网络的BWDSP指令选择方法优化研究
被引量:2
- 5
-
-
作者
侯璇
凤维杰
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《小型微型计算机系统》
CSCD
北大核心
2021年第12期2672-2679,共8页
-
基金
国家核高基重大专项项目(2012ZX01034-001-001)资助。
-
文摘
现阶段,现代处理器选用不同的策略处理编译完成的代码指令,而选用的指令影响后端代码的性能优化.指令选择所采用的策略依然与传统的基于宏扩展和基于图覆盖的方法相似,且不支持部分复杂的指令,无法充分利用复杂指令带来的高效率,因此也亟需一种新型且有效、可拓展、可移植的指令选择策略.近些年图神经网络GNN在处理非欧氏数据上取得了很多的突破.本文将GNN应用于基于BWDSP平台编译器后端的指令选择的处理过程中,基于图节点的分类、边属性的预测和图分类提出一种低耦合性的指令选择模型,通过实验验证并对比这种方法与传统方法的有效性.并且证明了一个高效的指令选择策略能够充分利用BWDSP的资源,降低程序执行的代价.在提高BWDSP指令选择能力的同时,也期望能将该方法应用到不同平台的指令集,或者编译优化的其它子领域和不同的编译器中.
-
关键词
指令选择
图神经网络
BWDSP平台
编译优化
-
Keywords
instruction selection
graph neural network
BWDSP platform
compilation optimization
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于HXDSP的OpenCL运行时任务调度
- 6
-
-
作者
顾经纬
宁成明
郑启龙
-
机构
中国科学技术大学计算机科学与技术学院
中国科学技术大学高性能计算安徽省重点实验室
-
出处
《计算机系统应用》
2022年第11期130-138,共9页
-
基金
国家核高基重大专项(2012ZX01034-001-001)
-
文摘
OpenCL是一种开源免费的异构计算框架,被各类架构处理器广泛采用.HXDSP是中国电子科技集团公司第38研究所自主研发的国产高性能DSP芯片.为了解决HXDSP异构计算平台调度困难和硬件利用不充分,本文针对OpenCL运行时任务调度系统展开研究,设计了OpenCL运行时期间的任务图自动化提取方法,并结合HXDSP硬件特性和OpenCL执行模型特性对经典的静态调度算法HEFT进行改进,提出了一种异构双粒度最早完成时间优先调度算法HDGEFT,并在HXDSP异构计算平台上设计实验验证算法.实验结果表明经过特殊设计的调度算法在执行效率上有明显优势.
-
关键词
OPENCL
异构计算
任务调度
HXDSP
内核
-
Keywords
OpenCL
heterogeneous computing
task scheduling
HXDSP
kernel
-
分类号
TP332
[自动化与计算机技术—计算机系统结构]
-