-
题名面向国产平台的LLVM自动向量化移植与优化
被引量:2
- 1
-
-
作者
李嘉楠
韩林
柴赟达
-
机构
郑州大学信息工程学院
国家超级计算郑州中心
-
出处
《计算机工程》
CAS
CSCD
北大核心
2022年第1期142-148,共7页
-
基金
国家重点研发计划“全球对地观测成果管理及共享服务系统关键技术研究”(2018YFB0505000)。
-
文摘
作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令集特征完善指令代价信息以提高收益分析精准度,使其在自动向量化后生成后端支持且简洁高效的向量指令。在此基础上,提出一种改进的控制流向量化方法,通过添加指令代价信息提高自动向量化的适配能力,从而形成一套面向国产平台的LLVM自动向量化系统。实验结果表明,相比自动向量化移植前,通过该方法进行移植优化后,SPEC测试的整体性能提升10.8%,TSVC测试集中的加速比提升16%,精准代价指导下的加速比提升42%,控制流向量化下的加速比提升51%。
-
关键词
自动向量化
向量化收益
移植
LLVM编译器
国产平台
-
Keywords
automatic vectorization
vectorization cost
transplant
LLVM compiler
domestic processor
-
分类号
TP314
[自动化与计算机技术—计算机软件与理论]
-
-
题名分数像素运动矢量代价产生器的VLSI设计
被引量:1
- 2
-
-
作者
王庆春
曹喜信
何晓燕
魏红雅
-
机构
北京大学深圳研究生院集成微系统重点实验室
北京大学软件与微电子学院
安康学院物理与计算机系
-
出处
《电视技术》
北大核心
2007年第4期15-18,共4页
-
基金
北京市(SoC)重大科技计划项目(D0306008040211)
安康学院专项科研计划资助项目(2006AKXY009)
-
文摘
针对H.264/AVC视频编码器的系统芯片设计,通过分析分数像素运动估计(FME)模块的数据并行度和硬件利用率,探讨了分数像素运动矢量代价产生器的复用结构,再依据FME模块的具体设计约束,提出了可以复用产生1/2像素和1/4像素运动矢量代价的硬件实现结构,并且在FPGA开发板上进行了分数像素运动矢量代价产生器的设计验证。
-
关键词
H.264/AVC标准
视频编码器
分数像素运动估计
率失真优化
运动矢量代价
-
Keywords
H264/AVC
video encoder, Fractional Motion Estimation (FME)
Rate Distortion Optimization (RDO)
Motion vector cost
-
分类号
TN919.8
[电子电信—通信与信息系统]
-
-
题名MANET路由协议研究
- 3
-
-
作者
肖鑫
戴冠中
汤亮
-
机构
西北工业大学自动化学院
-
出处
《科学技术与工程》
2008年第3期648-650,655,共4页
-
基金
航空科学基金项目(05F53029)
西北工业大学研究生创业种子基金(Z200741)资助
-
文摘
通过分析MANET路由协议的特点和要求,以及现有主流路由协议的特点,提出并设计了一种限容、低开销的先验式距离矢量路由协议。通过改进的抑制计时器机制来避免路由环路,邻居验证机制来消除单向链路,以及延迟触发更新机制来平衡路由收敛速度与开销。最后分析了此协议的各项性能以及需要解决的问题。
-
关键词
MANET
路由协议
距离矢量
低开销
-
Keywords
MANET routing protocol distance vector low-cost
-
分类号
TN911.25
[电子电信—通信与信息系统]
TP393
[电子电信—信息与通信工程]
-