期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
面向国产平台的LLVM自动向量化移植与优化 被引量:2
1
作者 李嘉楠 韩林 柴赟达 《计算机工程》 CAS CSCD 北大核心 2022年第1期142-148,共7页
作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令... 作为SIMD扩展部件向量化的重要手段,自动向量化已在LLVM编译器中得到实现,但向量长度以及指令集功能的差异,导致国产平台在自动向量化过程中容易错失向量化机会以及向量化后产生倒加速的问题。为使SIMD得到充分应用,结合国产平台的指令集特征完善指令代价信息以提高收益分析精准度,使其在自动向量化后生成后端支持且简洁高效的向量指令。在此基础上,提出一种改进的控制流向量化方法,通过添加指令代价信息提高自动向量化的适配能力,从而形成一套面向国产平台的LLVM自动向量化系统。实验结果表明,相比自动向量化移植前,通过该方法进行移植优化后,SPEC测试的整体性能提升10.8%,TSVC测试集中的加速比提升16%,精准代价指导下的加速比提升42%,控制流向量化下的加速比提升51%。 展开更多
关键词 自动向量化 向量化收益 移植 LLVM编译器 国产平台
下载PDF
分数像素运动矢量代价产生器的VLSI设计 被引量:1
2
作者 王庆春 曹喜信 +1 位作者 何晓燕 魏红雅 《电视技术》 北大核心 2007年第4期15-18,共4页
针对H.264/AVC视频编码器的系统芯片设计,通过分析分数像素运动估计(FME)模块的数据并行度和硬件利用率,探讨了分数像素运动矢量代价产生器的复用结构,再依据FME模块的具体设计约束,提出了可以复用产生1/2像素和1/4像素运动矢量代价的... 针对H.264/AVC视频编码器的系统芯片设计,通过分析分数像素运动估计(FME)模块的数据并行度和硬件利用率,探讨了分数像素运动矢量代价产生器的复用结构,再依据FME模块的具体设计约束,提出了可以复用产生1/2像素和1/4像素运动矢量代价的硬件实现结构,并且在FPGA开发板上进行了分数像素运动矢量代价产生器的设计验证。 展开更多
关键词 H.264/AVC标准 视频编码器 分数像素运动估计 率失真优化 运动矢量代价
下载PDF
MANET路由协议研究
3
作者 肖鑫 戴冠中 汤亮 《科学技术与工程》 2008年第3期648-650,655,共4页
通过分析MANET路由协议的特点和要求,以及现有主流路由协议的特点,提出并设计了一种限容、低开销的先验式距离矢量路由协议。通过改进的抑制计时器机制来避免路由环路,邻居验证机制来消除单向链路,以及延迟触发更新机制来平衡路由收敛... 通过分析MANET路由协议的特点和要求,以及现有主流路由协议的特点,提出并设计了一种限容、低开销的先验式距离矢量路由协议。通过改进的抑制计时器机制来避免路由环路,邻居验证机制来消除单向链路,以及延迟触发更新机制来平衡路由收敛速度与开销。最后分析了此协议的各项性能以及需要解决的问题。 展开更多
关键词 MANET 路由协议 距离矢量 低开销
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部