期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
面向多簇超长指令字DSP的向量化优化算法 被引量:3
1
作者 徐华叶 郑启龙 +1 位作者 丁陈飞 徐东鹏 《计算机系统应用》 2013年第12期140-143,共4页
BWDSP是一款针对高性能计算领域设计的处理器,采用多簇超长指令字(VLIW)体系结构和SIMD架构,同时也提供了很多向量化指令.然而现有的编译框架无法对这些向量化指令提供支持,因此本文提出了一种向量化优化算法,可以显著提高一些在DSP领... BWDSP是一款针对高性能计算领域设计的处理器,采用多簇超长指令字(VLIW)体系结构和SIMD架构,同时也提供了很多向量化指令.然而现有的编译框架无法对这些向量化指令提供支持,因此本文提出了一种向量化优化算法,可以显著提高一些在DSP领域有着广泛应用的计算密集型程序的性能.最终实验结果表明,该优化算法能够平均取得6.60倍的加速比. 展开更多
关键词 量化优化 编译技术 访存地址分析 多簇体系DSP 超长指令字
下载PDF
基于Intel MIC协处理器的PIC粒子模拟并行化加速及与CPU/GPU对比研究
2
作者 罗跃剑 陈哲 +3 位作者 唐荣欣 刘志伟 钟志宏 周猛 《中国科技论文》 CAS 北大核心 2018年第8期961-966,共6页
基于Intel Many-Integerated-Core(MIC)协处理器平台实现了二维particle-in-cell(PIC)粒子模拟,并根据MIC的特性进行了指令集层面上的向量化优化。为体现MIC平台下的并行加速效果,采用英伟达的GPU计算卡和英特尔Ivy-Bridge架构CPU处理... 基于Intel Many-Integerated-Core(MIC)协处理器平台实现了二维particle-in-cell(PIC)粒子模拟,并根据MIC的特性进行了指令集层面上的向量化优化。为体现MIC平台下的并行加速效果,采用英伟达的GPU计算卡和英特尔Ivy-Bridge架构CPU处理器进行针对性模拟,对3者的计算性能进行比较,当PIC模拟网格较小时,GPU架构具有更好的适用性和计算加速;随着模拟网格逐渐增大,MIC平台的计算加速比逐渐超过GPU平台。研究表明,针对PIC模拟应用,MIC平台具有良好的计算性能、较好的可扩展性和可编程性,利用MIC异构众核对大数据量并行计算程序优化将极大地促进高性能计算的应用和发展。 展开更多
关键词 PIC等离子体模拟 MIC异构并行计算 SIMD指令集量化优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部