期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
一种针对多媒体扩展指令集和实际多媒体程序的自动向量化方法 被引量:3
1
作者 姜伟华 梅超 +3 位作者 郭一 朱嘉华 臧斌宇 朱传琪 《计算机学报》 EI CSCD 北大核心 2005年第8期1255-1266,共12页
自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化... 自动向量化编译是利用处理器的多媒体扩展指令集提升多媒体程序性能的理想工具.但目前的研究不能有效加速实际程序.其主要原因是:普通算术操作的向量化不一定有性能提升;而多媒体典型操作因为其在源代码中表现形式多样而不能充分向量化.为了解决这一问题,文章对经典向量化算法[1]进行改进以灵活统一地向量化这两类操作.主要的改进是增加了两个步骤:统一操作的不同表现形式和识别有价值的向量化操作.改进后的算法可以充分利用指令集生成高效代码,从而对实际多媒体程序拥有良好效果.此外,该算法可扩展性也很强. 展开更多
关键词 自动向量化编译技术 多媒体扩展指令集 多媒体典型操作
下载PDF
多媒体程序中消除控制相关的技术研究 被引量:1
2
作者 张宏江 臧斌宇 朱传琪 《计算机工程与科学》 CSCD 2006年第11期91-95,99,共6页
随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒... 随着多媒体应用的快速发展,最大程度地提升多媒体程序的性能逐渐变为计算机领域研究的热点。硬件平台和多媒体程序的特点是该领域研究需要关注的两个主要方面,当前的主流桌面处理器在提升主频的同时也增大了分支预测失误的开销,而多媒体应用程序中分支语句的大量使用进一步增大了分支预测失误的概率。我们在优化多媒体程序测试包BMW(BerkeleyMultimediaWorkload)过程中发现,通过消除程序中的控制相关,尽量减少程序中的分支指令可以显著地提升程序的性能。本文首先讨论了多媒体程序中消除控制相关的一些基本优化方法。针对当前主流处理器引入多媒体扩展指令集来优化程序的趋势,本文进一步总结了在SIMD架构下使用多媒体扩展指令集消除控制相关的方法。这两方面的优化方法应用到实际程序中,得到的平均性能提升分别为7%和26%。 展开更多
关键词 控制相关 多媒体程序优化 多媒体扩展指令集 分支预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部