基于OpenCL的图像重映射算法优化研究被引量：3

Research on Image Remap Algorithm Optimization Based on OpenCL

导出

摘要图像重映射（Remap）算法是典型的图像变化算法。在图像放缩、扭曲、旋转等领域有着广泛的应用。随着图片规模和分辨率的不断提高，对图形映射算法的性能提出了越来越高的要求。本文在充分考虑不同GPU平台硬件体系结构差异的基础上，系统研究了在OpenCL框架下图像映射（Remap）算法在不NGPU平台上的高效实现方式。并从片外内存访存优化，向量化计算，减少动态指令等多个优化角度考察了不同优化方法在不同GPU平台上对性能的影响，提出了在不同GPU平台间实现性能移植的可能性。实验结果表明，优化后的算法在不考虑数据传输时间的前提下，在AMDHD5850GPU上相对于CPU版本取得114．3--491．5倍的加速比，相对于CUDA版本（现有GPU算法的实现）得到1．01～1．86的加速比，在NIVIDIAC2050GPU上相对CPU版苓取得100．7～369．8倍的加速比，相对于CUDA版本得到0．95～1．58的加速比。有效验证了本文提出的优化方法的有效性和胜能可移植性。 As a typical algorithm for image transformation, remap algorithm is widely used in image zooming, warping, rotating and some others. With continuous increase of image＇s scale and resolution, higher performance of graphic mapping algorithm has been more and more demanded. Taking full account of the differences of the hardware architectures on different GPU platforms, it is systematically studied in this paper that how remap algorithm based on OpenCL can run effectively on different GPU platforms. By applying memory access optimization of global memory, vectorization calculation, reducing judgments branch and some other optimization methods, we investigated the effects of different optimization on different platforms and suggested the possibility of realizing cross-platform portability. Experimental results showed that without counting the data transfer time, the speedup-ratio is 114.3-491.5 times for AMD HD5850 GPU to CPU version, and 1.01-1.86 times to CUDA version （with present GPU algorithm）, and for NIVIDIA C2050 GPU, the speedup-ratio is 100.7-369.8 times to CPU and 0.95-1.58 times to CUDA. These well proved the validity and portability of the optimization methods proposed in this paper.

作者吴再龙张云泉龙国平徐建良贾海鹏

机构地区中国海洋大学信息科学与工程学院中国科学院软件研究所并行软件与计算科学实验室中国科学院软件研究所计算机科学国家重点实验室

出处《科研信息化技术与应用》 2013年第1期57-66,共10页 E-science Technology & Application

基金国家自然科学基金资助项目(60303020 40806040) 国家自然科学基金资助重点项目(60533020) 国家自然科学基金青年基金项目(61100072)

关键词 OPENCL 通用计算图像重映射算法跨平台 OpenCL Parallel computing Image remap Cross-platform

分类号 TP316.81 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献12

1Jianbin Fang, Ana Lucia Varbanescu,Henk Sips. AComprehensive Performance Comparison of CUDA andOpneCL [C]. International Conference Parallel Processing,2011,216-225. 被引量：1
2OpenCV Wiki. http://opencv.willowgarage.com/wiki/,2012. 被引量：1
3袁凤刚,刘建成.不同插值方法实现数字图像旋转研究[J].软件导刊,2010,9(4):187-189. 被引量：8
4Khronos OpenCL Working Group. The OpenCLSpecification Version: 1.2. 被引量：1
5颜深根,张云泉,龙国平,李炎.基于OpenCL的归约算法优化.软件学报,2011, 22(2): 163-171. 被引量：1
6Herve CHEVANNE Dr. Ing. AMD. A Methodology ForOptimizing Data Transfer in OpenCL. 2011. 被引量：1
7AMD Accelerated Parallel Processing OpenCL, 2012. 被引量：1
8Haipeng Jia, Yunquan Zhang, Guoping Long, JianliangXu, Shengen. GPURoofline: A Model for GuidingPerformance Optimizations on GPUs. In proceedingof International European Conference on Parallel andDistributed Computing (EURO-PAR). Rhodes Island,Greece, 2012. 被引量：1
9贾海鹏,张云泉,龙国平,徐建良,李焱.基于OpenCL的拉普拉斯图像增强算法优化研究[J].计算机科学,2012,39(5):271-277. 被引量：17
10Haipeng Jia, Yunquan Zhang, Shengen Yan. An InsightfulProgram Performance Tuning Chain for GPU Computing.In proceeding of the 12th International Conference onAlgorithms and Architectures for Parallel Processing(ICA3PP-12). Fukuoka, Japan, 2012. 被引量：1

二级参考文献3

1尤玉虎,周孝宽.数字图像最佳插值算法研究[J].中国空间科学技术,2005,25(3):14-18. 被引量：40
2唐滔,林一松.Jacobi和Laplace算法在GPU平台上的设计与实现[J].计算机工程与科学,2009,31(A01):93-96. 被引量：4
3陈颖,林锦贤,吕暾.LU分解和Laplace算法在GPU上的实现[J].计算机应用,2011,31(3):851-855. 被引量：9

共引文献23

1安静雅,龚捷.Virtools中插值算法的研究与应用[J].电脑知识与技术,2011,7(4):2276-2278.
2康牧,王子须.一种基于移植理论的图像旋转算法[J].计算机工程,2012,38(23):227-230. 被引量：1
3庞旭,张云泉,龙国平,贾海鹏,颜深根.基于OpenCL的均值平移算法在多个众核平台的性能优化研究[J].计算机科学,2013,40(3):79-85. 被引量：1
4蒋丽媛,张云泉,龙国平,贾海鹏.基于OpenCL的连续数据无关访存密集型函数并行与优化研究[J].计算机科学,2013,40(3):111-115. 被引量：1
5康牧,凌凤彩.一种基于新插值方法的图像旋转算法[J].计算机科学,2013,40(5):303-306. 被引量：5
6陈向奎,黄海平,康牧.基于平面和球面插值的图像放大算法[J].河南大学学报（自然科学版）,2013,43(3):320-323. 被引量：1
7马歌.基于Canny算子和Radon变换的证件图像倾斜校正[J].中国新技术新产品,2014(15):14-15. 被引量：5
8赵成龙,施慧彬,俞忻峰.基于OpenCL的Lammps短程力算法优化研究[J].计算机工程与科学,2015,37(9):1614-1620. 被引量：1
9刘磊,王燕燕,申春,李玉祥,刘雷.Bellman-Ford算法性能可移植的GPU并行优化[J].吉林大学学报（工学版）,2015,45(5):1559-1564. 被引量：7
10汪方良,施慧彬.基于OpenCL的人脸识别与隐藏系统[J].计算机与现代化,2016(1):16-19. 被引量：1

同被引文献13

1贺俊吉,张广军,杨宪铭.基于交比不变性的镜头畸变参数标定方法[J].仪器仪表学报,2004,25(5):597-599. 被引量：53
2孙亦南,刘伟军,王越超.基于几何不变量的图像特征识别[J].计算机应用与软件,2004,21(12):1-3. 被引量：7
3张维勇,王征,翟鸣,李劲,刘可.基于射影不变量的摄像机自标定方法[J].中国图象图形学报,2005,10(11):1432-1435. 被引量：7
4李世航,胡茂林.基于射影不变量的三维重构[J].计算机技术与发展,2006,16(4):110-112. 被引量：1
5王志国,王贵锦,施陈博,苗权,林行刚.积分图像的快速GPU计算[J].计算机应用研究,2011,28(10):3913-3916. 被引量：7
6张樱,张云泉,龙国平.基于OpenCL的图像模糊化算法优化研究[J].计算机科学,2012,39(3):260-264. 被引量：6
7李岩.机械装配过程自动化浅析[J].中国新技术新产品,2012(11):109-109. 被引量：6
8张铁,邵明,王卫民.机器人装配系统的精度分析[J].机械设计,2000,17(5):12-15. 被引量：5
9贾海鹏,张云泉,徐建良.基于OpenCL的图像积分图算法优化研究[J].计算机科学,2013,40(2):1-7. 被引量：6
10吴刚,杨敬安,李道伦.基于目标不变量的识别方法研究[J].计算机科学,2000,27(12):81-85. 被引量：2

引证文献3

1吴再龙,张云泉,徐建良,贾海鹏,颜深根,解庆春.基于OpenCL的Kmeans算法的优化研究[J].计算机科学与探索,2014,8(10):1162-1176. 被引量：4
2蒋睿,张素文,汪创.基于智能手机平台的积分图像并行算法优化与实现[J].电子技术与软件工程,2018(14):61-62. 被引量：1
3徐智涵,袁道成,李璐璐.基于双目图像融合的孔轴配合间隙监视[J].计算机技术与发展,2021,31(8):169-175. 被引量：1

二级引证文献6

1尹晓丽.重心随机漂移KMeans聚类算法的设计[J].长春大学学报,2017,27(8):35-38. 被引量：2
2朱泽民,俞芳芳,董蓉,李勃.一种基于Faster-RCNN的工业产品清点算法[J].现代制造工程,2018(7):124-128.
3童雪东,任明武.一种基于改进的YOLOv3的敏感目标检测方法[J].计算机与数字工程,2021,49(12):2585-2588. 被引量：1
4吴再龙,王利明,徐震,李宏佳,杨婧.GPU虚拟化技术及其安全问题综述[J].信息安全学报,2022,7(2):30-58. 被引量：3
5刘凌飞,袁道成,张连新.用于测量孔轴装配参数的双目视觉方法[J].激光与光电子学进展,2023,60(16):267-274. 被引量：1
6程子豪,裴玉瑶,周义祥,张文东,王常青,周璇,王艳玲,吴茜.基于强度和图像梯度的瞳孔中心定位[J].贵州大学学报（自然科学版）,2024,41(4):64-69.

1邹丹萍,陈炜浩.CUDA平台下B显显示处理实现方法[J].江苏科技信息,2015,32(20):73-74.
2严国清,熊建设,石雷,宋柱芹.在不支持Remap的系统中构建JFFS2[J].微型机与应用,2005,24(11):65-67.
3马群利.基于ARM处理器的内存Remap机制研究[J].绍兴文理学院学报（自然科学版）,2006,26(2):59-63. 被引量：1
4肖汉,马歌,周清雷.面向OpenCL架构的Harris角点检测算法[J].计算机科学,2014,41(7):306-309. 被引量：7
5Sunny.擦亮慧眼看清Intel CPU[J].电子制作．电脑维护与应用,2004(9):59-59.
6熊英,罗琼.基于OpenCL的NDVI算法的并行化实现[J].电脑开发与应用,2013,26(11):77-78. 被引量：2
7蒋丽媛,张云泉,龙国平,贾海鹏.基于OpenCL的连续数据无关访存密集型函数并行与优化研究[J].计算机科学,2013,40(3):111-115. 被引量：1
8卞亚涛,赵旭,宋健,刘允才.并行化退火粒子滤波[J].吉林大学学报（工学版）,2013,43(S1):239-243.
9范凯.InvokedDynamic Day Java通向通用语言运行平台之路[J].程序员,2008(10):20-20.
10郑新,刘玮,吕辰雷,郭平.海量地形实时动态存储与绘制的GPU实现算法[J].计算机辅助设计与图形学学报,2013,25(8):1146-1152. 被引量：5

科研信息化技术与应用

2013年第1期

浏览历史

内容加载中请稍等...

基于OpenCL的图像重映射算法优化研究被引量：3

参考文献12

二级参考文献3

共引文献23

同被引文献13

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的图像重映射算法优化研究 被引量：3

参考文献12

二级参考文献3

共引文献23

同被引文献13

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于OpenCL的图像重映射算法优化研究被引量：3