二维FFT在GPU上的并行实现被引量：1

Parallel Implementation of 2D FFT on a Graphics Processing Unit

下载PDF

导出

摘要 FFT算法是高度并行的分治算法,因此适合在GPU(Graphics Processing Unit,图形处理器)的CUDA(Compute Unified Device Architecture,计算统一设备体系结构)构架上实现.阐述了GPU用于通用计算的原理和方法,并在Geforce8800 GT平台上完成了二维卷积FFT的运算实验.实验结果表明,随着图像尺寸的增加,CPU和GPU上的运算量和运算时间大幅度增加,GPU上运算的速度提高倍数也随之增加,平均提升20倍左右. The fact that FFT is a highly paralleled divide-and-conquer algorithm determines that it can be applied to compute unified dovice architecture （CUDA） of graphics processing unit （GPU）. This paper deals with the principle and method of applying GPU to general purpose computation. And the algorithm of 2D FFT was simulated on the platform of Geforce8800 GT. The results indicate that with the increase of image size, the calculation and calculating time of CPU and GPU increase significantly and the calculating speed increases by 20 times on the average.

作者陈瑞童莹

机构地区南京工程学院通信工程学院

出处《南京工程学院学报（自然科学版）》 2009年第2期41-45,共5页 Journal of Nanjing Institute of Technology(Natural Science Edition)

基金南京工程学院科研基金项目(KXJ07014)

关键词图形处理器计算统一设备体系结构通用计算二维FFT graphics processing unit computer unified device architecture general purpose computation 2D FFT

分类号 TP302 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献8

1MACEDONIA M.The GPU enters computing's mainstream[J].IEEE Computer,2003,36(10):106-108. 被引量：1
2CUDA Programming Guide Version 2.0[M].NVIDIA Corporation,2008:30-35. 被引量：1
3KRUGER J,WESTERMANN R.Linear algebra operators for GPU implementation of numerical algorithms[J].ACM Trans on Graphics,2003,22 (3):908-916. 被引量：1
4HALL J D,CARR N A,HART J C.Cache and bandwidth aware matrix multiplication on the GPU[R].UIUCDCS-R -2003 -2328,Champaign:University of Illinois at Urbana-Champaign,2003. 被引量：1
5MORELAND K,ANGEL E.The FFT on a GPU[C].Proc SIG-GRAPH/EG Conference on Graphics Hardware,2003:78 -81. 被引量：1
6SUMANAWEERA T,DONALD L.Medical image reconstruction with the FFT[C]// RANDIMA F.GPU Gems 2:Programming Techniques for High-performance Graphics and General-purpose Computation.Addison Wesley,2005. 被引量：1
7吴恩华,柳有权.基于图形处理器(GPU)的通用计算[J].计算机辅助设计与图形学学报,2004,16(5):601-612. 被引量：227
8孙世新等编著..并行算法及其应用[M].北京:机械工业出版社,2005:196.

二级参考文献57

1Clark James H.The geometry engine:A VLSI geometry system for graphics[A].In:Computer Graphics Proceedings,Annual Conference Series,ACM SIGGRAPH,Boston,1982.127～133 被引量：1
2Fuchs Herry,Poulton John.Pixel-planes:A VLSI-Oriented design for a raster graphics engine[J].VLSI Design,1981,2(3):20～28 被引量：1
3Eyles John,Austin John,Fuchs Henry,et al.Pixel-plane 4:A summary,advances in computer graphics hardware II[A].Eurographic Seminars Tutorials and Perspectives in Computer Graphics,New York:Springer-Verlag,1988.183～208 被引量：1
4Fuchs Herry,Israel Laura,Poulton John,et al.Pixel-planes 5:A heterogeneous multiprocessor graphics system using processor-enhanced memories[A].In:Computer Graphics Proceedings,Annual Conference Series,ACM SIGGRAPH,Boston,1989.79～88 被引量：1
5http://www.nvidia.com/object/gpu.html[OL] 被引量：1
6http://developer.nvidia.com/[OL] 被引量：1
7http://www.ati.com/developer/[OL] 被引量：1
8http://www.gpgpu.org[OL] 被引量：1
9Joo Luiz Dihl Comba,Dietrich Carlos A,Pagot Christian A,et al.Computation on GPUs:From a programmable pipeline to an efficient stream processor[J].Revista de Informática Teóricae Aplicada,2003,X(2):41～70 被引量：1
10Krüger Jens,Westermann Rüdiger.Linear algebra operators for GPU implementation of numerical algorithms[J].ACM Transactions on Graphics,2003,22(3):908～916 被引量：1

共引文献226

1何红英,尉朝闻.基于逆滤波法的图像复原技术研究[J].西安文理学院学报（自然科学版）,2009,12(3):92-95. 被引量：1
2吴恩华.图形处理器用于通用计算的技术、现状及其挑战[J].软件学报,2004,15(10):1493-1504. 被引量：141
3张杨,诸昌钤,何太军.图形硬件通用计算技术的应用研究[J].计算机应用,2005,25(9):2192-2195. 被引量：6
4梁亮,张定华,毛海鹏,顾娟.一种基于可编程图形硬件的快速三维图像重建算法[J].计算机应用研究,2006,23(1):241-243. 被引量：5
5柳有权,刘学慧,吴恩华.基于GPU带有复杂边界的三维实时流体模拟[J].软件学报,2006,17(3):568-576. 被引量：54
6郝立巍,陈武凡.医学三维动态超声实时体绘制[J].南方医科大学学报,2006,26(3):275-278. 被引量：1
7李笑盈,吴恩华.过程性纹理映射的FPGA动态生成[J].计算机辅助设计与图形学学报,2006,18(5):630-637. 被引量：1
8张庆丹,戴正华,冯圣中,孙凝晖.基于GPU的串匹配算法研究[J].计算机应用,2006,26(7):1735-1737. 被引量：15
9李宏海,肖建海.CPU+GPU技术在非编系统中的应用[J].现代电视技术,2006(6):82-85. 被引量：4
10孔渊,陆虎敏,周坚锋,郭凡.计算机图形系统发展简述[J].航空电子技术,2006,37(2):10-14. 被引量：2

同被引文献7

1辛大红.基于CUDA的图像边缘检测方法[J].杭州电子科技大学学报（自然科学版）,2008,28(5):163-166. 被引量：2
2刘丽,沈杰,李洪林.基于GPU的矩阵求逆性能测试和分析[J].华东理工大学学报（自然科学版）,2010,36(6):812-817. 被引量：10
3赵丽丽,张盛兵,张萌,姚涛.基于CUDA的高速FFT计算[J].计算机应用研究,2011,28(4):1556-1559. 被引量：22
4肖汉,郭运宏,周清雷.面向CPU＋GPU异构计算的SIFT特征匹配并行算法[J].同济大学学报（自然科学版）,2013,41(11):1732-1737. 被引量：11
5闵芳,张志先,张玉洁.虚拟化环境下多GPU并行计算研究[J].微电子学与计算机,2016,33(3):69-75. 被引量：5
6王华龙.CUDA技术在GPU通用计算中的应用[J].科技与创新,2016(10):159-159. 被引量：1
7翟金亭,高希然.CPU+GPU异构体系混合编程模式研究[J].信息记录材料,2016,17(4):31-32. 被引量：2

引证文献1

1姜大闯,潘鸣,俞旭辉,王静,桂小刚,汪瑞,江兆凤,於景暽.基于GPU的振动光纤入侵探测数据预处理算法[J].太赫兹科学与电子信息学报,2019,17(5):898-903. 被引量：1

二级引证文献1

1谢芳.波动状态下通信网络入侵信号提纯方法研究[J].信息通信,2020(5):44-45.

1宋寅卯,卢易枫,袁端磊.基于DSP的二维FFT及其在帘子布疵点检测中的应用[J].电子器件,2007,30(5):1782-1785.
2张健,陈瑞.图形处理器在通用计算中的应用[J].计算机工程与设计,2009,30(14):3359-3361. 被引量：4
3焦良葆,陈瑞.GPU核函数细化研究[J].计算机工程,2010,36(18):10-12. 被引量：3
4庄国瑜.实信号二维FFT的高效算法[J].天津纺织工学院学报,1997,16(2):47-50. 被引量：2
5童星,袁道华.基于GPU和均匀栅格法的光线追踪算法研究[J].计算机工程与设计,2011,32(10):3499-3502. 被引量：4
6李文兵.二维FFT及其在图像处理中的应用[J].软件世界,1996(3):12-16.
7郝源源,张耀,祁小平.基于FPGA的盲图像复原算法[J].兵工自动化,2010,29(9):67-71.
8童莹,张健.基于GPU的快速二维沃尔什变换研究[J].微电子学与计算机,2011,28(1):46-49. 被引量：2
9贺卫东,段哲民,龚诚.基于FPGA的大点数FFT算法研究[J].电子测量技术,2007,30(11):14-16. 被引量：12
10丁海洋,唐英杰,史记,曹阳.基于DSP的频域图形辨别系统[J].北京印刷学院学报,2010,18(2):42-45.

南京工程学院学报（自然科学版）

2009年第2期

浏览历史

内容加载中请稍等...

二维FFT在GPU上的并行实现被引量：1

参考文献8

二级参考文献57

共引文献226

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

二维FFT在GPU上的并行实现 被引量：1

参考文献8

二级参考文献57

共引文献226

同被引文献7

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

二维FFT在GPU上的并行实现被引量：1