期刊文献+
共找到232篇文章
< 1 2 12 >
每页显示 20 50 100
地震叠前时间偏移的一种图形处理器提速实现方法 被引量:74
1
作者 李博 刘国峰 刘洪 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2009年第1期245-252,共8页
新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技... 新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技术在石油工业中的应用研究正在有效开展.本文仅借助于油气勘探中广泛使用的叠前时间偏移,旨在于扼要阐明其基于GPU应用的有效性;文中还提出一种利用GPU实现地震叠前时间偏移的软件构件方法,并针对非对称走时叠前时间偏移所拓展的应用软件提供一种具体实现架构.与以往用个人计算机(PC,Personal Computer)或者PC集群所用的叠前时间偏移相比,本文方法可甚大地提高计算效率,从而在石油物探资料处理中可显著地节约计算成本和维护费用.文中实际例证也表明,基于GPU进行高性能并行计算,当是适应目前石油工业中大规模计算需求的一个重要发展途径. 展开更多
关键词 非对称走时叠前时间偏移 图形处理器 gpu通用计算 统一计算设备架构
下载PDF
基于GPU和Kinect的快速物体重建 被引量:49
2
作者 刘鑫 许华荣 胡占义 《自动化学报》 EI CSCD 北大核心 2012年第8期1288-1297,共10页
便宜的物体快速三维建模技术是当前计算机视觉领域重要的研究课题.给出了一种基于Kinect传感器的快速物体重建方法,以及基于该方法的一种图形处理器(Graphic processing unit,GPU)原型系统实现.本文方法主要分为两步:1)系统的初始标定;2... 便宜的物体快速三维建模技术是当前计算机视觉领域重要的研究课题.给出了一种基于Kinect传感器的快速物体重建方法,以及基于该方法的一种图形处理器(Graphic processing unit,GPU)原型系统实现.本文方法主要分为两步:1)系统的初始标定;2)全自动的物体重建.对于系统初始标定,提出了一种简单易用的粗标定方法;对于物体重建,提出一种全自动的快速物体重建方法.本文方法鲁棒性高,在出现点云配准错误时仍然能够稳定地得到较理想的重建模型.针对环闭合(Loop-closure)问题,提出了一种全局的点云配准方法.对几类物体的重建实验结果表明,本文方法方便实用,且能得到较好的重建效果.此外,本文还探索了有遮挡物体的重建问题.将本文方法应用于有遮挡物体的重建,也取得了较好的重建效果. 展开更多
关键词 三维物体建模 图形处理器 KINECT 遮挡问题 环闭合
下载PDF
三维逆时偏移GPU/CPU机群实现方案研究 被引量:36
3
作者 刘守伟 王华忠 +1 位作者 陈生昌 孔祥宁 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2013年第10期3487-3496,共10页
叠前逆时偏移是当前最为准确的地震成像方法,由于计算量大、存储量大等原因需要合适的实现策略和高效的计算平台.本文以高阶有限差分逆时偏移为基础,重点讨论了在GPU上实现需要解决的显存不足问题和人工边界问题.利用区域分解技术可以... 叠前逆时偏移是当前最为准确的地震成像方法,由于计算量大、存储量大等原因需要合适的实现策略和高效的计算平台.本文以高阶有限差分逆时偏移为基础,重点讨论了在GPU上实现需要解决的显存不足问题和人工边界问题.利用区域分解技术可以在当前GPU上高效地实现任意生产规模的三维逆时偏移成像,不会受到GPU显存规模的制约.常规最佳匹配层边界条件边界区域控制方程与内部区域差异较大,不适于GPU高速运算.本文在GPU上实现近似最佳匹配层(NPML)边界条件,使得高阶有限差分计算不需要分支判断,边界区域辅助波场的存储量也较低,保证了在GPU上进行波场传播的高效性.三维理论数据和实际资料成像结果表明了本文方法的正确性. 展开更多
关键词 逆时偏移 图形处理器 区域分解 近似最佳匹配层
下载PDF
Multi-scale HPC system for multi-scale discrete simulation—Development and application of a supercomputer with 1 Petaflops peak performance in single precision 被引量:19
4
作者 Feiguo Chen Wei Ge Li Guo Xianfeng He Bo Li Jinghai Li Xipeng Li Xiaowei Wang Xiaolong Yuan 《Particuology》 SCIE EI CAS CSCD 2009年第4期332-335,共4页
A supercomputer with 1.0 Petaflops peak performance in single precision, designed and established by Institute of Process Engineering, Chinese Academy of Sciences, is introduced in this brief communication. A designin... A supercomputer with 1.0 Petaflops peak performance in single precision, designed and established by Institute of Process Engineering, Chinese Academy of Sciences, is introduced in this brief communication. A designing philosophy utilizing the similarity between hardware, software and the problems to be solved is embodied, based on the multi-scale method and discrete simulation approaches developed at Institute of Process Engineering (IPE) and implemented in a graphic processing unit (GPU)-based hybrid computing mode. The preliminary applications of this machine in areas of multi-phase flow, molecular dynamics and so on are reported, demonstrating the supercomputer as a paradigm of green computation in new architecture. 展开更多
关键词 High-performance computing (HPC) graphic processing unit gpu Lattice Boltzmann method Molecular dynamics Multi-phase flow Multi-scale method Particle method
原文传递
基于NVIDIA GPU的机载SAR实时成像处理算法CUDA设计与实现 被引量:17
5
作者 孟大地 胡玉新 +2 位作者 石涛 孙蕊 李晓波 《雷达学报(中英文)》 CSCD 2013年第4期481-491,共11页
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SA... 合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR成像处理算法实现方案。该方案解决了GPU显存不足以容纳一景SAR数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C和INTEL E5645上的测试表明,与传统基于GPU的SAR成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。 展开更多
关键词 SAR 实时成像 图形处理器(gpu) 通用并行计算架构(CUDA)
下载PDF
基于道路树分层的大电网潮流并行算法及其GPU优化实现 被引量:18
6
作者 陈德扬 李亚楼 +1 位作者 江涵 徐得超 《电力系统自动化》 EI CSCD 北大核心 2014年第22期63-69,共7页
针对大规模电网分析及能量管理系统对快速潮流计算的需求,提出了一种适于图形处理器(GPU)的基于道路树分层的稀疏矩阵直接分解算法,并结合该算法在GPU上实现了基于牛顿—拉夫逊法的潮流计算。为提高基于GPU的计算效率,首先在GPU上实现... 针对大规模电网分析及能量管理系统对快速潮流计算的需求,提出了一种适于图形处理器(GPU)的基于道路树分层的稀疏矩阵直接分解算法,并结合该算法在GPU上实现了基于牛顿—拉夫逊法的潮流计算。为提高基于GPU的计算效率,首先在GPU上实现了潮流方程式右端项生成、雅可比矩阵生成、LU分解以及前推回代求解,减少了CPU和GPU之间的数据传输时间。其次,针对GPU中寄存器—缓存—显存多级存储架构,改进数据存储方式,减少了读取延迟。进一步,考虑GPU线程组织特点,优化任务分配,增加了计算并行度。最后,对比基于CPU的电力系统分析综合程序(PSASP)潮流计算模块,进行了数值仿真测试。结果表明,随着节点数的增加,所提出的程序计算优势越来越显著,算例规模达到43 602个节点时可获得5.172倍的加速比,验证了算法的有效性和实用性。 展开更多
关键词 潮流计算 并行计算 图形处理器 稀疏线性方程组 道路树
下载PDF
基于GPU的串匹配算法研究 被引量:15
7
作者 张庆丹 戴正华 +1 位作者 冯圣中 孙凝晖 《计算机应用》 CSCD 北大核心 2006年第7期1735-1737,共3页
BF算法是串匹配算法中最基础的算法,但它是串行算法,不适合图形处理器(GraphicProcessing Unit,GPU)的体系结构。结合GPU的特殊体系结构,通过数据存取方式和计算策略的改进,充分利用了GPU的并行处理能力,从而基于GPU实现了BF算法。实验... BF算法是串匹配算法中最基础的算法,但它是串行算法,不适合图形处理器(GraphicProcessing Unit,GPU)的体系结构。结合GPU的特殊体系结构,通过数据存取方式和计算策略的改进,充分利用了GPU的并行处理能力,从而基于GPU实现了BF算法。实验结果表明基于GPU的并行算法能够取得较好的加速比,同时也给出了在现有GPU架构上有效实现通用计算的瓶颈。 展开更多
关键词 图形处理器 通用计算 串匹配 并行
下载PDF
基于GPU的MD5高速解密算法的实现 被引量:14
8
作者 乐德广 常晋义 +1 位作者 刘祥南 郭东辉 《计算机工程》 CAS CSCD 北大核心 2010年第11期154-155,158,共3页
MD5快速碰撞算法由于不支持逆向过程而无法在MD5密码攻击中得到实际应用。针对上述问题,通过分析基于图形处理单元(GPU)的MD5密码并行攻击算法原理,设计基于GPU的MD5高速解密算法,在此基础上实现一个MD5高速密码攻击系统。测试结果证明... MD5快速碰撞算法由于不支持逆向过程而无法在MD5密码攻击中得到实际应用。针对上述问题,通过分析基于图形处理单元(GPU)的MD5密码并行攻击算法原理,设计基于GPU的MD5高速解密算法,在此基础上实现一个MD5高速密码攻击系统。测试结果证明,该算法能有效加快MD5密码破解速度。 展开更多
关键词 MD5算法 密码学 图形处理单元
下载PDF
CUDA架构下的快速图像去噪 被引量:12
9
作者 李军 李艳辉 陈双平 《计算机工程与应用》 CSCD 北大核心 2009年第11期183-185,222,共4页
图像处理通常需要较大的计算量,其中图像去噪是经常使用的一种预处理算法,研究其快速算法具有重要意义。图形处理器具有强大的并行计算能力,但大部分时间处于闲置状态。统一计算设备架构提供了一种简单易用的开发环境,可利用图形处理器... 图像处理通常需要较大的计算量,其中图像去噪是经常使用的一种预处理算法,研究其快速算法具有重要意义。图形处理器具有强大的并行计算能力,但大部分时间处于闲置状态。统一计算设备架构提供了一种简单易用的开发环境,可利用图形处理器进行通用计算。提出了基于统一计算设备架构的快速图像去噪算法,可以利用GPU的计算能力,加快去噪过程,显著地减少计算时间。 展开更多
关键词 图形处理器 图像去噪 统一计算设备架构 并行数据处理
下载PDF
基于GPU的机电暂态仿真细粒度并行算法 被引量:14
10
作者 张宁宇 高山 赵欣 《电力系统自动化》 EI CSCD 北大核心 2012年第9期54-60,共7页
提出一种基于图形处理器(GPU)并采用隐形梯度法的机电暂态仿真细粒度并行算法。该算法将整个系统分为发电机节点系统和非发电机节点系统,对发电机节点系统求解时,先将在网络中直接相连的发电机节点合并成一个子系统,然后在GPU中给每个... 提出一种基于图形处理器(GPU)并采用隐形梯度法的机电暂态仿真细粒度并行算法。该算法将整个系统分为发电机节点系统和非发电机节点系统,对发电机节点系统求解时,先将在网络中直接相连的发电机节点合并成一个子系统,然后在GPU中给每个子系统分配相应线程块进行并行求解,其中采用了LU并行分解来求解线性方程组。求解完成后,利用从发电机节点系统传递来的LU分解信息,再对非发电机节点系统使用GPU进行求解。通过对不同规模的算例进行分析表明:所提出的GPU并行算法的计算结果与CPU串行算法和BPA软件的计算结果大致相同,且随着系统规模的增加,GPU并行算法的加速效果更为明显。 展开更多
关键词 机电暂态仿真 图形处理器 隐式梯度法 LU分解 并行算法
下载PDF
海量遥感数据的高性能地学计算应用与发展分析 被引量:14
11
作者 杨海平 沈占锋 +1 位作者 骆剑承 吴炜 《地球信息科学学报》 CSCD 北大核心 2013年第1期128-136,共9页
航空及航天遥感器的快速发展,使得多源、多时空分辨率的遥感数据成TB级增长,对海量遥感数据的高性能计算与处理提出了更高的要求。据此,当前的遥感应用已经吸收了新型硬件架构计算、集群计算和分布式计算等高性能计算领域的最新技术。... 航空及航天遥感器的快速发展,使得多源、多时空分辨率的遥感数据成TB级增长,对海量遥感数据的高性能计算与处理提出了更高的要求。据此,当前的遥感应用已经吸收了新型硬件架构计算、集群计算和分布式计算等高性能计算领域的最新技术。本文针对高性能计算处理海量遥感数据的效率问题,分别从分布式并行遥感文件系统和高性能遥感地学计算模式两个方面来论述该问题的研究进展;在此基础上,列举了当前具有代表性的集群和分布式遥感计算平台/系统,并结合具体实验工作,详细阐述了遥感高性能计算平台gDos-IPM(Geospatial Data Operation System-Image Processing Machine)的设计思路;最后总结了高性能遥感地学计算的发展趋势。 展开更多
关键词 并行文件系统 多核 图形处理器 集群 分布式计算
原文传递
GPU加速的图像匹配技术 被引量:12
12
作者 厉旭杰 《计算机工程与应用》 CSCD 2012年第2期173-176,共4页
传统的模板图像匹配算法,匹配速度较慢。应用GPU通用高性能编程技术实现了一种加速图像匹配算法的新方法。应用CUDA编程技术对图像匹配算法进行并行化改造。采用了四种不同的存储方案,在第四种存储方案中获得了43.5倍的加速比,并对四种... 传统的模板图像匹配算法,匹配速度较慢。应用GPU通用高性能编程技术实现了一种加速图像匹配算法的新方法。应用CUDA编程技术对图像匹配算法进行并行化改造。采用了四种不同的存储方案,在第四种存储方案中获得了43.5倍的加速比,并对四种不同的存储方案的性能进行了深入研究。 展开更多
关键词 图像匹配 存储模型 图形处理器(gpu) 并行计算
下载PDF
GPU加速的八叉树体绘制算法 被引量:8
13
作者 苏超轼 赵明昌 张向文 《计算机应用》 CSCD 北大核心 2008年第5期1232-1235,1239,共5页
提出一种针对物体空间为序体绘制的空域跳过算法:采用双层次空间跳过,先以规则的数据分块作粗略地跳过,再以八叉树获得更高粒度的优化。该方法进一步解决了超过可用纹理内存容量的大规模体数据实时绘制问题,允许实时改变传递函数。针对... 提出一种针对物体空间为序体绘制的空域跳过算法:采用双层次空间跳过,先以规则的数据分块作粗略地跳过,再以八叉树获得更高粒度的优化。该方法进一步解决了超过可用纹理内存容量的大规模体数据实时绘制问题,允许实时改变传递函数。针对该算法引入的CPU高负载瓶颈,提出一种新算法,在图形处理器(GPU)内快速计算采样面片,平衡了CPU与GPU间的运算负载。结合上述两种算法,实现高效的大规模体数据绘制并无损图像质量。 展开更多
关键词 体绘制 纹理采样面 立方体-面片求交 层次化绘制 图形处理器
下载PDF
基于多GPU的Harris角点检测并行算法 被引量:13
14
作者 肖汉 周清雷 张祖勋 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2012年第7期876-881,共6页
提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共... 提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在统一计算设备架构(com-pute unified device archetecture,CUDA)上完成影像角点检测的全过程。实验结果表明,基于多GPU的Har-ris角点检测并行算法比CPU上的串行算法可获得最高达60倍的加速比,其执行效率明显提高,对于大规模数据处理呈现出良好的实时处理能力。 展开更多
关键词 图形处理器 统一计算设备架构 单指令多线程 角点检测 HARRIS算子
原文传递
面向CPU+GPU异构计算的SIFT特征匹配并行算法 被引量:11
15
作者 肖汉 郭运宏 周清雷 《同济大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第11期1732-1737,共6页
依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给... 依据图形处理器(GPU)计算特点和任务划分的特点,提出主从模型的CPU+GPU异构计算的处理模式.通过分析和定义问题中的并行化数据结构,描述计算任务到统一计算设备架构(CUDA)的映射机制,把问题或算法划分成多个子任务,并对划分的子任务给出合理的调度算法.结果表明,在GeForce GTX 285上实现的尺度不变特征变换(SIFT)并行算法相比CPU上的串行算法速度提升了近30倍. 展开更多
关键词 遥感影像 特征匹配 图形处理器(gpu) 统一计算设备架构(CUDA) 尺度不变特征变换(SIFT)
下载PDF
基于GPU并行算法的水动力数学模型建立及其效率分析 被引量:11
16
作者 赵旭东 梁书秀 +3 位作者 孙昭晨 刘忠波 韩松林 任喜峰 《大连理工大学学报》 EI CAS CSCD 北大核心 2014年第2期204-209,共6页
应用非结构化网格建立水动力模型目前已经得到了广泛的应用.针对在网格数过多,且无集群机情况下难以快速获得计算结果这一问题,基于GPU的高性能计算技术,在CUDA开发平台下设计并行算法,建立非结构化网格的二维水动力模型.与利用GTX460... 应用非结构化网格建立水动力模型目前已经得到了广泛的应用.针对在网格数过多,且无集群机情况下难以快速获得计算结果这一问题,基于GPU的高性能计算技术,在CUDA开发平台下设计并行算法,建立非结构化网格的二维水动力模型.与利用GTX460显卡和集群机的计算效率对比表明,在保持计算精度的前提下,速度提升了一个量级,且随着网格数的持续递增,可以保持较高的加速比增幅,比较适合应用于大范围海域的水动力模型的数值计算. 展开更多
关键词 gpu 非结构化网格 水动力模型
下载PDF
基于TOF相机的喷涂工件在线三维重建 被引量:12
17
作者 雷禧生 肖昌炎 蒋仕龙 《电子测量与仪器学报》 CSCD 北大核心 2017年第12期1991-1998,共8页
喷涂生产线轨迹规划和喷涂机器人自编程技术大都以工件的在线三维测量为基础。近年来TOF相机作为一种高性价比的3D成像设备,被应用于工件测量。针对TOF相机成像视场有限、单次成像只能获取局部轮廓深度信息等问题,提出一种基于工件在位... 喷涂生产线轨迹规划和喷涂机器人自编程技术大都以工件的在线三维测量为基础。近年来TOF相机作为一种高性价比的3D成像设备,被应用于工件测量。针对TOF相机成像视场有限、单次成像只能获取局部轮廓深度信息等问题,提出一种基于工件在位旋转和图形处理器(GPU)加速的TOF点云视频流三维重建算法。该方法在有向距离函数(SDF)点云融合基础上,采用空间散列表存储管理海量点云数据,同时引入快速视觉里程(FOVIS)算法用于姿态估计,以提高喷涂工件在位三维重建算法的效率和鲁棒性。喷涂生产线仿真平台实验表明,在线重建过程中平均帧数可达58 f/s,失败率≤2%,显存占用率25%,为随后的三维测量和喷涂轨迹规划提供完整的点云数据。 展开更多
关键词 喷涂机器人 TOF相机 三维重建 图形处理器
下载PDF
基于CUDA的双三次B样条缩放方法 被引量:8
18
作者 桂叶晨 冯前进 +1 位作者 刘磊 陈武凡 《计算机工程与应用》 CSCD 北大核心 2009年第1期183-185,194,共4页
Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计... Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计思想和编程方式,改进了基于双三次B样条曲面的图像缩放算法,使用多个线程将计算中耗时的B样条重采样部分改造成SIMD模式,并分别采用CUDA中全局存储器和共享存储器策略在CUDA上完成图像缩放的全过程。实验结果表明,基于CUDA的B样条曲面并行插值方法成功实现了硬件加速,相对于CPU上运行的B样条缩放算法,其执行效率明显提高,易于扩展,对于大规模数据处理呈现出良好的实时处理能力。 展开更多
关键词 双三次B样条 统一计算设备架构(CUDA) 图形处理器(gpu) 图像缩放 重采样
下载PDF
基于GPU的粒子滤波并行算法 被引量:11
19
作者 孙伟平 向杰 +1 位作者 陈加忠 余胜生 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第5期63-66,共4页
针对粒子滤波跟踪算法计算量较大,需要在跟踪准确性与计算效率之间做出妥协的问题,分析了粒子滤波算法的并行性,提出了基于图像处理单元(GPU)平台的粒子滤波并行算法.将传统粒子滤波算法与GPU有效结合起来,充分利用GPU并行运算的性能,... 针对粒子滤波跟踪算法计算量较大,需要在跟踪准确性与计算效率之间做出妥协的问题,分析了粒子滤波算法的并行性,提出了基于图像处理单元(GPU)平台的粒子滤波并行算法.将传统粒子滤波算法与GPU有效结合起来,充分利用GPU并行运算的性能,加快粒子滤波算法的计算速度.对所提出算法的计算性能与普通串行算法进行了对比,实验结果表明该算法在不降低跟踪准确性的同时,平均每帧处理时间显著减少. 展开更多
关键词 目标跟踪 粒子滤波 并行算法 图像处理单元 颜色模型
原文传递
基于GPU的后向投影SAR成像算法 被引量:11
20
作者 姜晓龙 王建 +1 位作者 宋千 周智敏 《雷达科学与技术》 2014年第4期350-357,共8页
后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,... 后向投影(BP)是一种精确的时域合成孔径雷达(SAR)成像算法,但是其巨大的运算量很难满足实时成像的要求,图形处理器(GPU)具有强大的浮点运算和高度的并行处理能力,为BP算法的实时成像提供了一个很好的平台。提出基于GPU的并行化BP算法,利用了四种优化方法对并行化BP算法进行加速,并且针对共享存储器的bank冲突问题提出了相应的解决方法,减少了共享存储器访问时间。最后给出仿真数据的成像结果,结果表明,与传统的基于CPU单线程的BP算法相比,成像速度可达到70倍以上的提升。 展开更多
关键词 后向投影 图形处理器 并行化 优化方法
下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部