期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
基于图形处理器(GPU)的通用计算 被引量:227
1
作者 吴恩华 柳有权 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2004年第5期601-612,共12页
伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年... 伴随着PC级微机的崛起和普及 ,多年来计算机图形的大部分应用发生了从工作站向微机的大转移 ,这种转移甚至发生在像虚拟现实、计算机仿真这样的实时 (中、小规模 )应用中 这一切的发生从很大程度上源自于图形处理硬件的发展和革新 近年来 ,随着图形处理器 (GPU)性能的大幅度提高以及可编程特性的发展 ,人们首先开始将图形流水线的某些处理阶段以及某些图形算法从CPU向GPU转移 除了计算机图形学本身的应用 ,涉及到其他领域的计算 ,以至于通用计算近 2~ 3年来成为GPU的应用之一 ,并成为研究热点 文中从若干图形硬件发展的历史开始 ,介绍和分析最新GPU在通用计算方面的应用及其技术原理和发展状况 。 展开更多
关键词 图形处理器 通用计算 gpu 图形硬件 可编程性 代数运算 性能分析
下载PDF
基于GPU带有复杂边界的三维实时流体模拟 被引量:54
2
作者 柳有权 刘学慧 吴恩华 《软件学报》 EI CSCD 北大核心 2006年第3期568-576,共9页
在GPU(graphicsprocessingunit)上求解了复杂场景中的三维流动问题,充分利用了GPU并行能力以加速计算.与前人的方法不同,该方法对于边界条件的处理更为通用.首先,通过在图像空间生成实心的剖切截面构成整个障碍物信息图,算法使得流体计... 在GPU(graphicsprocessingunit)上求解了复杂场景中的三维流动问题,充分利用了GPU并行能力以加速计算.与前人的方法不同,该方法对于边界条件的处理更为通用.首先,通过在图像空间生成实心的剖切截面构成整个障碍物信息图,算法使得流体计算与整个几何场景的复杂度无关,通过对各体素进行分类并结合边界条件,根据障碍物形成修正因子来修改对应的值;另外,采用更为紧凑的数据格式,以充分利用硬件的并行性.通过将所有标量的运算压缩到纹元的4个颜色通道并结合平铺三维纹理,减少了三维流场计算所需要的绘制次数.实验结果显示出算法的有效性和高效率.该算法可以实时计算并显示一个采用中等规模离散的复杂场景. 展开更多
关键词 图形硬件 gpu 可编程性 纳维-斯托克斯方程组 三维流动模拟 实时
下载PDF
图形处理器通用计算关键技术研究综述 被引量:28
3
作者 王海峰 陈庆奎 《计算机学报》 EI CSCD 北大核心 2013年第4期757-772,共16页
当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依... 当前图形处理器的通用计算取得长足发展,为适应通用计算图形处理器在硬件体系结构和软件支持方面完成相应调整和改变,面对各种应用领域中数据规模增大的趋势,多GPU系统和GPU集群的研究应用日趋增多.以流处理器及图形处理器硬件体系为依据,介绍学术和工业领域中流处理器及图形处理器体系变化趋势.从软件编程环境、硬件计算与通信等方面展开讨论,阐述通用计算中图形处理器的关键问题,包括编程模型及语言的发展和方向,存储模型的量化研究、访存模式和行为的优化以及分布式存储管理的热点问题,典型通信原型系统的对比及通信难点的分析,GPU片内和片间的负载均衡,可靠性和容错计算,GPU功耗评测及低功耗优化的研究进展.综述在海量数据处理、智能计算、复杂网络、集群应用领域中图形处理器的研究进展及成果.总结在通用计算发展中存在的技术问题和未来挑战. 展开更多
关键词 图形处理器 通用计算 可编程性 gpu集群
下载PDF
基于Lattice Boltzmann模型的液-液混合流模拟 被引量:19
4
作者 朱红斌 刘学慧 +1 位作者 柳有权 吴恩华 《计算机学报》 EI CSCD 北大核心 2006年第12期2071-2079,共9页
引入了一种二元Lattice Boltzmann Model(LBM),实现了两种液体组成的混合流的模拟.不同于其它的类似模型,它区分考虑了流体的粘性和扩散特性,可以很容易地模拟各种互溶或者不互溶的混合流现象.此外,由于LBM的运算大都是线性的局部运算,... 引入了一种二元Lattice Boltzmann Model(LBM),实现了两种液体组成的混合流的模拟.不同于其它的类似模型,它区分考虑了流体的粘性和扩散特性,可以很容易地模拟各种互溶或者不互溶的混合流现象.此外,由于LBM的运算大都是线性的局部运算,这使得它很容易在可编程图形处理器(Graphics Process Unit,GPU)上进行加速,从而进行实时模拟.给出了若干二元混合流的模拟结果. 展开更多
关键词 混合流 LATTICE Boltzmann模型 gpu 粘性 扩散
下载PDF
基于块体离散元的高速远程滑坡灾害动力学研究 被引量:19
5
作者 刘广煜 徐文杰 +1 位作者 佟彬 王立朝 《岩石力学与工程学报》 EI CAS CSCD 北大核心 2019年第8期1557-1566,共10页
高速远程滑坡的破裂及致灾机制一直是滑坡灾害难点之一。为了深入高速远程滑坡灾害动力学过程,本文提出一种基于块体离散元法的黏结断裂模型,并基于图形处理器(GPU)实现了高性能并行计算,进而开发了地质体从连续到破裂解体过程的耦合模... 高速远程滑坡的破裂及致灾机制一直是滑坡灾害难点之一。为了深入高速远程滑坡灾害动力学过程,本文提出一种基于块体离散元法的黏结断裂模型,并基于图形处理器(GPU)实现了高性能并行计算,进而开发了地质体从连续到破裂解体过程的耦合模拟平台–耦合离散元程序(CoDEM)。在此基础上以2000年西藏易贡滑坡为例,系统研究了滑坡体的"高位崩塌区崩解启动–老滑坡体复活–碎屑流高速流动–堰塞体形成"的全过程。通过对比数值计算结果和现场地质调查资料,表明计算得到的堆积范围、物质组成与滑坡实际状态较为吻合。根据滑坡不同阶段的运动特征,将滑坡灾害区分为4个部分:启动区、缓冲区、流通区和刹车区。 展开更多
关键词 边坡工程 高速远程滑坡 黏结断裂模型 块体离散元 图形处理器(gpu) 耦合离散元程序(CoDEM)
原文传递
GPU通用计算及其在计算智能领域的应用 被引量:15
6
作者 丁科 谭营 《智能系统学报》 CSCD 北大核心 2015年第1期1-11,共11页
在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU... 在日趋复杂的图形处理任务的推动下,GPU已经演化成为具有众多计算核心、计算能力强大的通用计算设备,并被越来越多地应用于图形处理之外的计算领域。GPU具有高并行、低能耗和低成本的特点,在数据并行度高的计算任务中,相比与传统的CPU平台有着显著的优势。随着GPU体系结构的不断演进以及开发平台的逐步完善,GPU已经进入到高性能计算的主流行列。GPU通用计算的普及,使个人和小型机构能有机会获得以往昂贵的大型、超级计算机才能提供的计算能力,并一定程度上改变了科学计算领域的格局和编程开发模式。GPU提供的强大计算能力极大地推动了计算智能的发展,并且已经在深度学习和群体智能优化方法等子领域获得了巨大的成功,更是在图像、语音等领域取得了突破性的进展。随着人工智能技术和方法的不断进步,GPU将在更多的领域获得更加广泛的应用。 展开更多
关键词 计算智能 群体智能 演化算法 机器学习 深度学习 图形处理器 gpu通用计算 异构计算 高性能计算
下载PDF
图形硬件加速的实时阴影生成方法 被引量:8
7
作者 杨兵 战守义 +1 位作者 李凤霞 郑福仁 《北京理工大学学报》 EI CAS CSCD 北大核心 2005年第7期594-598,共5页
针对虚拟环境中阴影计算时间耗费较大的问题,提出了利用图形硬件特性加速阴影绘制的方法.算法基于图像空间,采用三遍绘制方法.第3遍绘制用于计算物体的真实感光照,并对阴影边界的走样现象进行了处理.利用硬件的图形处理单元GPU的处理能... 针对虚拟环境中阴影计算时间耗费较大的问题,提出了利用图形硬件特性加速阴影绘制的方法.算法基于图像空间,采用三遍绘制方法.第3遍绘制用于计算物体的真实感光照,并对阴影边界的走样现象进行了处理.利用硬件的图形处理单元GPU的处理能力和OpenGL特性扩展,在GPU编程和通用OpenGL实现两个层次上进行了实验,实验结果表明,三遍绘制方法产生的光照和阴影效果更真实,得到的阴影边界更平滑. 展开更多
关键词 视景仿真 阴影算法 实时绘制 图形处理单元(gpu)
下载PDF
视点相关的层次采样:一种硬件加速体光线投射算法(英文) 被引量:9
8
作者 陈为 彭群生 鲍虎军 《软件学报》 EI CSCD 北大核心 2006年第3期587-601,共15页
光线投射是一种高质量的体绘制方法.它以图像空间为序,逐根光线遍历和采样体数据.因此,传统上,它只能在CPU上实现,因而速度慢,交互性不好.提出了一个新的视点相关的层次采样VDLS(viewdependentlayersampling)结构,VDLS将光线上的所有采... 光线投射是一种高质量的体绘制方法.它以图像空间为序,逐根光线遍历和采样体数据.因此,传统上,它只能在CPU上实现,因而速度慢,交互性不好.提出了一个新的视点相关的层次采样VDLS(viewdependentlayersampling)结构,VDLS将光线上的所有采样点重新组织成一系列层,并简化为两个视点相关的几何缓冲器,进而在GPU(graphicsprocessingunit)中用两个动态纹理表示.利用GPU的可编程性,光线投射算法的6个步骤(光线生成、光线遍历、插值、分类、着色和颜色合成)得以完全在GPU中实现.在此基础上,提出两个基于体空间和图像空间连贯性的加速技巧,快速剔除无效的光线.结合其他与渲染和颜色合成有关的技巧,VDLS将面向多边形绘制的图形引擎转化为体光线投射算法引擎,在透视投影方式下,每秒能处理1.5亿个插值、后分类与着色的光线采样点.实验结果表明,提出的方法能用于医学可视化、真实物理现象模拟、材质检测中灰度体数据快速交互的可视化与漫游. 展开更多
关键词 直接体绘制 光线投射 视点相关层次采样 硬件加速 图形处理单元
下载PDF
Heterogeneous parallel computing accelerated iterative subpixel digital image correlation 被引量:11
9
作者 HUANG JianWen ZHANG LingQi +6 位作者 JIANG ZhenYu DONG ShouBin CHEN Wei LIU YiPing LIU ZeJia ZHOU LiCheng TANG LiQun 《Science China(Technological Sciences)》 SCIE EI CAS CSCD 2018年第1期74-85,共12页
Parallel computing techniques have been introduced into digital image correlation(DIC) in recent years and leads to a surge in computation speed. The graphics processing unit(GPU)-based parallel computing demonstrated... Parallel computing techniques have been introduced into digital image correlation(DIC) in recent years and leads to a surge in computation speed. The graphics processing unit(GPU)-based parallel computing demonstrated a surprising effect on accelerating the iterative subpixel DIC, compared with CPU-based parallel computing. In this paper, the performances of the two kinds of parallel computing techniques are compared for the previously proposed path-independent DIC method, in which the initial guess for the inverse compositional Gauss-Newton(IC-GN) algorithm at each point of interest(POI) is estimated through the fast Fourier transform-based cross-correlation(FFT-CC) algorithm. Based on the performance evaluation, a heterogeneous parallel computing(HPC) model is proposed with hybrid mode of parallelisms in order to combine the computing power of GPU and multicore CPU. A scheme of trial computation test is developed to optimize the configuration of the HPC model on a specific computer. The proposed HPC model shows excellent performance on a middle-end desktop computer for real-time subpixel DIC with high resolution of more than 10000 POIs per frame. 展开更多
关键词 digital image correlation(DIC) inverse compositional Gauss-Newton(IC-GN) algorithm heterogeneous parallel computing graphics processing unit(gpu) multicore CPU real-time DIC
原文传递
GPU并行优化技术在水利计算中的应用综述 被引量:11
10
作者 覃金帛 曾志强 +2 位作者 梁藉 杨明祥 张健 《计算机工程与应用》 CSCD 北大核心 2018年第3期23-29,63,共8页
水利计算是水利规划、设计以及运行的基础,提高水利计算的效率对水利信息化和水资源管理具有重要实践意义。通过技术对比发现,GPU(Graphics Processing Unit)并行优化技术是性价比较高的提速策略。系统概述了GPU并行优化技术在水利计算... 水利计算是水利规划、设计以及运行的基础,提高水利计算的效率对水利信息化和水资源管理具有重要实践意义。通过技术对比发现,GPU(Graphics Processing Unit)并行优化技术是性价比较高的提速策略。系统概述了GPU并行优化技术在水利计算中的应用进展;简要介绍了当前应用较多的几种并行技术;建设性提出了该项技术在水库调度、中长期水文预报和水文模型计算中的应用前景和优势;详细总结了应用该项技术的一般方法,为技术推广提供指导。最后从学科发展和应用需求的角度,有针对性的提出了技术应用难点和今后发展趋势,以期为GPU并行优化技术在水利计算中的应用提供借鉴。 展开更多
关键词 水利计算 gpu 并行计算 水动力模拟 智慧水务 深度学习 大数据
下载PDF
基于GPU的层次包围盒快速构造方法 被引量:10
11
作者 杨鑫 王天明 许端清 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2012年第1期84-89,共6页
为了能够在基于光线跟踪技术的真实感图形绘制过程中迅速而高效地排除无效的光线相交计算,快速地构造高质量的加速结构,提出基于图形处理器(GPU)体系架构研究基于图形处理器的层次包围盒快速构造方法.在构造初期、构造中期、构造末期3... 为了能够在基于光线跟踪技术的真实感图形绘制过程中迅速而高效地排除无效的光线相交计算,快速地构造高质量的加速结构,提出基于图形处理器(GPU)体系架构研究基于图形处理器的层次包围盒快速构造方法.在构造初期、构造中期、构造末期3个阶段分别针对二叉树结构特点和多核架构特点来设计不同的策略,从而实现层次包围盒结构(BVH)的并行快速构造.实验表明,采用该方法可以最大限度地发挥图形处理器强大的并行计算能力,有效使用硬件计算资源和存储资源,在保证加速结构构造质量的前提下大大缩短加速结构的构造时间. 展开更多
关键词 光线跟踪 加速结构 层次包围盒(BVH) 图形处理器(gpu)
下载PDF
一种基于GPU的SAR高效成像处理算法 被引量:10
12
作者 孟大地 胡玉新 丁赤飚 《雷达学报(中英文)》 CSCD 2013年第2期210-217,共8页
合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA技术的发展使得GPU能够方便地进行通用计算。该文提出了一种在GPU上进行SAR成像的高效方法。与一般GPU... 合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA技术的发展使得GPU能够方便地进行通用计算。该文提出了一种在GPU上进行SAR成像的高效方法。与一般GPU处理方法相比,该方法使得处理过程中的CPU-GPU往返数据传输由4次减少到1次,而且同时利用了工作站上的CPU与GPU计算资源。实验结果表明,该方法能够带来相对一般GPU处理方法2.3倍的处理效率提升,从而验证了该方法的有效性。 展开更多
关键词 SAR CUDA gpu SAR成像处理
下载PDF
面向指数积分方法的电磁暂态仿真GPU并行算法 被引量:9
13
作者 赵金利 刘君陶 +3 位作者 李鹏 富晓鹏 王成山 宋毅 《电力系统自动化》 EI CSCD 北大核心 2018年第6期113-119,共7页
为满足对大规模可再生能源接入的电力系统进行快速电磁暂态仿真的需求,提出了一种面向指数积分方法的电力系统电磁暂态仿真图形处理器(GPU)并行算法。首先,分析了矩阵指数积分算法求解过程所具有的高度数据并行性,进而将该特性与GPU计... 为满足对大规模可再生能源接入的电力系统进行快速电磁暂态仿真的需求,提出了一种面向指数积分方法的电力系统电磁暂态仿真图形处理器(GPU)并行算法。首先,分析了矩阵指数积分算法求解过程所具有的高度数据并行性,进而将该特性与GPU计算资源相结合;利用GPU处理指数积分方法求解时所需的大规模矩阵运算,而将较为复杂的系统状态判别与更新保留在CPU中完成,有效提升了仿真计算速度。最后,分别针对17台和100台风机的风电场算例进行了测试,验证了所提并行算法的正确性和有效性,同时也说明了算法的加速效果会随着系统规模的增加而愈发明显。 展开更多
关键词 指数积分 电磁暂态仿真 图形处理器(gpu) 并行计算
下载PDF
基于GPU的MATLAB计算与仿真研究 被引量:9
14
作者 王恒 高建瓴 《贵州大学学报(自然科学版)》 2012年第6期95-98,112,共5页
图形处理单元(GPU)已经成为当今的主流计算系统的一个组成部分,现代GPU不仅是一个功能强大的图形引擎,也是一个高度并行的可编程处理器,GPU的峰值运算和内存带宽往往大幅超出其CPU所对应的峰值和内存带宽。本文介绍了基于GPU通用计算框... 图形处理单元(GPU)已经成为当今的主流计算系统的一个组成部分,现代GPU不仅是一个功能强大的图形引擎,也是一个高度并行的可编程处理器,GPU的峰值运算和内存带宽往往大幅超出其CPU所对应的峰值和内存带宽。本文介绍了基于GPU通用计算框架的JACKET加速MATLAB的计算仿真方法,通过FFT算法得出仿真结果,分析在CPU和GPU运行环境下的GFLOPS和加速比,最后得出基于GPU的MATLAB计算仿真程序运行效率在JACKET的加速下大大提高了。 展开更多
关键词 gpu(graphics processing unit) CUDA(Compute UNIFIED DEVICE Architecture) JACKET
下载PDF
图形硬件通用计算技术的应用研究 被引量:6
15
作者 张杨 诸昌钤 何太军 《计算机应用》 CSCD 北大核心 2005年第9期2192-2195,共4页
在通用计算的图形硬件加速研究中,综合了在OPENGL体系下的计算模型。通过实验,测试了该计算结构的性能并分析了提高计算性能的一些方法。在此基础上,介绍一种基于GPU的并行计算二维离散余弦变换方法。该方法可在GPU上通过一遍绘制,对一... 在通用计算的图形硬件加速研究中,综合了在OPENGL体系下的计算模型。通过实验,测试了该计算结构的性能并分析了提高计算性能的一些方法。在此基础上,介绍一种基于GPU的并行计算二维离散余弦变换方法。该方法可在GPU上通过一遍绘制,对一幅图像1至4个颜色通道,同时进行8×8大小像素块的离散余弦变换。实验表明在该实验硬件基础上,采用GPU加速的并行离散余弦变换,可比相同算法的CPU实现提高数百倍。 展开更多
关键词 图形处理器(gpu) 离散余弦变换(DCT) 可编程图形管线 并行计算
下载PDF
基于GPU的实时深度图像前向映射绘制算法 被引量:7
16
作者 刘保权 刘学慧 吴恩华 《软件学报》 EI CSCD 北大核心 2007年第6期1531-1542,共12页
提出一种完全基于GPU(graphics processing unit)的实时深度图像绘制流程.该方法利用GPU的并行计算特性对深度图像的绘制过程进行加速.推导出一种在vertex shader上进行的三维前向映射方法,对输入像素进行前向映射,以得到更高的绘制性能... 提出一种完全基于GPU(graphics processing unit)的实时深度图像绘制流程.该方法利用GPU的并行计算特性对深度图像的绘制过程进行加速.推导出一种在vertex shader上进行的三维前向映射方法,对输入像素进行前向映射,以得到更高的绘制性能,并利用图形硬件流水线的光栅化功能高效地进行图像的插值重构,以得到连续无洞的结果图像.在pixel shader上进行逐像素的光照计算,生成高品质的光照效果.实验表明,该方法可以高速地进行满屏绘制,准确地保留物体轮廓信息和正确的遮挡关系.还实现了基于该方法的实时漫游系统.该系统能够实时地绘制多个基于柱面深度图像表示的对象,并能对其进行视相关的动态LOD(level of detail)操作. 展开更多
关键词 图形硬件 gpu(graphics processing unit) 实时绘制 深度图像 基于图像的绘制 逐像素光照
下载PDF
GPU上两阶段负载调度问题的建模与近似算法 被引量:7
17
作者 孙景昊 邓庆绪 孟亚坤 《软件学报》 EI CSCD 北大核心 2014年第2期298-313,共16页
随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU(graphics processing unit)越来越多地被应用到通用计算领域,并对诸多计算系统(尤其是嵌入式系统)性能的显著提升起到了至关重要的作用.在基于GPU的计算系统中,大规模并行负载同时... 随着硬件功能的不断丰富和软件开发环境的逐渐成熟,GPU(graphics processing unit)越来越多地被应用到通用计算领域,并对诸多计算系统(尤其是嵌入式系统)性能的显著提升起到了至关重要的作用.在基于GPU的计算系统中,大规模并行负载同时进行数据传输和加载的情况时常发生,数据传输延时在系统性能全局最优化中变得不容忽视.综合考虑负载的传输时间和执行时间,以总负载makespan最小化作为系统性能的全局优化目标,研究了GPU上负载"传输-执行"联合调度问题.首先,将负载的时间信息和并行任务数与矩形域的二维空间联系起来,建立了负载的2D双层矩形域模型;然后,将GPU上负载调度问题归结为一类Strip-Packing问题;最后,基于贪婪策略给出了近似度为3的多项式时间近似算法,算法复杂度为O(nlogn).该近似算法的核心是对数据传输阶段进行负载排序调度.这从理论层面上证明了GPU系统采取"传输-执行"两阶段调度的有效性,即,在数据传输阶段采取负载排序调度,在负载执行阶段采取先来先服务(first-come-first-serve,简称FCFS)调度,能够使GPU性能达到全局最优或近似最优. 展开更多
关键词 gpu(graphics processing unit) 数据传输 负载排序 strip-packing 近似算法
下载PDF
GPU加速的交互式医学CT图像区域分割 被引量:7
18
作者 曹小鹏 董梁 《中国图象图形学报》 CSCD 北大核心 2016年第6期815-822,共8页
目的为了解决交互式医学CT图像区域分割问题,本文提出了基于证据推理规则的区域生长算法(ERRG)。方法算法综合考虑了医学图像的灰度直方图,Gabor特征和灰度共生矩阵能量3个重要特征,采用Bhattacharyya系数度量相邻像素的相似程度,用效... 目的为了解决交互式医学CT图像区域分割问题,本文提出了基于证据推理规则的区域生长算法(ERRG)。方法算法综合考虑了医学图像的灰度直方图,Gabor特征和灰度共生矩阵能量3个重要特征,采用Bhattacharyya系数度量相邻像素的相似程度,用效用函数将度量系数合并。针对算法计算效率较低问题,对算法进行并行化,采用GPU进行加速处理。结果本文算法与基于Random-Walk图像分割算法针对医学CT胃部图像,进行对比实验,表明使用本文算法,真阳性目标像素数占目标区域所有正确像素数的比例(TPF)显著提高,背景像素错误地分割为目标像素的数目占背景正确像素数的比例(FPF)显著降低;通过GPU加速后,算法执行效率显著提高,加速比达到12。结论本文算法减少了医学CT图像过分割现象,采用GPU加速后能够实现实时交互式医学CT图像分割。 展开更多
关键词 gpu 医学图像 图像分割 区域生长算法 证据推理规则 并行计算
原文传递
大幅宽SAR图像嵌入式舰船实时检测系统设计 被引量:3
19
作者 陆天宇 徐湛 +2 位作者 崔红元 龚昊 王琤 《计算机工程与应用》 CSCD 北大核心 2024年第1期301-309,共9页
针对星载或机载高分辨率合成孔径雷达(synthetic aperture radar,SAR)实时成像后的大幅宽SAR图像舰船实时检测的应用需求,传统的基于FPGA+DSP的嵌入式系统很难同时实现SAR成像处理和基于人工智能技术的大幅宽SAR图像舰船实时检测,为此... 针对星载或机载高分辨率合成孔径雷达(synthetic aperture radar,SAR)实时成像后的大幅宽SAR图像舰船实时检测的应用需求,传统的基于FPGA+DSP的嵌入式系统很难同时实现SAR成像处理和基于人工智能技术的大幅宽SAR图像舰船实时检测,为此设计了一种基于3U VPX FPGA+GPU架构的大幅宽SAR图像嵌入式舰船实时检测系统;提出了一种基于YOLOv5s的舰船检测模型,采用基于L2-范数稀疏性惩罚的缩放因子控制法进行轻量化,轻量化舰船检测模型的参数量减小了47.39%,计算量减少了18.67%,平均检测精度为0.968;将轻量化舰船检测模型应用于大幅宽SAR图像嵌入式舰船实时检测系统,并针对典型的10 km×10 km的大幅宽图像应用场景,设计开发基于多线程技术和基于GPU的众核并行计算技术的大幅宽SAR图像嵌入式实时检测系统软件;通过公开的SAR数据集进行功能验证和性能评估,该系统能够满足不同分辨率的大幅宽SAR图像舰船实时检测需求。 展开更多
关键词 合成孔径雷达(SAR) YOLOv5s 轻量化 图形处理器(gpu) 实时舰船检测
下载PDF
一种基于可编程图形硬件的快速三维图像重建算法 被引量:5
20
作者 梁亮 张定华 +1 位作者 毛海鹏 顾娟 《计算机应用研究》 CSCD 北大核心 2006年第1期241-243,共3页
针对三维CT图像重建时间过长这一瓶颈问题,给出了FDK算法的几何描述,并据此导出了利用可编程图形硬件加速三维图像重建的方法,最后利用图形处理器的可编程、高精度以及并行计算等特性实现了该方法。实验结果表明,该三维图像重建方法非... 针对三维CT图像重建时间过长这一瓶颈问题,给出了FDK算法的几何描述,并据此导出了利用可编程图形硬件加速三维图像重建的方法,最后利用图形处理器的可编程、高精度以及并行计算等特性实现了该方法。实验结果表明,该三维图像重建方法非常有效,与原始算法相比取得了8倍左右的重建加速比。 展开更多
关键词 三维图像重建 快速重建 图形处理器 FDK算法
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部