期刊文献+
共找到215篇文章
< 1 2 11 >
每页显示 20 50 100
地震叠前时间偏移的一种图形处理器提速实现方法 被引量:73
1
作者 李博 刘国峰 刘洪 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2009年第1期245-252,共8页
新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技... 新近发展的图形处理器(GPU,Graphic Processing Unit)通用计算技术,现已日趋实用成型,并获得诸多应用领域的广泛关注.对油气勘探专项资料处理技术的运用而言,概因GPU与中央处理器(CPU)的计算性能的甚大差异,致使GPU这一通用计算技术在石油工业中的应用研究正在有效开展.本文仅借助于油气勘探中广泛使用的叠前时间偏移,旨在于扼要阐明其基于GPU应用的有效性;文中还提出一种利用GPU实现地震叠前时间偏移的软件构件方法,并针对非对称走时叠前时间偏移所拓展的应用软件提供一种具体实现架构.与以往用个人计算机(PC,Personal Computer)或者PC集群所用的叠前时间偏移相比,本文方法可甚大地提高计算效率,从而在石油物探资料处理中可显著地节约计算成本和维护费用.文中实际例证也表明,基于GPU进行高性能并行计算,当是适应目前石油工业中大规模计算需求的一个重要发展途径. 展开更多
关键词 非对称走时叠前时间偏移 图形处理器 GPU通用计算 统一计算设备架构
下载PDF
基于CUDA的高分辨率数字视频图像配准快速实现 被引量:27
2
作者 闫钧华 杭谊青 +1 位作者 许俊峰 储林臻 《仪器仪表学报》 EI CAS CSCD 北大核心 2014年第2期380-386,共7页
高分辨率数字视频图像数据量巨大,基于SIFT图像配准算法在CPU上实现时用时巨大。针对此,首先对配准算法中3个最耗时的部分:SIFT特征提取;SIFT特征匹配;RANSAC算法提纯匹配点对,求解变换模型参数。对此展开重点研究,研究其并行算法。然... 高分辨率数字视频图像数据量巨大,基于SIFT图像配准算法在CPU上实现时用时巨大。针对此,首先对配准算法中3个最耗时的部分:SIFT特征提取;SIFT特征匹配;RANSAC算法提纯匹配点对,求解变换模型参数。对此展开重点研究,研究其并行算法。然后基于CUDA并行快速实现高分辨率数字视频图像配准。实验结果表明:基于SIFT图像配准算法在CPU与CUDA上实现,在配准效果相近时,在CUDA上实现的处理速度比在CPU上实现的处理速度提高了100多倍,并且随着图像像素数的增加加速比有显著提高。 展开更多
关键词 图像配准 高分辨率 数字视频 cuda
下载PDF
基于GPU的并行优化技术 被引量:23
3
作者 左颢睿 张启衡 +1 位作者 徐勇 赵汝进 《计算机应用研究》 CSCD 北大核心 2009年第11期4115-4118,共4页
针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法... 针对标准并行算法难以在图形处理器(GPU)上高效运行的问题,以累加和算法为例,基于Nvidia公司统一计算设备架构(CUDA)GPU介绍了指令优化、共享缓存冲突避免、解循环优化和线程过载优化四种优化方法。实验结果表明,并行优化能有效提高算法在GPU上的执行效率,优化后累加和算法的运算速度相比标准并行算法提高了约34倍,相比CPU串行实现提高了约70倍。 展开更多
关键词 图形处理器 并行优化 累加和 统一计算设备架构
下载PDF
基于NVIDIA GPU的机载SAR实时成像处理算法CUDA设计与实现 被引量:17
4
作者 孟大地 胡玉新 +2 位作者 石涛 孙蕊 李晓波 《雷达学报(中英文)》 CSCD 2013年第4期481-491,共11页
合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SA... 合成孔径雷达(SAR)成像处理的运算量较大,在基于中央处理器(Central Processing Unit,CPU)的工作站或服务器上一般需要耗费较长的时间,无法满足实时性要求。借助于通用并行计算架构(CUDA)编程架构,该文提出一种基于图形处理器(GPU)的SAR成像处理算法实现方案。该方案解决了GPU显存不足以容纳一景SAR数据时数据处理环节与内存/显存间数据传输环节的并行化问题,并能够支持多GPU设备的并行处理,充分利用了GPU设备的计算资源。在NVIDIA K20C和INTEL E5645上的测试表明,与传统基于GPU的SAR成像处理算法相比,该方案能够达到数十倍的速度提升,显著降低了处理设备的功耗,提高了处理设备的便携性,能够达到每秒约36兆采样点的实时处理速度。 展开更多
关键词 SAR 实时成像 图形处理器(GPU) 通用并行计算架构(cuda)
下载PDF
基于CUDA的尺度不变特征变换快速算法 被引量:14
5
作者 田文 徐帆 +1 位作者 王宏远 周波 《计算机工程》 CAS CSCD 北大核心 2010年第8期219-221,共3页
针对尺度不变特征变换(SIFT)算法耗时多限制其应用范围的缺点,提出一种基于统一计算设备架构(CUDA)的尺度不变特征变换快速算法,分析其并行特性,在图像处理单元(GPU)的线程和内存模型方面对算法进行优化。实验证明,相对于CPU,算法速度... 针对尺度不变特征变换(SIFT)算法耗时多限制其应用范围的缺点,提出一种基于统一计算设备架构(CUDA)的尺度不变特征变换快速算法,分析其并行特性,在图像处理单元(GPU)的线程和内存模型方面对算法进行优化。实验证明,相对于CPU,算法速度提升了30~50倍,对640×480图像的处理速度达到每秒24帧,满足实时应用的需求。 展开更多
关键词 尺度不变特征变换 特征提取与匹配 图像处理单元 统一计算设备架构
下载PDF
CUDA架构下的快速图像去噪 被引量:12
6
作者 李军 李艳辉 陈双平 《计算机工程与应用》 CSCD 北大核心 2009年第11期183-185,222,共4页
图像处理通常需要较大的计算量,其中图像去噪是经常使用的一种预处理算法,研究其快速算法具有重要意义。图形处理器具有强大的并行计算能力,但大部分时间处于闲置状态。统一计算设备架构提供了一种简单易用的开发环境,可利用图形处理器... 图像处理通常需要较大的计算量,其中图像去噪是经常使用的一种预处理算法,研究其快速算法具有重要意义。图形处理器具有强大的并行计算能力,但大部分时间处于闲置状态。统一计算设备架构提供了一种简单易用的开发环境,可利用图形处理器进行通用计算。提出了基于统一计算设备架构的快速图像去噪算法,可以利用GPU的计算能力,加快去噪过程,显著地减少计算时间。 展开更多
关键词 图形处理器 图像去噪 统一计算设备架构 并行数据处理
下载PDF
基于多GPU的Harris角点检测并行算法 被引量:13
7
作者 肖汉 周清雷 张祖勋 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2012年第7期876-881,共6页
提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共... 提出了一种基于多图形处理器(graphic processing unit,GPU)设计思想的Harris角点检测并行算法,使用众多线程将计算中耗时的影像高斯卷积平滑滤波部分改造成单指令多线程(single instruction multi-ple thread,SIMT)模式,并采用GPU中共享存储器、常数存储器和锁页内存机制在统一计算设备架构(com-pute unified device archetecture,CUDA)上完成影像角点检测的全过程。实验结果表明,基于多GPU的Har-ris角点检测并行算法比CPU上的串行算法可获得最高达60倍的加速比,其执行效率明显提高,对于大规模数据处理呈现出良好的实时处理能力。 展开更多
关键词 图形处理器 统一计算设备架构 单指令多线程 角点检测 HARRIS算子
原文传递
基于切片原理的海量点云并行简化算法 被引量:13
8
作者 官亚勤 赵学胜 +1 位作者 王鹏飞 李大朋 《计算机应用》 CSCD 北大核心 2016年第7期1793-1796,共4页
针对传统点云简化算法效率低且处理点数少的缺陷,结合快速成型领域的切片原理顾及特征计算复杂度低的特点,设计并实现了适合千万级海量激光雷达(Li DAR)点云的并行切片简化算法。该算法根据切片原理对点云模型分层并按照角度排序,利用... 针对传统点云简化算法效率低且处理点数少的缺陷,结合快速成型领域的切片原理顾及特征计算复杂度低的特点,设计并实现了适合千万级海量激光雷达(Li DAR)点云的并行切片简化算法。该算法根据切片原理对点云模型分层并按照角度排序,利用NVIDA的统一计算设备架构(CUDA)和可编程图形处理器(GPU)高度并行的性能优势,使用GPU多线程高效并行地执行单层切片点云简化,提高了算法效率。最后,应用3组不同数量级点云模型分别进行简化对比实验。实验结果表明:在保持模型特征与压缩比不变的情况下,所提算法效率高出传统基于CPU的串行切片算法1~2个量级。 展开更多
关键词 海量点云 简化 切片法 计算设备架构 图形处理器 并行计算
下载PDF
一种基于GPU的高效合成孔径雷达信号处理器 被引量:12
9
作者 俞惊雷 柳彬 +2 位作者 王开志 刘兴钊 郁文贤 《信息与电子工程》 2010年第4期415-419,共5页
随着合成孔径雷达(SAR)应用的不断扩展,其所需要处理的数据量也在不断增加,传统的SAR信号处理器的处理速度成为其应用扩展的瓶颈。为了应对这些挑战,需要高效的SAR信号处理器来加快计算速度。文章利用图形处理器(GPU)这一新颖高效的的... 随着合成孔径雷达(SAR)应用的不断扩展,其所需要处理的数据量也在不断增加,传统的SAR信号处理器的处理速度成为其应用扩展的瓶颈。为了应对这些挑战,需要高效的SAR信号处理器来加快计算速度。文章利用图形处理器(GPU)这一新颖高效的的计算平台进行SAR信号处理,利用GPU通用并行计算,使用CUDA实现SAR成像算法,充分发挥其计算能力。实验结果表明,其处理速度是基于CPU的传统SAR信号处理器的10倍以上。它为解决在未来SAR信号处理中可能出现的问题提供了一种可靠的方法。 展开更多
关键词 合成孔径雷达 信号处理器 图形处理器 通用计算 cuda编程模型
下载PDF
CUDA架构下的液晶自适应波面数值解析 被引量:11
10
作者 李大禹 胡立发 +5 位作者 穆全全 曹召良 夏明亮 李抄 刘肇楠 宣丽 《光学精密工程》 EI CAS CSCD 北大核心 2010年第4期848-854,共7页
在GPU通用计算架构下,首次提出了CUDA架构下的液晶自适应光学波面数值解析方法。针对高分辨率液晶自适应光学系统,介绍了液晶自适应光学的波面数值解析算法,论述了CUDA的通用架构;然后,建立了CUDA实现波面数值解析的编程模型,在此模型... 在GPU通用计算架构下,首次提出了CUDA架构下的液晶自适应光学波面数值解析方法。针对高分辨率液晶自适应光学系统,介绍了液晶自适应光学的波面数值解析算法,论述了CUDA的通用架构;然后,建立了CUDA实现波面数值解析的编程模型,在此模型中引入了并行线程的有效利用,全局存储器的高效访问和数据直接回写3种优化方案;最后,给出了GPU与CPU的实验对比结果。结果表明:CUDA计算分辨率为512×512,对35项Zernike多项式的波面数值解析需时不到1ms,计算速度是传统CPU波面数值解析的几十倍。提出的方法减小了系统延时,提高了校正速度,建立波面数值解析CUDA编程模型采用的优化手段可为其它数学计算模型提供参考。 展开更多
关键词 图形处理器(GPU) cuda 液晶 自适应光学 波面解析
下载PDF
基于CUDA的地震数据相干体并行算法 被引量:10
11
作者 吴连贵 易瑜 李肯立 《计算机应用》 CSCD 北大核心 2009年第3期912-914,共3页
在地震探测解释方面,运用相干体技术可以清楚地识别断层和地层特征。由于相干体是通过三维地震数据体计算得到,传统方法难以满足计算需求。基于CUDA平台,提出了一种并行相干体算法,该算法可加速相干体算法中的矩阵相乘计算。理论分析和... 在地震探测解释方面,运用相干体技术可以清楚地识别断层和地层特征。由于相干体是通过三维地震数据体计算得到,传统方法难以满足计算需求。基于CUDA平台,提出了一种并行相干体算法,该算法可加速相干体算法中的矩阵相乘计算。理论分析和配有Intel Core2 Due CPU和NVIDIA GeForce 8800 GT显卡的实验结果表明:基于GPU的并行相干体算法可取得理想的线性加速比,提高系统的计算效率。 展开更多
关键词 统一计算设备架构 图形处理器 相干体技术 地震数据处理 并行处理
下载PDF
几种CUDA加速高斯滤波算法的比较 被引量:11
12
作者 刘进锋 《计算机工程与应用》 CSCD 2013年第23期14-18,30,共6页
目前已有几种CUDA加速的图像高斯滤波算法,但这些算法有的描述不清楚,也没有人对它们的性能进行详尽的比较,这给理解及应用带来了困难。描述了几种CUDA加速的图像高斯滤波算法,包括直观的实现方式、使用共享内存的分离滤波器方法、使用... 目前已有几种CUDA加速的图像高斯滤波算法,但这些算法有的描述不清楚,也没有人对它们的性能进行详尽的比较,这给理解及应用带来了困难。描述了几种CUDA加速的图像高斯滤波算法,包括直观的实现方式、使用共享内存的分离滤波器方法、使用纹理内存的分离滤波器方法、基于CUFFT的卷积滤波以及递归高斯滤波器。强调了这些算法的核心思想,比较了它们的时间复杂度,通过实验对它们的性能进行了分析。 展开更多
关键词 高斯滤波 可分离滤波器 递归高斯滤波器 统一计算设备架构 图形处理器
下载PDF
基于CUDA的双三次B样条缩放方法 被引量:8
13
作者 桂叶晨 冯前进 +1 位作者 刘磊 陈武凡 《计算机工程与应用》 CSCD 北大核心 2009年第1期183-185,194,共4页
Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计... Nvidia在GeForce 8系列显卡上推出的CUDA(统一计算设备架构)技术使GPU通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。研究了CUDA的设计思想和编程方式,改进了基于双三次B样条曲面的图像缩放算法,使用多个线程将计算中耗时的B样条重采样部分改造成SIMD模式,并分别采用CUDA中全局存储器和共享存储器策略在CUDA上完成图像缩放的全过程。实验结果表明,基于CUDA的B样条曲面并行插值方法成功实现了硬件加速,相对于CPU上运行的B样条缩放算法,其执行效率明显提高,易于扩展,对于大规模数据处理呈现出良好的实时处理能力。 展开更多
关键词 双三次B样条 统一计算设备架构(cuda) 图形处理器(GPU) 图像缩放 重采样
下载PDF
一种基于GPU的SAR高效成像处理算法 被引量:10
14
作者 孟大地 胡玉新 丁赤飚 《雷达学报(中英文)》 CSCD 2013年第2期210-217,共8页
合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA技术的发展使得GPU能够方便地进行通用计算。该文提出了一种在GPU上进行SAR成像的高效方法。与一般GPU... 合成孔径雷达(SAR)成像处理是一项需要进行大量计算的处理任务。图形处理器(GPU)具有数十倍于CPU的浮点计算能力以及传输带宽,而CUDA技术的发展使得GPU能够方便地进行通用计算。该文提出了一种在GPU上进行SAR成像的高效方法。与一般GPU处理方法相比,该方法使得处理过程中的CPU-GPU往返数据传输由4次减少到1次,而且同时利用了工作站上的CPU与GPU计算资源。实验结果表明,该方法能够带来相对一般GPU处理方法2.3倍的处理效率提升,从而验证了该方法的有效性。 展开更多
关键词 SAR cuda GPU SAR成像处理
下载PDF
基于GPU的稀疏线性系统的预条件共轭梯度法 被引量:10
15
作者 张健飞 沈德飞 《计算机应用》 CSCD 北大核心 2013年第3期825-829,共5页
研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算... 研究了基于GPU的稀疏线性方程组的预条件共轭梯度法加速求解问题,并基于统一计算设备架构(CUDA)平台编制了程序,在NVIDIAGT430 GPU平台上进行了程序性能测试和分析。稀疏矩阵采用压缩稀疏行(CSR)格式压缩存储,针对预条件共轭梯度法的算法特性,研究了基于GPU的稀疏矩阵与向量相乘的性能优化、数据从CPU端传到GPU端的加速传输措施。将编制的稀疏矩阵与向量相乘的kernel函数和CUSPARSE函数库中的cusparseDcsrmv函数性能进行了对比,最优得到了2.1倍的加速效果。对于整个预条件共轭梯度法,通过自编kernel函数来实现的算法较之采用CUBLAS库和CUSPARSE库实现的算法稍具优势,与CPU端的预条件共轭梯度法相比,最优可以得到7.4倍的加速效果。 展开更多
关键词 图形处理器 稀疏线性方程组 预条件共轭梯度法 压缩稀疏行 统一计算设备架构
下载PDF
箔条云团雷达回波建模与仿真 被引量:10
16
作者 于新源 许波 +1 位作者 熊坤 杜海 《系统工程与电子技术》 EI CSCD 北大核心 2017年第1期79-85,共7页
箔条云团雷达回波的建模与仿真一直是电子对抗领域研究的热点之一。为反映不同雷达极化、不同入射方向等条件下雷达回波的差异,在有关单根箔条运动模式、后向散射特性等已有研究成果的基础上,首先通过分析视线及其极化分量与雷达天线和... 箔条云团雷达回波的建模与仿真一直是电子对抗领域研究的热点之一。为反映不同雷达极化、不同入射方向等条件下雷达回波的差异,在有关单根箔条运动模式、后向散射特性等已有研究成果的基础上,首先通过分析视线及其极化分量与雷达天线和箔条的角度关系完善了演绎法建模的理论研究。其次设计了基于统一计算设备架构(compute unified device architecture,CUDA)的CPU与GPU串并行计算程序,解决了演绎模型仿真时计算量大的难题。最后从雷达回波的距离-多普勒特性、幅度分布特性等多个方面对仿真结果进行了分析,并通过与外场实测和理论推导数据的对比验证了仿真结果的可信性。 展开更多
关键词 箔条云团 雷达回波 演绎法 统一计算设备架构 串并行仿真
下载PDF
十亿像素瞬态成像系统实时图像拼接 被引量:10
17
作者 王新华 王晓坤 《中国光学》 EI CAS CSCD 2015年第5期785-793,共9页
为了满足工程应用对图像拼接实时性的要求,依据已设计完成的基于同心球透镜与微相机拼接阵列复合结构的十亿像素瞬态成像系统,提出一种基于统一计算设备架构(CUDA)与先验信息相结合的自适应图像拼接并行加速算法。首先,利用高精度四维... 为了满足工程应用对图像拼接实时性的要求,依据已设计完成的基于同心球透镜与微相机拼接阵列复合结构的十亿像素瞬态成像系统,提出一种基于统一计算设备架构(CUDA)与先验信息相结合的自适应图像拼接并行加速算法。首先,利用高精度四维标定平台对相邻微相机成像重叠区域进行预标定。接着,采用基于CUDA的快速鲁棒特征(SURF)方法检测提取重叠区域图像的候选特征点集。然后,运用基本线性代数运算子程序(CUBLAS)加速基于随机KD-Tree索引的近似最近邻搜索(ANN)算法,用于获取初始匹配点对。最后,提出一种改进的并行渐近式抽样一致性(IPROSAC)算法,用于剔除误匹配点对和空间变换矩阵的参数估计,从而得到拼接图像的空间几何变换关系。实验结果表明,该算法的图像拼接时间为287 ms,与单独采用CPU串行算法相比速度提高了近30倍。 展开更多
关键词 瞬态成像 图像拼接 统一计算设备架构
下载PDF
LU分解和Laplace算法在GPU上的实现 被引量:9
18
作者 陈颖 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期851-855,共5页
随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)... 随着图形处理器(GPU)性能的大幅度提升以及可编程性的发展,已经有许多算法成功地移植到GPU上。LU分解和Laplace算法是科学计算的核心,但计算量往往很大,由此提出了一种在GPU上加速计算的方法。使用Nvidia公司的统一计算设备架构(CUDA)编程模型实现这两个算法,通过对CPU与GPU进行任务划分,同时利用GPU上的共享存储器提高数据访问速度,对GPU程序进行分支消除,并且对矩阵分段计算以达到加速计算的目的。实验结果表明,随着矩阵规模的增大,基于GPU的算法相对于基于CPU的算法具有良好的加速效果。 展开更多
关键词 图形处理器 LU分解 Laplace算法 统一计算设备架构 共享存储器
下载PDF
基于CUDA与CUBLAS的Tucker分解模块设计与实现 被引量:10
19
作者 周琦 柴小丽 +1 位作者 马克杰 俞则人 《计算机工程》 CAS CSCD 北大核心 2019年第3期41-46,共6页
由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用,使得Tucker分解算法成为目前重点研究对象。但是当前流行的Tucker分解算法需要对张量进行多次展开,导致算法加速效率降低。针对上述问题,提出一种应用于统一计算... 由于张量Tucker分解在图像处理、人脸识别与信号处理等领域中的大量应用,使得Tucker分解算法成为目前重点研究对象。但是当前流行的Tucker分解算法需要对张量进行多次展开,导致算法加速效率降低。针对上述问题,提出一种应用于统一计算设备架构(CUDA)平台上的改进Tucker分解模块,通过对Tucker分解算法与CUDA平台进行优化,在省略张量展开过程的同时,提高加速效率,从而降低对加速系统的要求。实验结果表明,改进Tucker分解算法在CUDA平台上的加速性能具有明显提高。 展开更多
关键词 Tucker分解算法 张量分解 统一计算设备架构 图形处理单元 张量范数
下载PDF
基于GPU的视频流人群实时计数 被引量:10
20
作者 姬丽娜 陈庆奎 +3 位作者 陈圆金 赵德玉 方玉玲 赵永涛 《计算机应用》 CSCD 北大核心 2017年第1期145-152,共8页
为了解决人群遮挡严重、光照突变等恶劣环境下人群计数准确率低的问题,提出基于混合高斯模型(GMM)和尺度不变特征变换(SIFT)特征的人群数量统计分析新方法。首先,基于GMM提取运动人群,并采用灰度共生矩阵(GLCM)和形态学方法去除背景中... 为了解决人群遮挡严重、光照突变等恶劣环境下人群计数准确率低的问题,提出基于混合高斯模型(GMM)和尺度不变特征变换(SIFT)特征的人群数量统计分析新方法。首先,基于GMM提取运动人群,并采用灰度共生矩阵(GLCM)和形态学方法去除背景中移动的小物体和较密集的噪声等非人群前景,针对GMM算法提出了一种效率较高的并行模型;接着,检测运动人群的SIFT特征点作为人群统计的基础,基于二值图像的特征提取大大减少了执行时间;最后,提出基于人群特征数和人群数量进行统计分析的新方法,选择不同等级的人群数量的数据集分别进行训练,统计得出平均单个特征点数,并对不同密度的行人进行计数实验。算法采用基于GPU多流处理器进行加速,并针对所提算法在统一计算设备架构(CUDA)流上任务的有效调度的方法进行分析。实验结果显示,相比单流提速31.5%,相比CPU提速71.8%。 展开更多
关键词 视频监控 GPU并行计算 人群计数 尺度不变特征变换 混合高斯模型 统一计算设备架构
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部