期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
特征融合的双目半全局匹配算法及其并行加速实现 被引量:10
1
作者 吕倪祺 宋广华 杨波威 《中国图象图形学报》 CSCD 北大核心 2018年第6期874-886,共13页
目的在微小飞行器系统中,如何实时获取场景信息是实现自主避障及导航的关键问题。本文提出了一种融合中心平均Census特征与绝对误差(AD)特征、基于纹理优化的半全局立体匹配算法(ADCC-TSGM),并利用统一计算设备架构(CUDA)进行并行加速... 目的在微小飞行器系统中,如何实时获取场景信息是实现自主避障及导航的关键问题。本文提出了一种融合中心平均Census特征与绝对误差(AD)特征、基于纹理优化的半全局立体匹配算法(ADCC-TSGM),并利用统一计算设备架构(CUDA)进行并行加速。方法使用沿极线方向的一维差分计算纹理信息,使用中心平均Census特征及AD特征进行代价计算,通过纹理优化的SGM算法聚合代价并获得初始视差图;然后,通过左右一致性检验检查剔除粗略视差图中的不稳定点和遮挡点,使用线性插值和中值滤波对视差图中的空洞进行填充;最后,利用GPU特性,对立体匹配中的代价计算、半全局匹配(SGM)计算、视差计算等步骤使用共享内存、单指令多数据流(SIMD)及混合流水线进行优化以提高运行速度。结果在Quarter Video Graphics Array(QVGA)分辨率的middlebury双目图像测试集中,本文提出的ADCC-TSGM算法总坏点率较Semi-Global Block Matching(SGBM)算法降低36.1%,较SGM算法降低28.3%;平均错误率较SGBM算法降低44.5%,较SGM算法降低49.9%。GPU加速实验基于NVIDIA Jetson TK1嵌入式计算平台,在双目匹配性能不变的情况下,通过使用CUDA并行加速,可获得117倍以上加速比,即使相较于已进行SIMD及多核并行优化的SGBM,运行时间也减少了85%。在QVGA分辨率下,GPU加速后的运行帧率可达31.8帧/s。结论本文算法及其CUDA加速可为嵌入式平台提供一种实时获取高质量深度信息的有效途径,可作为微小飞行器、小型机器人等设备进行环境感知、视觉定位、地图构建的基础步骤。 展开更多
关键词 双目视觉 census特征 半全局匹配 cuda加速 并行计算
原文传递
基于奇异值分解的橡胶密封圈表面缺陷检测方法 被引量:8
2
作者 黄连 刘晓军 +3 位作者 雷自力 顾浩 刘云峰 狄超雄 《润滑与密封》 CAS CSCD 北大核心 2021年第11期84-88,共5页
为解决橡胶密封圈表面缺陷人工检测效率低,缺陷提取困难等问题,提高橡胶密封圈缺陷在线检测速度及准确率,提出一种基于机器视觉的橡胶密封圈表面缺陷检测方法。该方法采用多相机多线程图像采集模式,采集橡胶密封圈的上下表面不同位置的... 为解决橡胶密封圈表面缺陷人工检测效率低,缺陷提取困难等问题,提高橡胶密封圈缺陷在线检测速度及准确率,提出一种基于机器视觉的橡胶密封圈表面缺陷检测方法。该方法采用多相机多线程图像采集模式,采集橡胶密封圈的上下表面不同位置的局部图像;对图像自适应中值滤波后进行边缘增强,并使用高斯差分算子提取轮廓粗边缘,利用Zernike矩获取亚像素边缘位置;针对边缘存在不连续点问题,使用Ceres库多项式拟合,估计断点位置,并更新所有边缘位置;根据边缘位置寻找出整张图像中橡胶密封圈表面图像区域,并将该环形兴趣区域映射到矩形区域中;将获得的图像进行奇异值分解(SVD),并通过连通域分析,提取出图像中的奇异区域,即存在缺陷的位置。经实验验证,基于奇异值分解的橡胶圈表面缺陷检测方法鲁棒性好、效率高,可以快速准确地寻找出橡胶密封圈表面缺陷信息。 展开更多
关键词 橡胶密封圈 高斯差分 ZERNIKE矩 Ceres拟合 cuda加速 奇异值分解
下载PDF
光照不均匀的结构光图像的条纹快速提取方法 被引量:7
3
作者 郑红波 石豪 +2 位作者 杜轶诚 张美玉 秦绪佳 《计算机科学》 CSCD 北大核心 2019年第5期272-278,共7页
结构光图像的条纹提取易受不均匀光照的影响,而提取的条纹精度是后续三维重建精确与否的重要前提,因此,如何消除不均匀光照的影响,准确提取结构光图像的条纹是本文研究的目标。文中提出了一种结合高斯滤波和均值滤波的处理算法,适用于... 结构光图像的条纹提取易受不均匀光照的影响,而提取的条纹精度是后续三维重建精确与否的重要前提,因此,如何消除不均匀光照的影响,准确提取结构光图像的条纹是本文研究的目标。文中提出了一种结合高斯滤波和均值滤波的处理算法,适用于光照不均匀的结构光图像的条纹提取。该算法既可以有效地消除不均匀光照对图像的影响,又保留了原始图像的特征信息,取得了良好的实验效果。为了加速滤波处理过程,文中使用可分离滤波器对算法进行改进,降低了计算复杂度,又使用基于GPU并行计算的CUDA技术对算法进行加速,使处理速度得到较大的提高。 展开更多
关键词 条纹提取 不均匀光照 可分离滤波器 cuda加速
下载PDF
基于CUDA加速的三维医学图像配准 被引量:6
4
作者 王蓓蕾 朱志良 孟琭 《小型微型计算机系统》 CSCD 北大核心 2013年第11期2621-2625,共5页
三维医学图像配准技术是医学图像处理,特别是外科手术导航的关键技术,但现有的三维医学图像配准算法大多存在计算量大、耗时过长的问题,不能满足临床应用中实时处理的要求.针对这一问题,提出一种基于统一计算设备架构(Compute Unified D... 三维医学图像配准技术是医学图像处理,特别是外科手术导航的关键技术,但现有的三维医学图像配准算法大多存在计算量大、耗时过长的问题,不能满足临床应用中实时处理的要求.针对这一问题,提出一种基于统一计算设备架构(Compute Unified Device Architecture,CUDA)的高性能计算方法,充分利用CUDA架构下GPU(Graphic Processing Unit)并行计算的优势,并结合图像多尺度、最大互信息等方法,实现了三维医学图像的快速配准.实验结果表明,该方法在保证配准精度的前提下,大幅度地提高了三维医学图像配准算法的运算速度,可以满足临床上对配准算法的实时性要求. 展开更多
关键词 三维图像配准 cuda加速 互信息 多尺度
下载PDF
基于CUDA加速的SIFT特征提取 被引量:5
5
作者 王蓓蕾 朱志良 孟琭 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2013年第2期200-204,共5页
提出一种基于统一计算设备架构(CUDA)加速的尺度不变特征变换(SIFT)快速计算方法,用以解决SIFT特征提取计算过程耗时过长的问题.该方法充分利用图像处理单元(GPU)在并行计算、浮点计算、内存管理等方面的优势,合理分配主机端和设备端的... 提出一种基于统一计算设备架构(CUDA)加速的尺度不变特征变换(SIFT)快速计算方法,用以解决SIFT特征提取计算过程耗时过长的问题.该方法充分利用图像处理单元(GPU)在并行计算、浮点计算、内存管理等方面的优势,合理分配主机端和设备端的资源及其在SIFT特征计算中所承担的角色.实验表明,与CPU架构下的SIFT特征提取算法相比,本文算法可以大幅度加快SIFT特征提取的计算速度,其加速比随着SIFT特征点数目的增加而增加,在本文实验中最大加速比可达19.54. 展开更多
关键词 cuda加速 尺度不变特征变换 图像特征 特征描述符 图像处理单元
下载PDF
基于CUDA的三维重建过程实时可视化方法(英文) 被引量:5
6
作者 毕文元 陈志强 +1 位作者 张丽 邢宇翔 《CT理论与应用研究(中英文)》 2010年第2期1-8,共8页
在某些用于在线控制的CT系统中,经常有必要在扫描过程中检查中间结果从而排除故障。然而实时的重建与体绘制对系统计算能力的要求非常高,难以实现。本文针对锥束CT提出了一整套实时重建可视化方法,并在最新的图形处理器Tesla C 1060上... 在某些用于在线控制的CT系统中,经常有必要在扫描过程中检查中间结果从而排除故障。然而实时的重建与体绘制对系统计算能力的要求非常高,难以实现。本文针对锥束CT提出了一整套实时重建可视化方法,并在最新的图形处理器Tesla C 1060上实现。与传统的工作方式不同,这种方法在扫描得到每一张投影后,实时显示重建过程的中间结果。通过这种方法,可以很清楚地观察到投影数据逐步合成三维重建结果的过程,也可以预先看到探测器的缺陷对重建结果造成的破坏。同时,这种方法也是实现4D CT可视化的一种有效途径。 展开更多
关键词 CT重建 cuda 加速 动态体绘制 在线FDK
下载PDF
特征融合的双目立体匹配算法加速研究与实现 被引量:1
7
作者 范亚博 王国祥 +1 位作者 陈海军 冯威 《导航定位与授时》 CSCD 2022年第6期133-140,共8页
随着图像分辨率和场景信息获取实时性需求的提高,业界对双目立体匹配算法的效率提出了更高的要求。针对该问题,提出了将SAD与Census变换特征融合的结果作为初始匹配代价,利用SGM算法进行代价聚合,采用赢家通吃策略计算视差,通过左右一... 随着图像分辨率和场景信息获取实时性需求的提高,业界对双目立体匹配算法的效率提出了更高的要求。针对该问题,提出了将SAD与Census变换特征融合的结果作为初始匹配代价,利用SGM算法进行代价聚合,采用赢家通吃策略计算视差,通过左右一致性检验检测出遮挡点并填充,使用中值滤波剔除异常值,最终获取优化后的视差图。采用统一计算设备架构(CUDA)对算法实现并行计算,针对立体匹配比较耗时的问题,该算法最大化地利用共享内存、寄存器内存以及CUDA流,实现了不同核函数之间的并行,大大提升了执行效率。结果表明,该算法在Middlebury立体匹配平台上,平均误匹配率下降了8.05%;在NVIDIA GeForce GTX 1650平台上运行450×375分辨率的图像,比原始SGM算法快687倍,运行高分辨率图像时依然能够实现实时显示性能。 展开更多
关键词 立体匹配 SAD Census变换 cuda加速 并行计算
下载PDF
基于Sobel算子改进卷积神经网络的人脸识别 被引量:1
8
作者 黄剑 贺兴时 《渭南师范学院学报》 2018年第20期39-46,共8页
人脸识别是一项实用新技术,在使用过程中有很高的要求,目前对于人脸识别的研究多种多样,但在识别速率和准确度上很难达到人类视觉的效果。文章研究了在输入网络之前首先通过Sobel算子对人脸图片进行预处理,然后在卷积神经网络的基础上... 人脸识别是一项实用新技术,在使用过程中有很高的要求,目前对于人脸识别的研究多种多样,但在识别速率和准确度上很难达到人类视觉的效果。文章研究了在输入网络之前首先通过Sobel算子对人脸图片进行预处理,然后在卷积神经网络的基础上对网络结构和参数进行了改进,并采用SVM作为分类器,利用CUDA(Computer Unified Device Architecture)进行加速,使得网络的速度和识别率有了很大提高。最后将改进的网络与PCA、BP神经网络和传统CNN的人脸识别方法进行比较,结果表明改进的网络效果更优。 展开更多
关键词 人脸识别 SOBEL算子 卷积神经网络 Caffe环境 cuda加速
下载PDF
基于GPU加速的地震图像重建技术
9
作者 许盼兮 张东 孙尽尧 《半导体光电》 CAS CSCD 北大核心 2013年第5期852-857,共6页
针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行... 针对目前地层层析成像算法中正演算法存在计算量大、计算速度慢的问题,以图像处理器(GPU)为核心,研究并实现了一种基于GPU平台的时域有限差分(FDTD)正演算法。CUDA是一种由NVIDIA推出的GPU通用并行计算架构,也是目前较为成熟的GPU并行运算架构。而FDTD正演算法本身在算法特性上满足并行的要求,二者的结合将极大地加速程序的计算速度。在基于标准Marmousi速度模型的正演模拟中,程序速度提升30倍,而GPU正演图像与CPU正演结果误差小于千分之一。算例表明CUDA可以大大加速目前的FDTD正演算法,并且随着GPU硬件自身的发展和计算架构的不断改进,加速效果还将进一步提升,这将有利于后续波形反演工作的进展。 展开更多
关键词 cuda加速 波形正演 声波方程 MARMOUSI模型
下载PDF
层次结构树木物理运动的实时仿真
10
作者 杨猛 吴恩华 《中国图象图形学报》 CSCD 北大核心 2011年第6期1112-1120,共9页
提出一种在GPU上实现基于力学运动原理的层次结构树木运动的并行仿真技术。该技术通过分析物理运动原理与多层次的矩阵结构(HMSM)算法的并行性,来达到将树木动画在图形硬件CUDA平台上进行加速的目的。首先介绍层次结构树木在外力诸如风... 提出一种在GPU上实现基于力学运动原理的层次结构树木运动的并行仿真技术。该技术通过分析物理运动原理与多层次的矩阵结构(HMSM)算法的并行性,来达到将树木动画在图形硬件CUDA平台上进行加速的目的。首先介绍层次结构树木在外力诸如风力等作用下的物理运动原理;然后,针对树木的物理运动以及层次结构叠加算法详细地进行并行性分析;之后着重阐述CUDA框架下树木运动的并行结构设计过程与并行算法的详细设计方法;最后在GPU上执行树木物理运动仿真。实验结果表明,该技术不但能够生成真实感较强的树木动画序列,还能够实时模拟基于物理的树木运动。同时,该技术给计算机动画的加速算法提供了很好的思想。 展开更多
关键词 树木动画 基于物理 层级结构 cuda加速 实时
原文传递
大视场紧凑型仿生复眼成像系统研究 被引量:3
11
作者 裘溯 薛家安 +2 位作者 王霞 李磊磊 陈家斌 《导航定位与授时》 2020年第4期11-18,共8页
针对视觉导航系统对小型化、超分辨成像和近程立体视觉的需求,研究了一种基于微端面光纤面板的大视场紧凑型仿生复眼成像系统。利用视轴发散的微小型透镜组进行大视场成像,并以切削斜端面的光纤面板进行图像传输,将大面阵(5120×512... 针对视觉导航系统对小型化、超分辨成像和近程立体视觉的需求,研究了一种基于微端面光纤面板的大视场紧凑型仿生复眼成像系统。利用视轴发散的微小型透镜组进行大视场成像,并以切削斜端面的光纤面板进行图像传输,将大面阵(5120×5120像素)CMOS相机与光纤面板后端面直接耦合实现图像输出,可实现9个视场部分重叠子孔径图像同步实时输出和采集。在实时化拼接处理中,利用CUDA并行加速方法进行图像拼接,单帧的拼接耗时小于30ms。视场部分重叠复眼成像模式还可配置偏振片或滤光片构成全偏振或多光谱成像,在天空偏振光导航、无人机紧急避障、弹载侦察、近程引信以及水下无人潜航器导航等领域具有广泛的应用前景。 展开更多
关键词 仿生复眼 多微端面光纤面板 CMOS耦合 多孔径成像 cuda并行加速 实时拼接
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部