期刊文献+
共找到844篇文章
< 1 2 43 >
每页显示 20 50 100
改进的YOLO V3算法及其在小目标检测中的应用 被引量:156
1
作者 鞠默然 罗海波 +3 位作者 王仲博 何淼 常铮 惠斌 《光学学报》 EI CAS CSCD 北大核心 2019年第7期245-252,共8页
针对图像中小目标检测率低、虚警率高等问题,提出了一种YOLO V3的改进方法,并将其应用于小目标的检测。由于小目标所占的像素少、特征不明显,提出对原网络输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与第2个残差块输出的特... 针对图像中小目标检测率低、虚警率高等问题,提出了一种YOLO V3的改进方法,并将其应用于小目标的检测。由于小目标所占的像素少、特征不明显,提出对原网络输出的8倍降采样特征图进行2倍上采样,将2倍上采样特征图与第2个残差块输出的特征图进行拼接,建立输出为4倍降采样的特征融合目标检测层。为了获取更多的小目标特征信息,在YOLO V3网络结构Darknet53的第2个残差块中增加2个残差单元。利用K-means聚类算法对目标候选框的个数和宽高比维度进行聚类分析。用改进的YOLO V3算法和原YOLO V3算法在VEDAI数据集上进行对比实验,结果表明改进后的YOLO V3算法能有效检测小目标,对小目标的召回率和检测的平均准确率均值都有明显的提升。 展开更多
关键词 机器视觉 小目标检测 YOLO V3 VEDAI数据集 K-MEANS聚类算法
原文传递
基于视觉的三维重建关键技术研究综述 被引量:101
2
作者 郑太雄 黄帅 +1 位作者 李永福 冯明驰 《自动化学报》 EI CSCD 北大核心 2020年第4期631-652,共22页
三维重建在视觉方面具有很高的研究价值,在机器人视觉导航、智能车环境感知系统以及虚拟现实中被广泛应用.本文对近年来国内外基于视觉的三维重建方法的研究工作进行了总结和分析,主要介绍了基于主动视觉下的激光扫描法、结构光法、阴... 三维重建在视觉方面具有很高的研究价值,在机器人视觉导航、智能车环境感知系统以及虚拟现实中被广泛应用.本文对近年来国内外基于视觉的三维重建方法的研究工作进行了总结和分析,主要介绍了基于主动视觉下的激光扫描法、结构光法、阴影法以及TOF (Time of flight)技术、雷达技术、Kinect技术和被动视觉下的单目视觉、双目视觉、多目视觉以及其他被动视觉法的三维重建技术,并比较和分析这些方法的优点和不足.最后对三维重建的未来发展作了几点展望. 展开更多
关键词 三维重建 主动视觉 被动视觉 关键技术
下载PDF
PCT:Point cloud transformer 被引量:101
3
作者 Meng-Hao Guo Jun-Xiong Cai +3 位作者 Zheng-Ning Liu Tai-Jiang Mu Ralph R.Martin Shi-Min Hu 《Computational Visual Media》 EI CSCD 2021年第2期187-199,共13页
The irregular domain and lack of ordering make it challenging to design deep neural networks for point cloud processing.This paper presents a novel framework named Point Cloud Transformer(PCT)for point cloud learning.... The irregular domain and lack of ordering make it challenging to design deep neural networks for point cloud processing.This paper presents a novel framework named Point Cloud Transformer(PCT)for point cloud learning.PCT is based on Transformer,which achieves huge success in natural language processing and displays great potential in image processing.It is inherently permutation invariant for processing a sequence of points,making it well-suited for point cloud learning.To better capture local context within the point cloud,we enhance input embedding with the support of farthest point sampling and nearest neighbor search.Extensive experiments demonstrate that the PCT achieves the state-of-the-art performance on shape classification,part segmentation,semantic segmentation,and normal estimation tasks. 展开更多
关键词 3D computer vision deep learning point cloud processing TRANSFORMER
原文传递
结构光三维视觉系统研究 被引量:40
4
作者 张广军 王红 +1 位作者 赵慧洁 佟锦林 《航空学报》 EI CAS CSCD 北大核心 1999年第4期365-367,共3页
介绍了结构光三维视觉原理,在广义坐标系中采用投影和透视变换理论建立了结构光三维视觉模型。在此基础上,提出了基于非线性最小二乘法的模型参数标定方法,并建立了结构光三维视觉系统,给出了实验结果。
关键词 结构光 三维视觉 视觉模型 视觉检测 视觉导引
下载PDF
计算机视觉技术及其在电力系统自动化中的应用 被引量:39
5
作者 龚超 罗毅 涂光瑜 《电力系统自动化》 EI CSCD 北大核心 2003年第1期76-79,共4页
随着视频技术和红外成像技术在电力系统中的广泛应用 ,图像信息在电力系统自动化中所起的作用越来越重要 ,而且对图像信息分析与理解的要求也越来越高 ,使得在一些应用场合必须利用计算机视觉技术由计算机替代监控人员进行图像理解。文... 随着视频技术和红外成像技术在电力系统中的广泛应用 ,图像信息在电力系统自动化中所起的作用越来越重要 ,而且对图像信息分析与理解的要求也越来越高 ,使得在一些应用场合必须利用计算机视觉技术由计算机替代监控人员进行图像理解。文中从计算机视觉的两个方面——图像识别和三维重建——介绍了计算机视觉技术的基本内容 ,在已有的或设想的一些应用实例的基础上 。 展开更多
关键词 计算机视觉 电力系统自动化 应用 模式识别 图像识别 三维重建 遥视 图像理解
下载PDF
基于改进YOLO v3模型的挤奶奶牛个体识别方法 被引量:44
6
作者 何东健 刘建敏 +1 位作者 熊虹婷 芦忠忠 《农业机械学报》 EI CAS CSCD 北大核心 2020年第4期250-260,共11页
为实现无接触、高精度养殖场环境下奶牛个体的有效识别,提出了基于改进YOLO v3深度卷积神经网络的挤奶奶牛个体识别方法。首先,在奶牛进、出挤奶间的通道上方安装摄像机,定时、自动获取奶牛背部视频,并用视频帧分解技术得到牛背部图像;... 为实现无接触、高精度养殖场环境下奶牛个体的有效识别,提出了基于改进YOLO v3深度卷积神经网络的挤奶奶牛个体识别方法。首先,在奶牛进、出挤奶间的通道上方安装摄像机,定时、自动获取奶牛背部视频,并用视频帧分解技术得到牛背部图像;用双边滤波法去除图像噪声,并用像素线性变换法增强图像亮度和对比度,通过人工标注标记奶牛个体编号;为适应复杂环境下的奶牛识别,借鉴Gaussian YOLO v3算法构建了优化锚点框和改进网络结构的YOLO v3识别模型。从89头奶牛的36790幅背部图像中,随机选取22074幅为训练集,其余图像为验证集和测试集。识别结果表明,改进YOLO v3模型的识别准确率为95.91%,召回率为95.32%,m AP为95.16%,Io U为85.28%,平均帧率为32 f/s,识别准确率比YOLO v3高0.94个百分点,比Faster R-CNN高1.90个百分点,检测速度是Faster R-CNN的8倍,背部为纯黑色奶牛的F1值比YOLO v3提高了2.75个百分点。本文方法具有成本低、性能优良的特点,可用于养殖场复杂环境下挤奶奶牛个体的实时识别。 展开更多
关键词 挤奶奶牛 个体识别 视频分析 机器视觉 改进YOLO V3
下载PDF
融合注意力机制的多尺度目标检测算法 被引量:43
7
作者 鞠默然 罗江宁 +1 位作者 王仲博 罗海波 《光学学报》 EI CAS CSCD 北大核心 2020年第13期126-134,共9页
基于串联(concat)操作的特征融合方法仅仅融合了相邻尺度的特征,并没有充分利用来自其他尺度的输出特征。并且,串联操作只是在通道维度上将不同尺度的特征连接,不能反映不同通道间特征的相关性和重要性。针对这些问题,提出了一种基于注... 基于串联(concat)操作的特征融合方法仅仅融合了相邻尺度的特征,并没有充分利用来自其他尺度的输出特征。并且,串联操作只是在通道维度上将不同尺度的特征连接,不能反映不同通道间特征的相关性和重要性。针对这些问题,提出了一种基于注意力机制的特征融合算法。该算法利用注意力机制来融合不同尺度的特征,通过对每个通道的特征进行权重分配来学习不同通道间特征的相关性。将基于注意力机制的特征融合算法与YOLO V3相结合,构建多尺度目标检测器,并利用Focal loss和GIOU loss来设计检测器的损失函数。在PASCAL VOC和KITTI数据集上对不同算法进行对比实验,实验结果表明,多尺度目标检测器具有更高的检测精度和较快的检测速度。 展开更多
关键词 机器视觉 卷积神经网络 特征融合 注意力机制 YOLO V3
原文传递
计算机视觉研究进展 被引量:9
8
作者 王天珍 《武汉汽车工业大学学报》 CAS 1998年第1期23-27,共5页
通过对计算机视觉40年来研究的回顾,对计算机视觉发展前景作了展望。认为Edel-man根据洛克对表象概念的定义提出“无重建的表象也许是极端的目的主义者(Brooks)无表象的视觉与占统治地位的无目的的重建主义之间的合... 通过对计算机视觉40年来研究的回顾,对计算机视觉发展前景作了展望。认为Edel-man根据洛克对表象概念的定义提出“无重建的表象也许是极端的目的主义者(Brooks)无表象的视觉与占统治地位的无目的的重建主义之间的合理的折中”的建议,为计算机视觉研究摆脱困境找出了一条可行的路。 展开更多
关键词 计算机视觉 主动视觉 定性视觉 无重建表象
下载PDF
采用改进YoloV4模型检测复杂环境下马铃薯 被引量:34
9
作者 张兆国 张振东 +3 位作者 李加念 王海翼 李彦彬 李东昊 《农业工程学报》 EI CAS CSCD 北大核心 2021年第22期170-178,共9页
为解决马铃薯联合收获机在作业过程中分级清选的问题,并在收获作业过程中实时监测评估收获状态,该研究提出一种在光照亮度变化大、土壤与薯块遮挡、机器振动以及尘土干扰等情况下对马玲薯进行识别检测并快速准确获取马铃薯数量以及损伤... 为解决马铃薯联合收获机在作业过程中分级清选的问题,并在收获作业过程中实时监测评估收获状态,该研究提出一种在光照亮度变化大、土壤与薯块遮挡、机器振动以及尘土干扰等情况下对马玲薯进行识别检测并快速准确获取马铃薯数量以及损伤情况的机器学习模型。在卷积神经残差网络中引入轻量级注意力机制,改进YoloV4检测网络,并将YoloV4结构中的CSP-Darknet53网络替换为MobilenetV3网络,完成特征提取。试验结果表明,基于卷积神经网络的深度学习方法相比于传统Open-CV识别提高了马铃薯识别精度,相比于其他传统机器学习模型,MobilenetV3-YoloV4识别速度更快,马铃薯识别的全类平均准确率达到91.4%,在嵌入式设备上的传输速度为23.01帧/s,模型鲁棒性强,能够在各种环境下完成对正常马铃薯和机械损伤马铃薯的目标检测,可为马铃薯联合收获机智能清选以及智能收获提供技术支撑。 展开更多
关键词 机器视觉 目标检测 深度学习 马铃薯 YoloV4 MobilenetV3
下载PDF
基于优化YOLOv3算法的交通灯检测 被引量:31
10
作者 孙迎春 潘树国 +2 位作者 赵涛 高旺 魏建胜 《光学学报》 EI CAS CSCD 北大核心 2020年第12期137-145,共9页
为解决YOLOv3算法在检测道路交通灯时存在的漏检率高、召回率低等问题,提出一种基于优化YOLOv3算法的交通灯检测方法。首先,采用K-means算法对数据进行聚类分析,结合聚类结果和交通灯标签的统计结果,确定先验框的宽高比及其数量。然后,... 为解决YOLOv3算法在检测道路交通灯时存在的漏检率高、召回率低等问题,提出一种基于优化YOLOv3算法的交通灯检测方法。首先,采用K-means算法对数据进行聚类分析,结合聚类结果和交通灯标签的统计结果,确定先验框的宽高比及其数量。然后,根据交通灯尺寸特点,精简网络结构,分别将8倍降采样信息、16倍降采样信息与高层语义信息进行融合,在两个尺度上建立目标特征检测层。同时,为了避免交通灯特征随着网络的加深而消失的问题,分别减少两个目标检测层前的两组卷积层,简化特征提取步骤。最后,在损失函数中,利用高斯分布特性评估边界框的准确性,以提升对交通灯检测的精度。实验结果显示,优化YOLOv3算法的检测速度可达30 frame/s,平均精准度较原网络提升9个百分点,可以有效完成对交通灯的检测。 展开更多
关键词 机器视觉 YOLOv3 交通灯检测 BDD100K数据集 K-MEANS算法 高斯分布
原文传递
基于机器视觉的3D激光平面度测量系统的研究与应用 被引量:29
11
作者 谭文 方淼 +2 位作者 段峰 周博文 吴亮红 《仪器仪表学报》 EI CAS CSCD 北大核心 2020年第1期241-249,共9页
为了满足现代工业非接触、高精度以及快速对微型物体进行平面度测量的需求,本文采用3D激光测量方法研制了基于机器视觉的3D激光平面度测量系统。首先研究3D激光轮廓仪的扫描测量原理及平面度测量原理,然后对激光线图像进行预处理,确保... 为了满足现代工业非接触、高精度以及快速对微型物体进行平面度测量的需求,本文采用3D激光测量方法研制了基于机器视觉的3D激光平面度测量系统。首先研究3D激光轮廓仪的扫描测量原理及平面度测量原理,然后对激光线图像进行预处理,确保后期测量的准确性,其次对几何特征进行定位和坐标转换,再进行数据处理,获取物体测量部位的三维测量值。本系统为微型物体几何尺寸的三维非接触、高精度、多尺寸测量提供了测量装置系统和相应的测量手段。最后实物测量实验验证文中测量方法的准确性、快速性和有效性,测量精度可达0.1μm。 展开更多
关键词 3D激光 高精密测量 图像预处理 机器视觉 特征定位
下载PDF
深度学习在基于单幅图像的物体三维重建中的应用 被引量:26
12
作者 陈加 张玉麒 +2 位作者 宋鹏 魏艳涛 王煜 《自动化学报》 EI CSCD 北大核心 2019年第4期657-668,共12页
基于单幅图像的物体三维重建是计算机视觉领域的一个重要问题,近几十年来得到了广泛的关注.随着深度学习的不断发展,近年来基于单幅图像的物体三维重建取得了显著进展.本文对深度学习在基于单幅图像的物体三维重建领域的研究进展及具体... 基于单幅图像的物体三维重建是计算机视觉领域的一个重要问题,近几十年来得到了广泛的关注.随着深度学习的不断发展,近年来基于单幅图像的物体三维重建取得了显著进展.本文对深度学习在基于单幅图像的物体三维重建领域的研究进展及具体应用进行了综述.首先介绍了基于单幅图像的三维重建的研究背景及其传统方法的研究现状,其次简要介绍了深度学习并详细综述了深度学习在基于单幅图像的物体三维重建中的应用,随后简要概述了三维物体重建的常用公共数据集,最后进行了分析与总结,指出了目前存在的问题及未来的研究方向. 展开更多
关键词 三维重建 深度学习 计算机视觉 单幅图像
下载PDF
基于改进YOLOv3的安全帽佩戴识别算法 被引量:25
13
作者 许凯 邓超 《激光与光电子学进展》 CSCD 北大核心 2021年第6期292-299,共8页
针对传统安全帽佩戴识别算法检测精度低、鲁棒性差的问题,提出了一种基于深度学习的安全帽佩戴检测方法。该方法以YOLOv3检测算法为基础,对其网络结构和损失函数加以改进。首先,通过增加特征图弥补原YOLOv3算法对小目标检测效果不佳的问... 针对传统安全帽佩戴识别算法检测精度低、鲁棒性差的问题,提出了一种基于深度学习的安全帽佩戴检测方法。该方法以YOLOv3检测算法为基础,对其网络结构和损失函数加以改进。首先,通过增加特征图弥补原YOLOv3算法对小目标检测效果不佳的问题;然后在增加特征图的基础上,使用K-means聚类算法对收集的安全帽数据集进行聚类,选择出合适的先验锚框;最后,采用GIoU Loss作为边界框损失,在损失函数中加入Focal Loss,减少正负样本不均衡带来的误差。实验结果表明,相较于YOLOv3检测算法,改进后的算法在平均精确率上提高了3.47%,在安全帽识别精确率上提高了4.23%,在安全帽识别上具有一定的先进性和有效性。 展开更多
关键词 机器视觉 目标检测 YOLOv3 安全帽检测 K-MEANS算法
原文传递
“3S”技术在林业上的应用现状及发展趋势展望 被引量:20
14
作者 庾晓红 李贤伟 白降丽 《林业调查规划》 2005年第3期1-3,7,共4页
从森林资源调查、森林资源动态监测、森林资源经营管理、病虫害监测及防治、森林防火、林业专题图的绘制、野生动物资源调查、植被分类调查、森林资源档案管理以及在林业生态工程上的应用等方面分析了"3S"技术在林业上的应用... 从森林资源调查、森林资源动态监测、森林资源经营管理、病虫害监测及防治、森林防火、林业专题图的绘制、野生动物资源调查、植被分类调查、森林资源档案管理以及在林业生态工程上的应用等方面分析了"3S"技术在林业上的应用现状,并对"3S"技术的发展趋势作了展望。 展开更多
关键词 3S”技术 发展趋势 森林资源调查 病虫害监测 森林防火 植被分类调查 森林资源档案管理 中国
下载PDF
基于改进YOLOv3算法的公路车道线检测方法 被引量:23
15
作者 崔文靓 王玉静 +3 位作者 康守强 谢金宝 王庆岩 MIKULOVICH Vladimir Ivanovich 《自动化学报》 EI CAS CSCD 北大核心 2022年第6期1560-1568,共9页
针对YOLOv3算法在检测公路车道线时存在准确率低和漏检概率高的问题,提出一种改进YOLOv3网络结构的公路车道线检测方法.该方法首先将图像划分为多个网格,利用K-means++聚类算法,根据公路车道线宽高固有特点,确定目标先验框数量和对应宽... 针对YOLOv3算法在检测公路车道线时存在准确率低和漏检概率高的问题,提出一种改进YOLOv3网络结构的公路车道线检测方法.该方法首先将图像划分为多个网格,利用K-means++聚类算法,根据公路车道线宽高固有特点,确定目标先验框数量和对应宽高值;其次根据聚类结果优化网络Anchor参数,使训练网络在车道线检测方面具有一定的针对性;最后将经过Darknet-53网络提取的特征进行拼接,改进YOLOv3算法卷积层结构,使用GPU进行多尺度训练得到最优的权重模型,从而对图像中的车道线目标进行检测,并选取置信度最高的边界框进行标记.使用Caltech Lanes数据库中的图像信息进行对比试验,实验结果表明,改进的YOLOv3算法在公路车道线检测中平均准确率(Mean average precision, mAP)为95%,检测速度可达50帧/s,较YOLOv3原始算法mAP值提升了11%,且明显高于其他车道线检测方法. 展开更多
关键词 车道线检测 深度学习 YOLOv3 K-means++ 计算机视觉
下载PDF
基于视觉技术的三维指尖跟踪算法 被引量:20
16
作者 郭康德 张明敏 +2 位作者 孙超 李扬 汤兴 《计算机研究与发展》 EI CSCD 北大核心 2010年第6期1013-1019,共7页
基于手势的实时人机交互(HCI)在虚拟现实领域有着重要的理论和应用价值.通过双目摄像头,使用立体视觉技术可以实现指尖在三维空间的跟踪定位,进而实现指尖和虚拟空间三维物体的实时交互.这种技术可以实现三维鼠标以及用于虚实交互的三... 基于手势的实时人机交互(HCI)在虚拟现实领域有着重要的理论和应用价值.通过双目摄像头,使用立体视觉技术可以实现指尖在三维空间的跟踪定位,进而实现指尖和虚拟空间三维物体的实时交互.这种技术可以实现三维鼠标以及用于虚实交互的三维游戏中.提出一种阈值结合混合多高斯的BGS算法,用它来得到手的区域,然后通过手轮廓K向量和手中心到指尖的距离判定指尖位置,再利用标记对摄像机进行标定,根据标定参数和两个图像中得到的指尖位置,重建指尖点三维坐标,最后在三维空间实施Kalman滤波来平滑指尖点轨迹并预测前景分割的范围.实验结果表明算法是有效的. 展开更多
关键词 人机交互 BGS算法 指尖检测 三维重建 KALMAN滤波 立体视觉
下载PDF
船舶机舱虚拟现实仿真系统 被引量:12
17
作者 郭晨 叶榛 +1 位作者 史成军 孙建波 《中国造船》 EI CSCD 北大核心 2004年第3期64-69,共6页
提出并实现基于虚拟现实技术的船舶轮机仿真系统。给出应用于船舶轮机仿真的虚拟立体视觉图象生成算法 ,研究了使用立体眼镜和立体头盔视觉设备的虚拟现实系统的实现。讨论了虚拟机舱漫游。
关键词 船舶工程 虚拟现实 立体视觉 虚拟机舱 虚拟船舶驾驶台
下载PDF
计算机视觉不需要重建 被引量:2
18
作者 王天珍 《信息与控制》 CSCD 北大核心 1999年第1期47-52,共6页
通过对CVGIP杂志在1994组织的计算机视觉界有关3D重建理论论战的回顾和分析,得出结论:计算机视觉不需要重建。
关键词 计算机视觉 3D重建 表象 主动视觉
下载PDF
基于改进YOLO v3的目标检测算法 被引量:19
19
作者 赵琼 李宝清 李唐薇 《激光与光电子学进展》 CSCD 北大核心 2020年第12期305-313,共9页
随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图... 随着深度学习的不断发展与广泛运用,基于深度学习的目标检测算法已成为新的主流。为了进一步提高卷积神经网络YOLO v3(You only look once v3)的检测精度,在原算法的网络结构上添加卷积层模块对样本进行目标背景分类,并粗略调整特征图上的锚框大小。该模块输出目标背景概率后,过滤掉背景概率值低于设定阈值的样本,从而解决原算法中存在的正负样本比例失衡的问题。使用调整过的锚框替代原算法中直接由聚类生成固定大小的锚框,该过程为边界框的预测提供更优的初始值。在VOC数据集上的实验结果表明,相较于原算法,改进的YOLO v3具有更高的检测精度。 展开更多
关键词 机器视觉 目标检测 卷积神经网络 YOLO v3 锚框
原文传递
基于改进YOLOv3的火灾检测与识别 被引量:19
20
作者 任嘉锋 熊卫华 +1 位作者 吴之昊 姜明 《计算机系统应用》 2019年第12期171-176,共6页
现阶段火灾频发,需要自动进行火灾的检测与识别,虽然存在温度、烟雾传感器等火灾检测手段,但是检测实时性得不到保证.为了解决这一问题,提出了基于改进YOLOv3的火灾检测与识别的方法.首先构建一个多场景大规模火灾目标检测数据库,对火... 现阶段火灾频发,需要自动进行火灾的检测与识别,虽然存在温度、烟雾传感器等火灾检测手段,但是检测实时性得不到保证.为了解决这一问题,提出了基于改进YOLOv3的火灾检测与识别的方法.首先构建一个多场景大规模火灾目标检测数据库,对火焰和烟雾区域进行类别和位置的标注,并针对YOLOv3小目标识别性能不足的问题进行了改进.结合深度网络的特征提取能力,将火灾检测与识别形式化为多分类识别和坐标回归问题,得到了不同场景下火焰和烟雾两种特征的检测识别模型.实验表明,本文提出的改进YOLOv3算法对不同拍摄角度、不同光照条件下的火焰和烟雾检测都能得到理想的效果,同时在检测速度上也满足了实时检测的需求. 展开更多
关键词 深度学习 机器视觉 YOLOv3 火灾检测
下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部