期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
改进YOLOv5su模型检测桃树缩叶病 被引量:1
1
作者 姚凌云 周俊峰 李丽 《农业工程学报》 EI CAS CSCD 北大核心 2024年第14期109-117,共9页
为实现自然环境下桃树缩叶病的检测,该研究提出了一种基于YOLOv5su的桃树缩叶病识别改进模型DLLYOLOv5su。首先,针对桃树缩叶病目标特征变化较大的问题,在骨干网络最后一层C3模块中加入可变形自注意力模块(deformable attention,DA),使... 为实现自然环境下桃树缩叶病的检测,该研究提出了一种基于YOLOv5su的桃树缩叶病识别改进模型DLLYOLOv5su。首先,针对桃树缩叶病目标特征变化较大的问题,在骨干网络最后一层C3模块中加入可变形自注意力模块(deformable attention,DA),使模型更加关注目标区域,降低背景对模型的影响,提高模型在复杂背景下的拟合能力。其次在SPPF(fast spatial pyramid pooling)模块中引入LSKA(large separable kernel attention)结构,大核卷积增大了模型的感受野,使模型能够关注更多信息。最后,提出了LAWD(lightweight adaptive weighted downsampling)模块,使用轻量化的下采样结构替换卷积模块,减少计算开销。在桃树缩叶病数据集上进行试验,结果显示,DLL-YOLOv5su模型权重大小为17.6 MB,检测速度为83帧/s。识别准确率P、召回率R和平均精度均值mAP_(50)分别达到了80.7%、73.1%和80.4%,相较于原始YOLOv5su分别提高了4.2、2.4和4.3个百分点。与YOLOv3-tiny、Faster R-CNN、YOLOv7和YOLOv8相比mAP_(50)分别高出了28.5、11.8、2.1和4.1个百分点。改进模型识别精度高,误检、漏检率低,检测速度满足实时检测的要求,可以为桃树缩叶病的实时监测和预警提供参考。 展开更多
关键词 图像处理 病害 缩叶病 目标检测 YOLOv5su 变形注意力 大核卷积 轻量化
下载PDF
基于空间可变形Transformer的三维点云配准方法
2
作者 谢帅康 熊风光 +3 位作者 朱新杰 宋宁栋 李文清 王廷凤 《计算机工程》 CAS CSCD 北大核心 2024年第3期224-232,共9页
针对低重叠场景下点云配准方法鲁棒性差、配准精度低的问题,提出一种基于空间可变形Transformer(SDT)的三维点云配准方法。设计多级分辨率特征的提取与融合方法,显式计算点云的局部空间关系。利用SDT模块增强点云空间特征的表达能力,聚... 针对低重叠场景下点云配准方法鲁棒性差、配准精度低的问题,提出一种基于空间可变形Transformer(SDT)的三维点云配准方法。设计多级分辨率特征的提取与融合方法,显式计算点云的局部空间关系。利用SDT模块增强点云空间特征的表达能力,聚合局部与全局的特征得到特征矩阵。计算两个特征矩阵的相似度矩阵并额外地为其添加边缘松弛块,有效降低了不可行匹配对配准鲁棒性的影响,同时对相似度矩阵进行归一化等计算得到软对应置信度矩阵,根据预测的对应点空间特征是否一致来寻找点云在低重叠场景下更精确的对应关系,使用直接定义在对应关系上的损失来训练网络,将软对应关系转换为一对一的硬匹配关系,最终通过随机抽样一致性刚性变换求解器执行配准。实验结果表明,在重叠率低于30%的3DLoMatch场景中,该方法的特征匹配召回率和配准召回率相比于高度关注重叠区域的成对点云配准等方法至少提高了3.7和3.9个百分点,并且具有较强的鲁棒性。 展开更多
关键词 低重叠率 多特征融合 变形注意力 边缘松弛块 重叠对应预测
下载PDF
改进DETR的无人机航拍图像沥青路面破损检测算法
3
作者 李思宏 姬书得 任赵旭 《郑州航空工业管理学院学报》 2024年第5期50-57,共8页
针对航拍沥青路面图像数据不足、检测精度低、存在漏检的问题,研究提出一种改进的DETR(Detection Transformer)端到端沥青路面破损检测模型。该模型采用ResNet50提取特征,引入SiLU激活函数提高特征提取能力,并采用多尺度融合特征图保留... 针对航拍沥青路面图像数据不足、检测精度低、存在漏检的问题,研究提出一种改进的DETR(Detection Transformer)端到端沥青路面破损检测模型。该模型采用ResNet50提取特征,引入SiLU激活函数提高特征提取能力,并采用多尺度融合特征图保留更多上下文语义信息;在Transformer的Encoder中使用多尺度可变形自注意力机制,加快模型收敛速度;采用CIoU损失函数提高了裂缝检测的准确性。实验结果表明:改进模型的平均精度达83.7%,比DETR模型在精确率上提高7.4%,召回率上提升了10.9%。提出的改进模型可对沥青路面破损进行有效检测,可为航拍图像的沥青路面破损检测提供参考。 展开更多
关键词 破损检测 变形注意力 多尺度融合 CIoU 目标检测
下载PDF
基于时空Transformer的端到端的视频注视目标检测
4
作者 彭梦昊 王冠 +1 位作者 徐浩 景圣恩 《图像与信号处理》 2024年第2期190-209,共20页
注视目标检测旨在定位人的注视目标。HGTTR的提出,将Transformer结构用于注视目标检测的任务中,解决了卷积神经网络需要额外的头部探测器的问题,实现了端到端的对头部位置和注视目标的同时检测,并且实现了优于传统的卷积神经网络的性能... 注视目标检测旨在定位人的注视目标。HGTTR的提出,将Transformer结构用于注视目标检测的任务中,解决了卷积神经网络需要额外的头部探测器的问题,实现了端到端的对头部位置和注视目标的同时检测,并且实现了优于传统的卷积神经网络的性能。然而,目前的方法在视频数据集上的性能还有较大提升空间。原因在于,当前的方法侧重于在单个视频帧中学习人的注视目标,没有对视频中的时间变化进行建模,所以无法解决动态注视、镜头失焦、运动模糊等问题。当一个人的注视目标在不断的发生变化时,缺乏时间变化建模可能会导致定位注视目标偏离人的真实注视目标。并且由于缺乏对于时间维度上的建模,模型无法解决因为镜头失焦和运动模糊等问题所导致的特征缺失。在这项工作当中,我们提出了一种基于时空Transformer的端到端的视频注视目标检测模型。首先,我们提出帧间局部可变形注意力机制,用于处理特征缺失的问题。其次,我们在可变形注意力机制的基础上,提出帧间可变形注意力机制,利用相邻视频帧的时序差异,动态选择采样点,从而实现对于动态注视的建模。最后,我们提出了时序Transformer来聚合由当前帧和参考帧的注视关系查询向量和注视关系特征。我们的时序Transformer包含三个部分:用于编码多帧空间信息的时序注视关系特征编码器,用于融合注视关系查询的时序注视关系查询编码器以及用于获取当前帧检测结果的时序注视关系解码器。通过对于单个帧空间、相邻帧间以及帧序列三个维度的时空建模,很好的解决了视频数据中常见的动态注视、镜头失焦、运动模糊等问题。大量实验证明,我们的方法在VideoAttentionTarget和VideoCoAtt两个数据集上均取得了较为优异的性能。 展开更多
关键词 注视目标检测 TRANSFORMER 变形注意力 时序变化建模
下载PDF
基于多层级视频Transformer的视觉自动定位方法
5
作者 邹琦萍 李博涛 +2 位作者 陈赛安 郭茜 张桃红 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第6期34-43,共10页
工业自动化产线中,设备的异常检测直接决定加工质量,由机械臂和搭载于机械臂前端的工业相机构成的视觉系统可以有效监测此类异常。本文使用六轴机械臂搭载工业相机对工件表面进行成像,获取由模糊到清晰再到模糊的视频序列,以此选出最清... 工业自动化产线中,设备的异常检测直接决定加工质量,由机械臂和搭载于机械臂前端的工业相机构成的视觉系统可以有效监测此类异常。本文使用六轴机械臂搭载工业相机对工件表面进行成像,获取由模糊到清晰再到模糊的视频序列,以此选出最清晰的视频帧作为自动加工中有聚焦要求的距离指导,以进行聚焦异常修正,从而实现自动定位。提出一种基于多层级视频Transformer的视频分类模型多级视频Transformer(MLVT)用于高语义级别的视频表征学习,并用于选出视频序列中成像最清晰的帧。首先,提出一种具有多种感受野的token划分方法多级标记(MLT),能够将原始视频数据按2D图像补丁、3D图像补丁、帧和片段这4个层级划分成token序列,并在加入位置编码之后送入多级编码器(MLE)方法进行注意力的计算。为了缓解多层级的tokens带来的计算代价和收敛速度慢的问题,MLE引入一种逐层的可变形注意力机制逐层可变形注意力机制(LWLA),以一种可学习的方式代替全局注意力进行特征相似性的计算。最终,该方法3个版本的模型在本文的视频数据集上分别取得了87.2%、88.6%、88.9%的分类准确率,在与同参数量级的主流视频Transformer实验对比中均表现了最优的性能,有效地完成了从视频序列中选择出最清晰帧的任务,能够为下游视觉任务的性能提供强有力保障。 展开更多
关键词 视频Transformer 视频分类 视觉动定位 变形注意力
下载PDF
可变形特征融合网络的设计及在复杂天气电力设备图像处理中的应用
6
作者 董亚松 侯立群 《电力科学与工程》 2024年第7期1-9,共9页
针对复杂天气环境下电力设备图像模糊而造成电力设备识别与检测受到严重影响的问题,设计了可变形特征融合网络来实现图像清晰化,从而提高复杂天气环境下电力设备的检测精度。将可变形注意力作为编码器-解码器组件引入U-Net架构中。将特... 针对复杂天气环境下电力设备图像模糊而造成电力设备识别与检测受到严重影响的问题,设计了可变形特征融合网络来实现图像清晰化,从而提高复杂天气环境下电力设备的检测精度。将可变形注意力作为编码器-解码器组件引入U-Net架构中。将特征融合中间件作为连接上下文信息的桥梁,以此整合上下文信息并保留更多的空间细节信息。以指针式仪表图像为例,进行了指针式仪表图像去雨和指针式仪表自动读数实验。实验结果表明,所设计网络在指针表图像去雨方面有良好的效果,并提高了去雨后指针表的读数精度。 展开更多
关键词 设备 指针表 图像去雨 变形注意力 特征融合中间件
下载PDF
基于深度学习的竹笋细粒度识别技术
7
作者 段成鑫 赵霞 《软件工程》 2024年第12期30-33,共4页
为了提升不同环境中竹笋细粒度的自动化识别精度,提高生产管理效率,文章提出了一种基于YOLOv8的目标检测改进模型。该模型融合了BiFPN(Bidirectional Feature Pyramid Network),这一架构在图像目标检测和分割任务中表现出色,同时在C2f... 为了提升不同环境中竹笋细粒度的自动化识别精度,提高生产管理效率,文章提出了一种基于YOLOv8的目标检测改进模型。该模型融合了BiFPN(Bidirectional Feature Pyramid Network),这一架构在图像目标检测和分割任务中表现出色,同时在C2f模块中添加DAT(Vision Transformer with Deformable Attention),引入了可变形注意力机制,进一步提升了模型的性能。实验结果表明,改进后的算法模型对春笋和冬笋识别的平均精度均值(Mean Average Precision,mAP)分别为81.4%和94.7%,相较于原有模型,分别提升了0.9百分点和3.9百分点。改进后的算法模型在竹笋细粒度识别方面展现出较高的精度,为未来竹笋产业的高度智能化提供了技术支撑。 展开更多
关键词 细粒度识别 目标检测 变形注意力机制 多尺度特征 YOLOv8
下载PDF
基于可变形注意力机制的多模态3D目标检测算法
8
作者 韩邦彦 田青 《软件工程》 2024年第10期29-33,共5页
3D目标检测是自动驾驶技术的基础,融合激光点云和图像等模态的信息可以有效地提高目标检测的准确性和鲁棒性。文章改进了现有融合激光点云和图像等模态信息的3D目标检测网络,提出了一种新的并行融合模块,用于同时维护两种模态下的特征信... 3D目标检测是自动驾驶技术的基础,融合激光点云和图像等模态的信息可以有效地提高目标检测的准确性和鲁棒性。文章改进了现有融合激光点云和图像等模态信息的3D目标检测网络,提出了一种新的并行融合模块,用于同时维护两种模态下的特征信息,减少信息损失。此外,利用掩码特征增强模块,提高受遮挡物体的检测能力。在KITTI(Karlsruhe Institute of Technology and Toyota Technological Institute)数据集上进行了验证,实验结果表明,相比于基准网络,该方法有效提高了3D目标检测的性能,平均精度达到了77.41%,同时优于目前大多数的先进方法。 展开更多
关键词 3D目标检测 多模态融合 变形注意力机制
下载PDF
引入GAN与可变形注意力的多维人体运动分析 被引量:1
9
作者 孙文昊 路光达 +2 位作者 秦转萍 郭庭航 赵壮壮 《电子测量技术》 北大核心 2023年第16期78-88,共11页
研究了一种用于肢体状态评估和运动姿态校正的人体运动分析系统。首先,针对人体运动时易出现的遮挡等问题,通过引入可变形注意力和生成对抗网络优化人体关键点热图位置检测,在Transformer的基础上设计了一种人体关键点识别算法。其次,... 研究了一种用于肢体状态评估和运动姿态校正的人体运动分析系统。首先,针对人体运动时易出现的遮挡等问题,通过引入可变形注意力和生成对抗网络优化人体关键点热图位置检测,在Transformer的基础上设计了一种人体关键点识别算法。其次,利用所提出的算法,结合人体姿态的肢体空间约束关系以及体态分析相关知识,设计了一套运动分析系统。最后,通过在公共数据集上和真实场景中的测试,从质化和量化两个角度对所提出的算法和系统的可行性进行了评估实验。实验结果证明,本文算法在公共数据集上的检测精度最高可达93.7%;在实际场景的测试中,本文设计的算法和运动分析系统可以有效解决人体姿态识别中常见的遮挡等问题,并通过可视化系统展示了对人体运动姿态的多维度分析结果。 展开更多
关键词 人体运动分析 人体关键点检测 TRANSFORMER 生成对抗网络 变形注意力
下载PDF
基于可变形注意力Transformer的场景文本检测
10
作者 刘恒 陈姚节 许晓峰 《计算机与数字工程》 2023年第9期2060-2066,2136,共8页
目前在场景文本检测领域中,基于深度学习的检测算法已经取代了传统的文本检测算法。针对在深度学习算法中基于分割的方法和基于边界框回归的两类方法被广泛的应用在文本检测当中的情形,提出了基于可变形注意力Transformer的场景文本检... 目前在场景文本检测领域中,基于深度学习的检测算法已经取代了传统的文本检测算法。针对在深度学习算法中基于分割的方法和基于边界框回归的两类方法被广泛的应用在文本检测当中的情形,提出了基于可变形注意力Transformer的场景文本检测算法。首先,在采用ResNet残差网络作为骨干网络的基础上引入了Transformer编解码结构,以此将检测的目标聚焦至文本上;然后,在Transformer编解码结构中添加了可变形注意力机制,有利于让模型只关注参考点附近少量的关键采样点,降低高分辨率特征图的计算复杂度,缓解小目标文本检测困难的问题。通过在ICDAR 2013、ICDAR 2015、MSRA-TD 500与论文的场景文本数据集上的实验结果表明,与传统的深度学习主流方法相比,从F1score与Ap等实验指标上验证了算法的有效性与先进性。 展开更多
关键词 文本检测 TRANSFORMER 变形注意力机制 深度学习
下载PDF
基于多尺度渐进式特征融合的伪装目标检测
11
作者 高彤玉 张丽红 《网络新媒体技术》 2024年第2期27-34,44,共9页
伪装目标检测任务中目标和所处环境具有极大的相似性,只通过简单的特征提取容易使得重要信息丢失,此外,直接聚合不同层特征会引入噪声,导致预测不准确。针对这些问题,本文提出一种基于多尺度渐进式特征融合的伪装目标检测网络。该网络... 伪装目标检测任务中目标和所处环境具有极大的相似性,只通过简单的特征提取容易使得重要信息丢失,此外,直接聚合不同层特征会引入噪声,导致预测不准确。针对这些问题,本文提出一种基于多尺度渐进式特征融合的伪装目标检测网络。该网络采用金字塔视觉Transformer作为骨干网络提取多尺度特征,利用可变形注意力对提取的多尺度特征增强,以突出伪装目标的边界;然后通过渐进式特征融合模块递增式融合相邻层特征,积累难以分辨但有效的信息,避免非相邻层之间较大语义差距;在融合过程中引入自适应空间融合操作,以减少在同一空间位置发生信息冲突问题;最终输出预测结果,实现伪装目标检测。模型在COD10K和CAMO组成的训练集上进行训练,实验结果表明本文方法与其他方法相比具有较明显优势。 展开更多
关键词 伪装目标检测 金字塔视觉Transformer 变形注意力 渐进式特征融合 适应空间融合
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部