-
题名改进YOLOv5s的无人机视角下小目标检测算法
被引量:11
- 1
-
-
作者
吴明杰
云利军
陈载清
钟天泽
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
-
出处
《计算机工程与应用》
CSCD
北大核心
2024年第2期191-199,共9页
-
基金
云南省教育厅科学研究基金(2023Y0533)。
-
文摘
针对无人机飞行时与目标距离较远,被拍摄的目标大小有明显的差异且存在被物体遮挡等问题,提出一种基于YOLOv5s的无人机视角下小目标检测改进算法BD-YOLO。在特征融合网络中采用双层路由注意力(bi-level routing attention,BRA),其以动态稀疏的方式过滤特征图中最不相关的特征,保留部分重要区域特征,从而提高模型特征提取的能力;由于特征图经过多次下采样后会丢失大量位置信息和特征信息,因此采用一种结合注意力机制的动态目标检测头DyHead(dynamic head),该检测头通过尺度感知、空间感知和任务感知的三者统一,以实现更强的特征表达能力;使用Focal-EIoU损失函数,来解决YOLOv5s中CIoU Loss计算回归结果不准确的问题,从而提高模型对小型目标的检测精度。实验结果表明,在VisDrone2019-DET数据集上,BD-YOLO模型较YOLOv5s模型在平均精度(mAP@0.5)指标上提高了0.062,对比其他主流模型对于小目标的检测都有更好的效果。
-
关键词
无人机视角
YOLOv5s
小目标
注意力机制
损失函数
-
Keywords
unmanned aerial vehicle perspective
YOLOv5s
small object
attention mechanism
loss function
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于改进YOLOX的自然环境下核桃识别算法研究
- 2
-
-
作者
钟正扬
云利军
杨璇玺
陈载清
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
云南省林业调查规划院生态分院卫星林业应用中心
-
出处
《河南农业科学》
北大核心
2024年第1期152-161,共10页
-
基金
云南省教育厅科学研究基金项目(2023Y0533)。
-
文摘
针对现有目标检测算法对自然环境下核桃识别存在漏检、误检等问题,提出了一种基于Swin Transformer多层特征融合改进的YOLOX-S核桃识别算法。首先,在主干特征提取网络中引入基于Swin Transformer的多层特征融合模块,借助Swin Transformer的多头注意力机制对小目标的特征信息进行提取并与特征图进行融合,可以有效解决因网络层数加深导致的高层特征图中小目标特征信息丢失问题;其次,为了提高算法的检测精度,引入更高效的Repblock模块对原网络中的CSP模块进行替换;最后,为了提高下采样效果,使用更为优秀的Transition Block模块作为主干特征提取网络的下采样模块。结果表明,改进后的YOLOX-S模型在采集的自然环境下核桃数据集上平均精度AP50达到96.72%,分别比Faster-RCNN、YOLOv5-S、YOLOX-S算法提高7.36、1.38、0.62百分点,检测速度达到46 f/s,模型参数大小为20.55 M。改进后的YOLOX-S算法具有更好的精度,改善了漏检和误检问题,对自然环境下的核桃有更好的识别效果。
-
关键词
核桃识别
Swin
Transformer
多层特征融合模块
YOLOX-S
深度学习
-
Keywords
Walnut detection
Swin Transformer
Multi-layer feature fusion module
YOLOX-S
Deep learning
-
分类号
S664.1
[农业科学—果树学]
S126
[农业科学—园艺学]
-
-
题名基于知识蒸馏的步态识别方法
- 3
-
-
作者
李若愚
云利军
金雪松
杨彦辰
程飞燕
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
玉溪市第二人民医院信息网络中心
-
出处
《云南师范大学学报(自然科学版)》
2024年第2期49-53,共5页
-
基金
国家自然科学基金资助项目(62265017)
云南师范大学研究生科研创新基金资助项目(YJSJJ23-B181)。
-
文摘
针对步态识别中网络模型复杂度高、参数量大、训练测试速度慢等问题,提出一种基于知识蒸馏的步态识别方法.通过知识蒸馏方法对ConvNext-KD模型进行训练,在不增加新训练数据集、模型复杂度和模型参数量的前提下,提高ConvNext-KD模型的识别准确率.该方法在中科院CASIA-B和CASIA-C数据库中进行多次仿真实验.结果表明,ConvNext-KD模型在保持较小参数量和较低复杂度的同时,可以显著缩短训练测试的时长并取得较高识别准确率.
-
关键词
步态识别
知识蒸馏
ConvNext
-
Keywords
Gait recognition
Knowledge distillation
ConvNext
-
分类号
TN219
[电子电信—物理电子学]
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名基于模糊特征簇的空间高效用并置模式挖掘算法
- 4
-
-
作者
金佩洁
王晓璇
熊文
王丽珍
高嵩
-
机构
云南师范大学信息学院
云南省教育厅计算机视觉与智能控制技术工程研究中心
云南大学滇池学院
云南大学软件学院
-
出处
《计算机技术与发展》
2024年第12期132-140,共9页
-
基金
国家自然科学基金项目(62366061)
云南省基础研究计划项目(202301AU070152,202401AT070133)。
-
文摘
实例经常出现在相邻区域的空间特征集被称为空间并置模式。空间高效用并置模式是空间并置模式挖掘的一项扩展性研究,其考虑了模式的效用价值,更能反映出空间特征间的高质量聚集现象。现有的空间高效用并置模式挖掘方法大多使用自适应的效用参与度(Utility Participation Index, UPI)作为度量参数。然而,UPI没有考虑真实地理环境中“邻近”概念的模糊性和重叠性。此外,由于UPI不满足向下闭合性,算法的挖掘效率也不够理想。因此,该文结合模糊集理论构建了空间模糊邻近关系,提出了新的模糊效用度计算方法。同时,引入了模糊Chameleon聚类算法,提取了基于模糊特征效用度的模糊特征簇,从而进一步提取空间高效用并置模式。最后,在三个模拟数据集和两个真实数据集上进行了大量的实验,证明了该算法的合理性及有效性。
-
关键词
空间数据挖掘
空间并置模式
高效用
模糊聚类
模糊特征簇
-
Keywords
spatial data mining
spatial co-location pattern
high utility
fuzzy clustering
fuzzy feature cluster
-
分类号
TP306.1
[自动化与计算机技术—计算机系统结构]
-
-
题名基于改进YOLOv5s的复杂道路交通目标检测算法
被引量:1
- 5
-
-
作者
汤林东
云利军
罗瑞林
卢琳
-
机构
云南师范大学信息学院
云南师范大学云南省教育厅计算机视觉与智能控制技术工程研究中心
云南省烟草烟叶公司
-
出处
《郑州大学学报(工学版)》
CAS
北大核心
2024年第3期64-71,共8页
-
基金
国家自然科学基金资助项目(62265017)。
-
文摘
针对目前自动驾驶场景下交通目标检测算法抗复杂背景干扰能力弱,导致检测性能不足的问题,提出了一种改进YOLOv5s的复杂道路交通目标检测算法。首先,在特征提取区域,采用多头自注意残差模块(MHSARM)来强化待检目标特征信息,弱化复杂背景干扰;其次,在特征融合区域,采用CoordConv代替传统Conv,使网络具备空间信息感知能力,提升网络检测精度。在开源数据集Kitti及BDD100K上的实验结果表明:改进YOLOv5s算法在复杂道路中具备更强的特征提取能力及良好的泛化能力,mAP_0.5分别达到93.3%和47.4%,与YOLOv5s相比,分别提升了0.9%和1.4%。另外,改进YOLOv5s相较于目前最新的目标检测算法YOLOv7、YOLOv8,mAP_0.5分别提高了1.3%和2.2%,与在Kitti数据集上最新的研究成果Sim-YOLOv4算法相比,mAP_0.5提高了2.2%。
-
关键词
自动驾驶
目标检测
YOLOv5s
MHSARM
CoordConv
-
Keywords
automatic driving
target detection
YOLOv5s
MHSARM
CoordConv
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名VR显示器中视差线索对伽马估计的影响
- 6
-
-
作者
彭毅钧
陈载清
云利军
-
机构
云南师范大学信息学院
云南师范大学云南省教育厅计算机视觉与智能控制技术工程研究中心
云南师范大学云南省光电信息技术重点实验室
-
出处
《云南民族大学学报(自然科学版)》
CAS
2024年第1期95-101,共7页
-
基金
国家自然科学基金(61865015,61875171,62165019).
-
文摘
虚拟现实(virtual reality,VR)头戴立体显示器能够呈现视差线索,从而产生具有深度感的沉浸式交互体验.基于显示器伽马值人眼视觉估计方案,本文开展实验探讨了VR显示器中不同视差线索对伽马值估计的影响.实验要求被试者使用Unity开发的VR显示器伽马值人眼视觉估计软件,在不同视差下对VR显示器伽马值进行估计,并将估计结果与光谱仪PR715测量结果进行对比.实验结果表明,当视差为-40弧分时,人眼视觉估计VR显示器伽马值的准确度最高,估计误差为0.045,当虚拟深度从近距离(-40弧分视差)到远距离(+120弧分视差)变化时,人眼视觉估计误差由0.045增大到0.190,当虚拟深度从远距离(-40弧分视差)到近距离(-120弧分视差)时,人眼视觉估计误差由0.045增大到0.105.实验结果表明视差线索对被试者视觉估计VR显示器伽马值产生了影响.
-
关键词
视差
人眼视觉估计
虚拟现实显示器
伽马值
-
Keywords
disparity
human vision estimation
VR head-mounted display
Gamma
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-