针对行人检测在复杂环境下存在的高误检率和丢失率问题,提出了一种基于YOLOv5s的改进模型YOLOv5s-RFDH。该模型在保留YOLOv5s基线网络的基础上,在特征提取和检测部分进行了优化改进,以提高行人检测在复杂场景中的准确性和鲁棒性。针对Cr...针对行人检测在复杂环境下存在的高误检率和丢失率问题,提出了一种基于YOLOv5s的改进模型YOLOv5s-RFDH。该模型在保留YOLOv5s基线网络的基础上,在特征提取和检测部分进行了优化改进,以提高行人检测在复杂场景中的准确性和鲁棒性。针对CrowdHuman数据集和WiderPerson数据集进行行人目标检测。以上数据集行人密集且存在大量遮挡,因此,采用了K-Means++聚类算法来重新聚类数据集以获取适合数据的锚框;引入感受野模块(Receptive Field Block,RFB)来进行特征提取,在不同分支中使用空洞卷积增加感受野从而提取更深层次的特征信息,并最终将这些特征融合在一起,提升了小目标行人的检测精度;解耦头可以解决目标检测中的尺度不变性问题,引入解耦检测头将分类和回归任务分离,从而能够更加准确地检测到不同尺度和大小的目标。在CrowdHuman数据集和WiderPerson数据集划分出的测试集上进行对比实验,结果表明,改进后的模型在检测准确率上得到提升,丢失率有所下降,在以上两个不同数据集上检测准确率分别提升1.4%和1.2%,丢失率分别降低2.0%和1.7%。展开更多
北京地区珍稀鸟类的保护对维护当地生物多样性具有重要意义。随着人工智能技术的发展,利用深度学习技术自动识别鸟类成为鸟类调查保护的重要手段。实际鸟类图像存在背景复杂以及相近科属鸟类具有外观相似等特点,导致模型识别精度不佳。...北京地区珍稀鸟类的保护对维护当地生物多样性具有重要意义。随着人工智能技术的发展,利用深度学习技术自动识别鸟类成为鸟类调查保护的重要手段。实际鸟类图像存在背景复杂以及相近科属鸟类具有外观相似等特点,导致模型识别精度不佳。针对以上问题,本文提出一种基于TC-YOLO模型的鸟类识别方法。首先,为解决鸟类识别中复杂背景导致的漏检问题,本文方法结合CARAFE(content-aware reassembly of features)机制,自适应生成不同特征点所对应的上采样核,在更大的感受野内聚合上下文语义信息,有效聚焦鸟类前景区域。其次,为解决鸟类识别中相似外观导致的误检问题,本文方法引入TSCODE(task-specificcontextdecoupling)解耦定位和分类任务,通过获取多层级特征图的信息以回归目标边界,并利用包含底层纹理和高层语义的特征进行物种分类,进而提高模型的鸟类识别精度。最后,本文开展对比实验以验证模型的性能。实验结果表明,TC-YOLO模型的平均精度均值在包含北京地区28种国家一级保护鸟类的自建数据集Beijing-28和鸟类公开数据集CUB200-2011上分别达到78.7%和75.3%,均优于已有方法,而且在公开数据集MS COCO上验证了TC-YOLO模型拥有较强的泛化性。本文提出的TC-YOLO模型对背景复杂或外观相似的鸟类图像都能有效识别,漏检率和误检率较低,能够为鸟类保护提供重要技术支撑。展开更多
为提高无人机对架空输电线路巡检的效率和线路中螺栓缺销的检测精度,提出了改进的你只看一次第7微小版(you only look once version 7-tiny,YOLOv7-tiny)输电线路螺栓缺销检测算法。该算法采用高效的分布移位卷积(distribution shifting...为提高无人机对架空输电线路巡检的效率和线路中螺栓缺销的检测精度,提出了改进的你只看一次第7微小版(you only look once version 7-tiny,YOLOv7-tiny)输电线路螺栓缺销检测算法。该算法采用高效的分布移位卷积(distribution shifting convolution,DSConv)来替换YOLOv7-tiny网络中的3×3卷积,以提高模型的计算速度并降低计算复杂度;在模型的检测头部分,添加了高效解耦头结构,以提高模型的准确度和稳定性;并采用明智的交并比(wise intersection over union,WIoU)损失函数来提高正样本的权重,使模型更加关注缺销螺栓目标,以减少正负样本不平衡带来的噪声干扰。实验结果表明,改进YOLOv7-tiny算法对输电线路螺栓缺销检测的平均精度均值达到90.6%,检测速度达到143.0帧/s,同时实现了检测的高速度和高精度。该算法在无人机输电线路巡检中具有一定的优势。展开更多
文摘针对行人检测在复杂环境下存在的高误检率和丢失率问题,提出了一种基于YOLOv5s的改进模型YOLOv5s-RFDH。该模型在保留YOLOv5s基线网络的基础上,在特征提取和检测部分进行了优化改进,以提高行人检测在复杂场景中的准确性和鲁棒性。针对CrowdHuman数据集和WiderPerson数据集进行行人目标检测。以上数据集行人密集且存在大量遮挡,因此,采用了K-Means++聚类算法来重新聚类数据集以获取适合数据的锚框;引入感受野模块(Receptive Field Block,RFB)来进行特征提取,在不同分支中使用空洞卷积增加感受野从而提取更深层次的特征信息,并最终将这些特征融合在一起,提升了小目标行人的检测精度;解耦头可以解决目标检测中的尺度不变性问题,引入解耦检测头将分类和回归任务分离,从而能够更加准确地检测到不同尺度和大小的目标。在CrowdHuman数据集和WiderPerson数据集划分出的测试集上进行对比实验,结果表明,改进后的模型在检测准确率上得到提升,丢失率有所下降,在以上两个不同数据集上检测准确率分别提升1.4%和1.2%,丢失率分别降低2.0%和1.7%。
文摘北京地区珍稀鸟类的保护对维护当地生物多样性具有重要意义。随着人工智能技术的发展,利用深度学习技术自动识别鸟类成为鸟类调查保护的重要手段。实际鸟类图像存在背景复杂以及相近科属鸟类具有外观相似等特点,导致模型识别精度不佳。针对以上问题,本文提出一种基于TC-YOLO模型的鸟类识别方法。首先,为解决鸟类识别中复杂背景导致的漏检问题,本文方法结合CARAFE(content-aware reassembly of features)机制,自适应生成不同特征点所对应的上采样核,在更大的感受野内聚合上下文语义信息,有效聚焦鸟类前景区域。其次,为解决鸟类识别中相似外观导致的误检问题,本文方法引入TSCODE(task-specificcontextdecoupling)解耦定位和分类任务,通过获取多层级特征图的信息以回归目标边界,并利用包含底层纹理和高层语义的特征进行物种分类,进而提高模型的鸟类识别精度。最后,本文开展对比实验以验证模型的性能。实验结果表明,TC-YOLO模型的平均精度均值在包含北京地区28种国家一级保护鸟类的自建数据集Beijing-28和鸟类公开数据集CUB200-2011上分别达到78.7%和75.3%,均优于已有方法,而且在公开数据集MS COCO上验证了TC-YOLO模型拥有较强的泛化性。本文提出的TC-YOLO模型对背景复杂或外观相似的鸟类图像都能有效识别,漏检率和误检率较低,能够为鸟类保护提供重要技术支撑。
文摘为提高无人机对架空输电线路巡检的效率和线路中螺栓缺销的检测精度,提出了改进的你只看一次第7微小版(you only look once version 7-tiny,YOLOv7-tiny)输电线路螺栓缺销检测算法。该算法采用高效的分布移位卷积(distribution shifting convolution,DSConv)来替换YOLOv7-tiny网络中的3×3卷积,以提高模型的计算速度并降低计算复杂度;在模型的检测头部分,添加了高效解耦头结构,以提高模型的准确度和稳定性;并采用明智的交并比(wise intersection over union,WIoU)损失函数来提高正样本的权重,使模型更加关注缺销螺栓目标,以减少正负样本不平衡带来的噪声干扰。实验结果表明,改进YOLOv7-tiny算法对输电线路螺栓缺销检测的平均精度均值达到90.6%,检测速度达到143.0帧/s,同时实现了检测的高速度和高精度。该算法在无人机输电线路巡检中具有一定的优势。