期刊文献+
共找到148篇文章
< 1 2 8 >
每页显示 20 50 100
多尺度残差挤压和激励的双U舌图分割网络
1
作者 梁淑芬 解竞一 +1 位作者 吴岑 秦传波 《五邑大学学报(自然科学版)》 CAS 2024年第2期55-63,共9页
在图像分割中,单次卷积和频繁的池化操作容易产生冗余信息或遗漏关键信息.本文设计了一种多尺度的残差挤压和激励注意力的双U形分割网络(MRSEA-DUNet)来解决上述问题.首先,该网络由两个U形的网络组成,分别是预编码网络和精确分割网络.... 在图像分割中,单次卷积和频繁的池化操作容易产生冗余信息或遗漏关键信息.本文设计了一种多尺度的残差挤压和激励注意力的双U形分割网络(MRSEA-DUNet)来解决上述问题.首先,该网络由两个U形的网络组成,分别是预编码网络和精确分割网络.为避免频繁的卷积和池化操作导致信息丢失或产生无效信息,提出了具有不同大小感受野的阶梯卷积模块(SCM),并采用并行结构,可以在不同尺度上捕获更丰富、更详细的特征.其次,还设计了一种残差挤压和激励注意力模块(RSEAM),可以通过空间和通道提高有效特征增益,消除冗余信息,并且提高了模型的整体鲁棒性.最后,为了减少了降采样操作的数量,简化了纵向复杂度.实验结果表明,本文MRSEA-DUNet模型的精度、Jaccard系数和Dice系数分别达到0.995 4、 0.979 4和0.989 5,均优于其他7种主流模型,优化了分割效果. 展开更多
关键词 医学影像分割 挤压与激励 注意力机制 感受野 多尺度 残差机制
下载PDF
基于MobileNetV3卷积神经网络的供水管道漏损音频分类
2
作者 陈双叶 徐雷桁 +3 位作者 黄成意 张智武 张林 韩默 《北京工业大学学报》 CAS CSCD 北大核心 2024年第7期797-804,共8页
为了对城市供水管网漏损音进行准确识别,提出一种基于MobileNetV3的供水管道漏损音频分类识别方法。首先将ROPP数据集中的音频文件进行离线数据增强,将漏损信号转变为对数梅尔谱图并采用谱减法实现数据降噪;然后使用注意力机制模块与Mob... 为了对城市供水管网漏损音进行准确识别,提出一种基于MobileNetV3的供水管道漏损音频分类识别方法。首先将ROPP数据集中的音频文件进行离线数据增强,将漏损信号转变为对数梅尔谱图并采用谱减法实现数据降噪;然后使用注意力机制模块与MobileNetV3网络训练识别并提取图像特征;最后使用Softmax函数对漏损音频进行分类。实验结果表明,该方法可以使漏水类别的分类精确度达到99.40%,召回率达到99.20%。 展开更多
关键词 声音事件分类 水管泄漏检测 MobileNetV3 数据增强 谱减法 压缩奖惩网络模块
下载PDF
基于FCN的路面裂缝分割算法 被引量:5
3
作者 韩静园 王育坚 +1 位作者 谭卫雄 李深圳 《传感器与微系统》 CSCD 北大核心 2022年第6期146-149,共4页
为了准确地对路面裂缝进行分割,提高复杂背景下路面裂缝分割的效果,将全卷积神经网络(FCN)用于路面裂缝分割。考虑FCN无法对裂缝边缘、图案和形状等特征分配权重,提出一种基于FCN的路面裂缝分割改进算法。通过分析特征通道之间的关系,在... 为了准确地对路面裂缝进行分割,提高复杂背景下路面裂缝分割的效果,将全卷积神经网络(FCN)用于路面裂缝分割。考虑FCN无法对裂缝边缘、图案和形状等特征分配权重,提出一种基于FCN的路面裂缝分割改进算法。通过分析特征通道之间的关系,在FCN的池化层加入挤压和激励模块。利用权重对原始特征在通道上进行重标定,以提升重要特征和抑制无用特征,自适应地为裂缝边缘、图案和形状等特征分配权重。使用真实的路面裂缝数据集对改进模型进行训练,完成了模型的测试和验证。实验结果表明:改进模型的路面分割效果良好,分割结果的误检率、漏检率和DSC综合评价指标等都有较好的改善。 展开更多
关键词 全卷积神经网络 裂缝 挤压和激励 图像分割
下载PDF
基于SE-ResNet的机器人最优抓取姿态检测方法 被引量:1
4
作者 杨华 宋卓著 +1 位作者 吴杰宏 高利军 《传感器与微系统》 CSCD 北大核心 2023年第5期112-116,共5页
为了提高机器人在抓取物体时成功率和速度,提出了一种基于SE-ResNet的生成式机器人抓取位置检测模型。模型通过输入的RGB-D图像直接生成对应的抓取映射图,ResNet解决了深度模型的退化问题,在此基础上引入挤压和激励机制,让模型使用全局... 为了提高机器人在抓取物体时成功率和速度,提出了一种基于SE-ResNet的生成式机器人抓取位置检测模型。模型通过输入的RGB-D图像直接生成对应的抓取映射图,ResNet解决了深度模型的退化问题,在此基础上引入挤压和激励机制,让模型使用全局信息来增强有用信息,并抑制无用信息。选择Jaccard指数作为抓取检测的评价标准。实验结果表明,该方法在Cornell数据集上的准确率高达98.9%。搭建了基于PyBullet物理仿真环境的抓取检测平台,使用Panda机械臂对Egad评估集中的各个难度的物体抓取表现良好,在提高抓取检测的成功率的同时,保证了实时性。 展开更多
关键词 抓取检测 机器人抓取 深度学习 挤压与激励
下载PDF
基于胶囊网络的TIG熔透预测 被引量:1
5
作者 王颖 高胜 吴立明 《焊接》 北大核心 2023年第4期15-20,28,共7页
以钨极气体保护焊(tungsten inert gas welding,TIG)熔透预测作为研究对象,文中提出了一种基于胶囊网络(capsule network,CapsNet)的熔透预测模型,并在模型中引入压缩奖惩网络模块(squeeze-excitation,SE模块)来提高模型的精度及训练速... 以钨极气体保护焊(tungsten inert gas welding,TIG)熔透预测作为研究对象,文中提出了一种基于胶囊网络(capsule network,CapsNet)的熔透预测模型,并在模型中引入压缩奖惩网络模块(squeeze-excitation,SE模块)来提高模型的精度及训练速度。模型以焊接区的熔池正面图像作为输入,利用卷积层提取浅层特征,并通过压缩奖惩网络模块自适应提取不同特征的重要程度,依据重要程度调节特征图,再传递至胶囊层,采用动态路由算法迭代更新胶囊层间的耦合系数,最终获得3种熔透状态(未熔透、熔透、过熔透)的预测结果。迭代次数为70、激活函数选线性整流函数(linear rectification function,ReLU)、卷积层数为2层、胶囊层数为2层时模型在预测准确率和训练时间上表现最佳。为了进一步验证所提模型的性能,分别与传统胶囊网络,AlexNet和VGG19进行了对比分析。结果表明,改进后的胶囊神经网络能够有效地预测焊缝的熔透状态,在小样本数据集上表现较稳定,精度较高。 展开更多
关键词 熔透预测 胶囊网络 压缩奖惩网络模块 图像处理
下载PDF
联合语义分割和深度估计的多任务学习研究
6
作者 罗会兰 叶桔 《计算机科学》 CSCD 北大核心 2023年第S01期171-180,共10页
语义分割和深度估计任务是对图像像素级分类的研究,是两个高度相关的任务。从共享特征学习和特征交互融合两个角度出发,提出两个不同的多任务学习架构,即基于压缩激励模块(Squeeze-and-Excitation,SE)和金字塔池化的多任务学习网络(Mult... 语义分割和深度估计任务是对图像像素级分类的研究,是两个高度相关的任务。从共享特征学习和特征交互融合两个角度出发,提出两个不同的多任务学习架构,即基于压缩激励模块(Squeeze-and-Excitation,SE)和金字塔池化的多任务学习网络(Multi-task Learning with SE and Pyramid Pooling,MTL_SPP),以及基于压缩激励和可选择权重(Selective Weight,SW)的多任务学习网络(Multi-task Learning with SE and Selective Weights,MTL_SSW),来联合学习语义分割和深度估计。MTL_SPP架构由共享骨干特征网络和任务特定的子网络组成,利用SE模块构建任务特定子网络,并利用金字塔池化增强特征提取。MTL_SSW在MTL_SPP的基础上,让任务特定子网络的语义分割特征和深度估计特征通过SW模块进行相互指导和优化,学习对特定任务更具判别性的特征。实验结果表明,提出的两种方法在NYUD_v2和SUNRGBD两个数据集上获得了优于先进方法的效果。 展开更多
关键词 多任务学习 语义分割 深度估计 压缩激励 可选择权重
下载PDF
压缩激励机制驱动的尿液细胞图像分类算法 被引量:4
7
作者 宋建锋 韦玥 +2 位作者 苗启广 权义宁 陈毓生 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2020年第2期39-45,59,共8页
针对尿液有形成分细胞图像的分类问题,提出了一种压缩激励机制驱动的GoogLeNet尿液细胞图像分类算法。该算法采用特征重标定机制,通过压缩操作和激励操作显式地建模Inception架构在训练过程中学习到的细胞特征通道之间的依赖关系,从而... 针对尿液有形成分细胞图像的分类问题,提出了一种压缩激励机制驱动的GoogLeNet尿液细胞图像分类算法。该算法采用特征重标定机制,通过压缩操作和激励操作显式地建模Inception架构在训练过程中学习到的细胞特征通道之间的依赖关系,从而提升有用特征在当前任务中的重要程度。在尿液细胞数据集上的对比实验结果表明,在保证执行速度的情况下,该算法比GoogLeNet网络的分类准确率提升了3%,召回率提升了1%,具有更好的分类效果。 展开更多
关键词 尿液细胞 压缩激励 特征重标定 图像分类
下载PDF
基于双流快速区域卷积神经网络改进的人体动作识别算法 被引量:4
8
作者 郭如意 金杰 +2 位作者 刘高华 刘凯燕 姜诗祺 《激光与光电子学进展》 CSCD 北大核心 2020年第24期338-342,共5页
深度神经网络在静态图像领域已取得突破性进展,并逐步扩展到视频识别领域。人体动作识别是视频识别领域的研究热点和难点,因此,提出了一种基于双流快速区域卷积神经网络(Faster RCNN)改进的人体动作识别算法。首先,用RGB(Red,Green,Blue... 深度神经网络在静态图像领域已取得突破性进展,并逐步扩展到视频识别领域。人体动作识别是视频识别领域的研究热点和难点,因此,提出了一种基于双流快速区域卷积神经网络(Faster RCNN)改进的人体动作识别算法。首先,用RGB(Red,Green,Blue)图像和光流数据作为网络的输入,分别训练Faster RCNN;然后,将训练好后的网络模型进行融合,并引入改进的压缩和激励模块对特征通道进行处理,以突出重要特征;最后,用完全的交并比损失函数作为边框回归损失函数,以优化某些预测框与真实框不能相交等问题。实验结果表明,相比传统的Faster RCNN,本算法在动作识别数据集UCF101上的准确率得到了一定的提高。 展开更多
关键词 机器视觉 双流快速区域卷积神经网络 人体动作识别 压缩与激励 交并比损失函数
原文传递
嵌入压缩—激励机制ResNet的民族药植物图像识别
9
作者 周婷 杜建强 +1 位作者 朱彦陈 冯振乾 《软件导刊》 2023年第2期1-7,共7页
针对民族药植物图像数据集稀缺、样本量少、图像背景复杂以致图像特征提取困难的问题,构建TibetanMP数据集,提出一种嵌入压缩—激励机制ResNet并结合迁移学习的图像识别方法。该方法对ResNet34在ImageNet上的预训练模型进行迁移学习,以... 针对民族药植物图像数据集稀缺、样本量少、图像背景复杂以致图像特征提取困难的问题,构建TibetanMP数据集,提出一种嵌入压缩—激励机制ResNet并结合迁移学习的图像识别方法。该方法对ResNet34在ImageNet上的预训练模型进行迁移学习,以减少过拟合现象,同时在网络浅层中引入SE机制,使网络聚焦图像中的关键特征,最后对模型进行微调。为了评估所提方法的性能,在TibetanMP、Oxford 102 flowers和CIFAR-10数据集上进行实验,模型分别取得96.33%、98.81%和91.92%的识别准确率。与其他主流CNN图像识别模型进行比较,发现该模型具有更高的识别精度,具有一定的工程实用性。 展开更多
关键词 图像识别 民族药植物图像 ResNet 压缩激励 迁移学习
下载PDF
Sea-Land Segmentation of Remote Sensing Images Based on SDW-UNet
10
作者 Tianyu Liu Pengyu Liu +3 位作者 Xiaowei Jia Shanji Chen Ying Ma Qian Gao 《Computer Systems Science & Engineering》 SCIE EI 2023年第5期1033-1045,共13页
Image segmentation of sea-land remote sensing images is of great importance for downstream applications including shoreline extraction,the monitoring of near-shore marine environment,and near-shore target recognition.... Image segmentation of sea-land remote sensing images is of great importance for downstream applications including shoreline extraction,the monitoring of near-shore marine environment,and near-shore target recognition.To mitigate large number of parameters and improve the segmentation accuracy,we propose a new Squeeze-Depth-Wise UNet(SDW-UNet)deep learning model for sea-land remote sensing image segmentation.The proposed SDW-UNet model leverages the squeeze-excitation and depth-wise separable convolution to construct new convolution modules,which enhance the model capacity in combining multiple channels and reduces the model parameters.We further explore the effect of position-encoded information in NLP(Natural Language Processing)domain on sea-land segmentation task.We have conducted extensive experiments to compare the proposed network with the mainstream segmentation network in terms of accuracy,the number of parameters and the time cost for prediction.The test results on remote sensing data sets of Guam,Okinawa,Taiwan China,San Diego,and Diego Garcia demonstrate the effectiveness of SDW-UNet in recognizing different types of sea-land areas with a smaller number of parameters,reduces prediction time cost and improves performance over other mainstream segmentation models.We also show that the position encoding can further improve the accuracy of model segmentation. 展开更多
关键词 Sea-land segmentation UNet depth-wise separable convolution squeeze-excitation position encoding
下载PDF
基于挤压激励的轻量化注意力机制模块 被引量:3
11
作者 吕振虎 许新征 张芳艳 《计算机应用》 CSCD 北大核心 2022年第8期2353-2360,共8页
针对向卷积神经网络(CNN)中嵌入注意力机制模块以提高模型应用精度导致参数和计算量增加的问题,提出基于挤压激励的轻量化高度维度挤压激励(HD-SE)模块和宽度维度挤压激励(WD-SE)模块。为了充分利用特征图中潜在的信息,HD-SE对卷积层输... 针对向卷积神经网络(CNN)中嵌入注意力机制模块以提高模型应用精度导致参数和计算量增加的问题,提出基于挤压激励的轻量化高度维度挤压激励(HD-SE)模块和宽度维度挤压激励(WD-SE)模块。为了充分利用特征图中潜在的信息,HD-SE对卷积层输出的特征图在高度维度上进行挤压激励操作,获得高度维度上的权重信息;而WD-SE在宽度维度上进行挤压激励操作,以得到特征图宽度维度上的权重信息;然后,将得到的权重信息分别应用于对应维度的特征图张量,以提高模型的应用精度。将HD-SE与WD-SE分别嵌入VGG16、ResNet56、MobileNetV1和MobileNetV2模型中,在CIFAR10和CIFAR100数据集上进行的实验结果表明,与挤压激励(SE)模块、协调注意力(CA)模块、卷积块注意力模块(CBAM)和高效通道注意力(ECA)模块等先进的注意力机制模块相比,HD-SE与WDSE在向网络模型中增加的参数和计算量更少的同时得到的精度相似或者更高。 展开更多
关键词 卷积神经网络 挤压激励 轻量化 多维度 注意力机制模块
下载PDF
基于3DSEU-Net不确定性循环焦点平均教师的半监督脑肿瘤分割
12
作者 段逸凡 肖洪兵 Rahman Md Mostafizur 《中国医学物理学杂志》 CSCD 2023年第9期1121-1126,共6页
准确、完整地定位和分割脑肿瘤对脑胶质瘤患者的存活率以及治疗方案的确定起着决定性作用。在三维核磁共振影像(MRI)中,生成准确的注释需要大量的专业知识和时间成本,使用少量有标签数据与大量无标签数据进行半监督学习更加符合实际的... 准确、完整地定位和分割脑肿瘤对脑胶质瘤患者的存活率以及治疗方案的确定起着决定性作用。在三维核磁共振影像(MRI)中,生成准确的注释需要大量的专业知识和时间成本,使用少量有标签数据与大量无标签数据进行半监督学习更加符合实际的临床场景与需求。为此,本文提出一种3DSEU-Net作为半监督模型中的教师与学生网络,该网络引入注意力计算,同时结合跳跃连接,以便获取三维医学影像中更加丰富鲁棒的结构与细节特征,训练过程中,教师模型通过不确定性量化,然后指导学生模型,使学生模型学习到置信度更高的结果,在仅有少量有标签数据的情况下学习到更多的知识,以提升模型的脑肿瘤分割精度。在仅有25个有标签数据的情况下,分割精度比全监督学习提升了12.9%,最高分割精度达81.41%,优于目前可同基准复现的6种半监督方法,证明了本文方法的可行性和有效性。 展开更多
关键词 三维卷积神经网络 通道注意力 半监督学习 脑肿瘤分割 循环焦点损失
下载PDF
融合压缩与激励模块的残差网络图像遮蔽识别
13
作者 刘梦瑶 李海涛 王靖亚 《计算机仿真》 北大核心 2023年第7期210-214,共5页
利用PS等技术进行图像篡改行为盛行。居心叵测之人为遮掩篡改痕迹加入噪音,模糊等遮蔽处理。针对上述遮蔽处理,收集四类人脸数据集,生成加入泊松噪音,均匀噪音,高斯模糊,中值滤波,图像压缩的五类遮蔽处理后的图像,形成对比样本。ResNet... 利用PS等技术进行图像篡改行为盛行。居心叵测之人为遮掩篡改痕迹加入噪音,模糊等遮蔽处理。针对上述遮蔽处理,收集四类人脸数据集,生成加入泊松噪音,均匀噪音,高斯模糊,中值滤波,图像压缩的五类遮蔽处理后的图像,形成对比样本。ResNet网络收敛不平滑,速度较慢。改进SE_ResNet网络在8个残差模块内均添加一层全局平均池化、两层全连接层、一层Sigmoid激活函数。利用压缩和激励操作对参数进行重标定,逐轮迭代调整学习率和梯度下降动量大小。总体网络由一层卷积层,四层包含八个改进残差模块的网络层,和全连接分类层构成。加入随机失活层和SGD权重衰减参数防止过拟合。对5类遮蔽篡改后图像识别准确率达92.50%。 展开更多
关键词 压缩与激励 残差网络 图像遮蔽识别
下载PDF
基于Squeeze-Excitation的音频场景分类研究 被引量:1
14
作者 乔高杰 廖闻剑 《电子设计工程》 2021年第19期179-183,188,共6页
目前音频场景分类任务中主要使用对数梅尔谱图作为特征,大多数研究人员选择对每个通道的特征信息进行处理,鲜有研究考虑特征通道间信息的问题。文中将图像分类中有着较好效果的Squeeze-Excitation(SE)模块引入到音频场景分类任务中,以... 目前音频场景分类任务中主要使用对数梅尔谱图作为特征,大多数研究人员选择对每个通道的特征信息进行处理,鲜有研究考虑特征通道间信息的问题。文中将图像分类中有着较好效果的Squeeze-Excitation(SE)模块引入到音频场景分类任务中,以解决未考虑特征通道信息的问题。在基础的CNN网络结构中添加SE模块可以较好地考虑特征通道间的信息,进而提高网络的表达能力,同时还探究了SE模块添加的位置与数量对音频场景分类效果的影响。实验结果证明,添加SE模块能够提高场景分类的准确率,相比于基线系统分类准确率提高了1.1%;只有当SE模块添加在特征通道数比较多的卷积块之后才能够达到比较好的效果,而增加SE模块的数量相较于基线系统分类准确率提高不明显,为0.3%。 展开更多
关键词 音频场景分类 squeeze-excitation DCASE2019 卷积神经网络
下载PDF
基于压缩激活机制的轻量级人脸识别网络设计 被引量:1
15
作者 黄伦文 《数字通信世界》 2020年第8期4-6,9,共4页
基于深度卷积神经网络的人脸识别算法具有较高的识别精度,但是计算复杂度高,难以在移动设备或离线环境下运行。为了保持人脸识别精度的同时降低人脸识别网络的复杂度,提出了一种基于压缩激活机制的轻量级人脸识别网络(Squeeze and Excit... 基于深度卷积神经网络的人脸识别算法具有较高的识别精度,但是计算复杂度高,难以在移动设备或离线环境下运行。为了保持人脸识别精度的同时降低人脸识别网络的复杂度,提出了一种基于压缩激活机制的轻量级人脸识别网络(Squeeze and Excitation Mobile Face Net,SEMFN)。在MobileFaceNet网络为基础,把第一层头部卷积核通道数量下降至16,从而降低模型的复杂度;在网络的第二层引入了轻量级注意力机制,即Squeeze and Excitation结构,使得网络能够更准确的抓取人脸关键区域特征,提高模型的识别精度。实验证明,基于50万训练样本,SEMFN模型降低了模型参数的同时保持较高的识别精度。 展开更多
关键词 人脸识别 轻量级神经网络 压缩激活机制
下载PDF
一种改进时序卷积网络的序列推荐方法
16
作者 施浩杰 刘学军 肖庆华 《小型微型计算机系统》 CSCD 北大核心 2021年第7期1382-1388,共7页
序列推荐在构建现代推荐系统中起着十分重要的作用,如何对序列进行建模是当前学术界研究的热点.针对传统推荐算法难以表示用户兴趣的动态变化,基于循环神经网络的推荐方法在捕捉复杂的序列关系方面的不足,提出了一种嵌入压缩-激励模块... 序列推荐在构建现代推荐系统中起着十分重要的作用,如何对序列进行建模是当前学术界研究的热点.针对传统推荐算法难以表示用户兴趣的动态变化,基于循环神经网络的推荐方法在捕捉复杂的序列关系方面的不足,提出了一种嵌入压缩-激励模块的改进时序卷积网络来提取序列特征.模型利用扩张卷积增大感受野,捕获更多的序列关系,利用残差连接减小反向传播过程中的梯度消失问题.通过对用户和项目特征的融合,模型可以综合考虑用户的短期和长期偏好进行个性化推荐.在两个数据集上的实验结果表明,本文提出的算法要优于基线算法,取得较好的推荐效果. 展开更多
关键词 序列推荐 压缩激励 注意力机制 扩张卷积 时序卷积
下载PDF
基于LSTM-Attention网络的短期风电功率预测 被引量:14
17
作者 钱勇生 邵洁 +3 位作者 季欣欣 李晓瑞 莫晨 程其玉 《电机与控制应用》 2019年第9期95-100,共6页
提出一种基于LSTM-Attention网络的短期风电功率预测方法。首先,使用LSTM网络对数值天气预测(NWP)数据的特征信息进行提取,同时采用注意力机制有效分析了模型输入与输出的相关性,从而获取了更多重要时间的整体特征;其次,使用卷积神经网... 提出一种基于LSTM-Attention网络的短期风电功率预测方法。首先,使用LSTM网络对数值天气预测(NWP)数据的特征信息进行提取,同时采用注意力机制有效分析了模型输入与输出的相关性,从而获取了更多重要时间的整体特征;其次,使用卷积神经网络(CNN)提取NWP数据的局部特征,并引入压缩和奖惩网络(SE)模块学习特征权重,利用特征重新标定方式提高网络表示能力;最后,将局部特征和整体特征进行特征融合,通过分类器输出分类结果。利用NOAA提供的美国加利福尼亚州某风电场的数据进行案例分析,证明了所提方法的有效性。试验结果表明,与BP神经网络、自回归积分滑动平均模型(ARIMA)模型和LSTM模型相比,LSTM-Attention模型具有更高的预测精度,证明了该方法的有效性。 展开更多
关键词 风电功率预测 LSTM 卷积神经网络 压缩和奖惩网络模块 注意力机制
下载PDF
基于改进PP-YOLO和Deep-SORT的多无人机实时跟踪算法 被引量:9
18
作者 马峻 姚震 +1 位作者 徐翠锋 陈寿宏 《计算机应用》 CSCD 北大核心 2022年第9期2885-2892,共8页
无人机(UAV)目标尺寸较小,多架无人机之间特征也不明显,且鸟类和飞虫的干扰给无人机目标的准确检测和稳定跟踪带来了巨大挑战。针对传统目标检测算法对小目标无人机检测性能差、跟踪不稳定的问题,提出一种基于改进PP-YOLO和Deep-SORT的... 无人机(UAV)目标尺寸较小,多架无人机之间特征也不明显,且鸟类和飞虫的干扰给无人机目标的准确检测和稳定跟踪带来了巨大挑战。针对传统目标检测算法对小目标无人机检测性能差、跟踪不稳定的问题,提出一种基于改进PP-YOLO和Deep-SORT的多无人机实时跟踪算法。首先,将压缩-激励模块融入PP-YOLO检测算法中,以实现对无人机目标的特征提取和检测;其次,在ResNet50-vd结构中引入Mish激活函数,以解决反向传播过程中的梯度消失问题,并进一步提升检测精度;然后,采用Deep-SORT算法来实时跟踪无人机目标,并将提取外观特征的主干网络更换为ResNet50,从而改善原有网络对微小外观感知能力弱的状况;最后,引入损失函数Margin Loss,既提高了类别可分性,又加强了类内紧度和类间差异。实验结果表明,所提算法的检测平均精度均值(mAP)相比原始PPYOLO算法提升了2.27个百分点,跟踪准确性相对于原始Deep-SORT算法提升了4.5个百分点。所提算法的跟踪准确性可达91.6%,能够实时跟踪600 m以内多架无人机目标,有效解决了跟踪过程中的“丢帧”问题。 展开更多
关键词 无人机检测 实时跟踪 压缩-激励模块 Mish激活函数 Margin Loss
下载PDF
改进残差神经网络在遥感图像分类中的应用 被引量:9
19
作者 刘春容 宁芊 +1 位作者 雷印杰 陈炳才 《科学技术与工程》 北大核心 2021年第31期13421-13429,共9页
针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,... 针对传统卷积神经网络随着深度加深而导致网络退化以及计算量大等问题,提出一种改进残差神经网络的遥感图像场景分类方法。该方法以残差网络ResNet50作为主框架,在残差结构中引入深度可分离卷积和分组卷积,减少了网络的参数量和计算量,加快模型收敛的同时也提升了分类精度。此外在网络中嵌入多尺度squeeze and excitation block模块对通道特征进行重校准,提取出更加重要的特征信息,进一步提升了网络的分类性能。在航空图像数据集(aerial image dataset,AID)和UCMerced_Land Use两个公开数据集上的分类精度分别为91.92%和93.52%,相比常规残差网络分类精度分别提高了3.38%和10.24%,证明所提方法在遥感图像场景分类任务中的可行性和有效性。 展开更多
关键词 遥感图像 场景分类 残差神经网络 分组卷积 深度可分离卷积 多尺度缩聚与激发模块
下载PDF
基于改进YOLOv5的车辆端目标检测 被引量:7
20
作者 黎国溥 陈升东 +2 位作者 王亮 邹凯 袁峰 《计算机系统应用》 2022年第12期127-134,共8页
在自动驾驶应用场景下,将YOLOv5应用于目标检测中,性能较之前版本有明显的提升,但在高运行速度情况下检测精度仍不够高,本文提出一种基于改进YOLOv5的车辆端目标检测方法.为解决训练不同数据集时需手动设计初始锚框大小,引入自适应锚框... 在自动驾驶应用场景下,将YOLOv5应用于目标检测中,性能较之前版本有明显的提升,但在高运行速度情况下检测精度仍不够高,本文提出一种基于改进YOLOv5的车辆端目标检测方法.为解决训练不同数据集时需手动设计初始锚框大小,引入自适应锚框计算.在主干网络(backbone)添加压缩与激励模块(squeeze and excitation,SE),筛选针对通道的特征信息,提升特征表达能力.为了提升检测不同大小物体时的精度,将注意力机制与检测网络融合,把卷积注意力模块(convolutional block attention module,CBAM)与Neck部分融合,使模型在检测不同大小的物体时能关注重要的特征,提升特征提取能力.在主干网络中使用空间金字塔池化SPP模块,使得模型输入可以输入任意图像高宽比和大小.在激活函数方面,进行卷积操作后使用Hardswish激活函数,应用于整个网络模型.在损失函数方面,使用CIoU作为检测框回归的损失函数,改善定位精度低和训练过程中目标检测框回归速度慢的问题.实验结果表明,改进后的检测模型在KITTI 2D数据集上测试,目标检测的精确率(precision)提高了2.5%,召回率(recall)提高了5.1%,平均精度均值(mean average precision,mAP)提高了2.3%. 展开更多
关键词 目标检测 YOLOv5 压缩与激励模块 注意力机制 卷积注意力模块 激活函数 Hardswish
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部