期刊文献+
共找到113篇文章
< 1 2 6 >
每页显示 20 50 100
基于U-Net的国产高分卫星影像海水养殖区分类提取方法 被引量:4
1
作者 刘继鹏 王常颖 初佳兰 《海洋环境科学》 CAS CSCD 北大核心 2023年第3期471-482,共12页
针对海水养殖区具有类型多样(筏式养殖、围海养殖、网箱养殖等)、差异较小和难以实现高精度分类提取的问题,本文将空洞金字塔卷积模块与U-Net神经网络模型融合,提出一种适用于海水养殖区的多分类提取方法。首先,采用变差函数分析方法发... 针对海水养殖区具有类型多样(筏式养殖、围海养殖、网箱养殖等)、差异较小和难以实现高精度分类提取的问题,本文将空洞金字塔卷积模块与U-Net神经网络模型融合,提出一种适用于海水养殖区的多分类提取方法。首先,采用变差函数分析方法发现不同类别的海水养殖区的变差函数波形与基台值的差异;其次,定义一种相仿于变差函数搜索域的不同扩张率空洞卷积并联的卷积结构,用其替换U-Net模型中普通卷积结构,构建ASP-U-Net模型;最后,为验证采用ASP-U-Net模型的海水养殖区分类提取能力,选取7景我国高分1/2号卫星影像为数据源,相较于经典FCN、SegNet、PspNet和经典UNet模型,ASP-U-Net模型对海洋养殖区的分类提取在多种指标下均最优,这说明使用提出的卷积结构能够有效扩大感受野,更适合于多类海水养殖区的特征表达。 展开更多
关键词 U-Net模型 空洞空间金字塔 变差函数 高分辨率 海水养殖区
原文传递
基于改进CNN的恶意软件分类方法 被引量:4
2
作者 轩勃娜 李进 《电子学报》 EI CAS CSCD 北大核心 2023年第5期1187-1197,共11页
越来越多的恶意软件变种给网络安全带来了巨大的威胁,导致了现有基于CNN(Convolutional Neural Networks)的恶意软件分类方法的泛化能力弱和准确性不足.为了解决这些问题,本文提出了一种新的方法,即基于改进CNN的恶意软件RGB(Red Green ... 越来越多的恶意软件变种给网络安全带来了巨大的威胁,导致了现有基于CNN(Convolutional Neural Networks)的恶意软件分类方法的泛化能力弱和准确性不足.为了解决这些问题,本文提出了一种新的方法,即基于改进CNN的恶意软件RGB(Red Green Blue)可视化的分类方法,可以抵御变种和混淆性恶意软件.首先,提出了一种基于RGB图像的特征表示方法,该方法更加关注恶意软件的二进制和汇编信息、API信息间的语义关系,生成具有更丰富纹理信息的图像,可以挖掘恶意代码原始与变种之间更深层的依赖关系.其次,针对恶意软件的加密和混淆问题,使用坐标注意力模块(Coordinate Attention Module,CAM)获取更大范围的空间信息来强化特征.最后,结合空洞空间金字塔池化(Atrous Spatial Pyramid Pooling,ASPP)来改进CNN模型,解决因图像尺寸归一化导致的信息丢失和冗余.实验结果表明,上述方法在最近的先进方法中脱颖而出,对Kaggle数据集和DataCon数据集的准确率分别达到99.48%和97.78%.与其它方法相比,该方法对Kaggle数据集的准确率提高了0.22%,对DataCon数据集的准确率提高了0.80%.本文方法可以有效地分类恶意软件和恶意软件家族变种,具有良好的泛化能力和抗混淆能力. 展开更多
关键词 网络安全 恶意代码分类 RGB图像 汇编信息 语义关系 坐标注意力模块 空洞空间金字塔
下载PDF
基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法
3
作者 王广帅 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第3期26-37,共12页
针对无人机影像场景复杂、视角差异大、异物遮挡多,因而难以实现影像钢轨线高精度自动提取的问题,提出基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法。在传统U-net网络基础上增加并行的空洞空间金字塔模块(Atrous Spatial Pyramid... 针对无人机影像场景复杂、视角差异大、异物遮挡多,因而难以实现影像钢轨线高精度自动提取的问题,提出基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法。在传统U-net网络基础上增加并行的空洞空间金字塔模块(Atrous Spatial Pyramid Pooling,ASPP)及卷积注意力模块(Convolutional Block Attention Module,CBAM),以增强网络对不同尺度的邻域信息的获取能力,有效提升对钢轨的分割性能;再通过基于RANSAC最小二乘拟合的像素编组及邻域钢轨线串联,实现完整钢轨矢量线的高精度提取。结果表明:与Unet及Deeplab v3+2种经典模型相比,所提方法针对多视角无人机影像钢轨分割的交并比分别提升2.09%和1.98%,综合能力评价指标分别提升1.50和1.42;钢轨线提取完整度达到了90.7%,优于U-net模型的83.3%;钢轨线提取的误差平均值约0.58像素,中误差约0.77像素,实现了亚像素级的钢轨线提取。该方法能够满足无人机多视角影像中钢轨线提取的自动化、完整性以及高精度应用的需求。 展开更多
关键词 无人机影像 钢轨线提取 空洞空间金字塔 注意力机制 U-net
下载PDF
融合多尺度特征的脑肿瘤分割算法
4
作者 苏赋 马傲 李沁 《光电子.激光》 CAS CSCD 北大核心 2024年第12期1337-1344,共8页
脑肿瘤核磁共振成像(magnetic resonance imaging,MRI)分割是脑肿瘤诊断和治疗的重要环节,针对U-Net网络结构对图像特征感受野大小有所限制、上下文信息存在鸿沟导致的分割准确率较低的问题,本文提出了一种融合多尺度特征的脑肿瘤MRI分... 脑肿瘤核磁共振成像(magnetic resonance imaging,MRI)分割是脑肿瘤诊断和治疗的重要环节,针对U-Net网络结构对图像特征感受野大小有所限制、上下文信息存在鸿沟导致的分割准确率较低的问题,本文提出了一种融合多尺度特征的脑肿瘤MRI分割算法。首先,设计了一种多尺度聚合模块(multi-scale aggregation module,MAM)来替换原始U-Net网络中的常规卷积层,增加网络的深度以及宽度,来捕获特征图的边界细节信息。其次,在跳跃连接中用上下文空洞空间金字塔模块(context atrous spatial pyramid,CASP)代替直接拼接操作,扩大网络的感受野,增强对不同尺度大小的病灶的提取能力。最后,在U型的底部设计了一种多层次聚合注意力模块(multi-level aggregation attention,MAA),使网络模型关注图像分割区域有效特征,排除背景噪声。将改进算法在癌症基因组图谱(脑肿瘤数据)数据库(the Cancer Genome Atlas,TCGA)上进行实验验证,其结果表明所提算法的平均交并比(mean intersection over union,mIoU)、Dice系数、敏感性、特异性、准确率等指标分别为:91.39%、92.81%、89.14%、99.95%、95.78%。 展开更多
关键词 核磁共振成像(MRI) 脑肿瘤分割 特征聚合 空洞空间金字塔 混合注意力机制
原文传递
基于改进U-Net的遥感图像道路提取算法 被引量:1
5
作者 熊雅行 《长江信息通信》 2023年第6期84-87,共4页
针对基于U-Net模型对遥感图像道路特征提取能力不足、分割结果不清晰等问题,文章提出了一种改进的U-Net算法:首先在编码器中引入级联的空洞空间金字塔模块充分利用图像全局上下文信息从而改善分割结果模糊的问题;再通过在通道中嵌入坐... 针对基于U-Net模型对遥感图像道路特征提取能力不足、分割结果不清晰等问题,文章提出了一种改进的U-Net算法:首先在编码器中引入级联的空洞空间金字塔模块充分利用图像全局上下文信息从而改善分割结果模糊的问题;再通过在通道中嵌入坐标注意力机制模块加强对道路特征信息的提取,最后在解码器部分引入空间注意力机制旨在提高道路分割边缘的清晰度。实验表明:在马赛诸塞州数据集下改进后的U-Net模型比原始U-Net网络模型在Recall、F1-S cores和Io U三个指标下分别了提高了0.085、0.038、0.045,提取的道路结构更完整且相互连通,证明了算法优化的有效性。 展开更多
关键词 遥感图像 道路提取 U-Net 空洞空间金字塔 坐标注意力机制 空间注意力机制
下载PDF
基于深度学习的场景文本检测算法研究 被引量:2
6
作者 熊炜 艾美慧 +4 位作者 杨荻椿 李利荣 刘敏 王娟 曾春艳 《光电子.激光》 CAS CSCD 北大核心 2021年第7期728-734,共7页
针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更... 针对自然场景中任意形状文本图像因文本行难以区分导致的信息丢失问题,提出了一种基于深度学习的场景文本检测算法。首先构建特征提取模块,使用Resnet50作为骨干网络,在增加跨层连接的金字塔网络结构中引入并联的空洞卷积模块,以提取更多语义信息;其次,对得到的特征图进行多尺度特征融合,学习不同尺度的特征;最后预测出不同内核大小的文本实例,并通过尺度扩展逐渐扩大文本行区域,直到得到最终的检测结果。实验结果表明,该方法在SCUT-CTW1500弯曲文本数据集上的准确率、召回率及F1值分别达到88.5%、77.0%和81.3%,相比其他基于分割的算法,该算法对弯曲文本的检测效果良好,具有一定的应用价值。 展开更多
关键词 场景文本检测 深度学习 特征提取 多尺度特征融合 空洞空间金字塔
原文传递
基于改进DeepLabv3+网络的图像语义分割方法 被引量:21
7
作者 徐聪 王丽 《激光与光电子学进展》 CSCD 北大核心 2021年第16期217-224,共8页
针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征... 针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征金字塔网络有效融合了高分辨率的浅层特征;然后,使用逐层上采样增强图像中像素信息的连续性;最后,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高了网络模型的训练效率。在语义分割标准数据集PASCAL VOC2012验证集上的实验结果表明,本方法的平均交并比可达到79.97%。相比DeepLab网络,可预测出更精细的语义分割结果。 展开更多
关键词 图像处理 改进的DeepLabv3+网络 特征金字塔网络 空洞空间金字塔池化模块
原文传递
全卷积注意力机制神经网络的图像语义分割 被引量:16
8
作者 欧阳柳 贺禧 瞿绍军 《计算机科学与探索》 CSCD 北大核心 2022年第5期1136-1145,共10页
全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积... 全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法。该方法利用计算高级特征图像素之间的联系来获取全局信息,增强像素之间的相关性,再结合空洞空间金字塔池化进一步提取图像的特征信息。针对图像的高层特征图像素丢失的问题,提出了基于图像不同层级的注意力方法。该方法将高层特征图中的信息作为指导对低层特征图中隐藏的信息进行挖掘,然后和高级特征图进行融合,充分利用高级特征图信息和低级特征图的信息。在实验方面,通过对比所提不同模块对全卷积神经网络分割性能的影响,验证了所提方法的有效性。同时在公认的图像语义分割数据集Cityscapes上与当前先进的网络进行实验对比,结果显示所提方法在客观评价指标和主观效果方面均存在优越性,并在Cityscapes官网测试集中达到了69.3%的准确率,性能比近期几个先进网络高出3~5个百分点。 展开更多
关键词 全卷积神经网络 空洞空间金字塔池化 注意力模型 语义分割
下载PDF
融合深度神经网络和空洞卷积的语义图像分割研究 被引量:13
9
作者 陈洪云 孙作雷 孔薇 《小型微型计算机系统》 CSCD 北大核心 2020年第1期166-170,共5页
语义分割是计算机视觉中的基本任务,是对图像中的不同目标进行像素级的分割与分类.针对多尺度的目标分割难题,本文提出了一种基于Res Net网络的方法,通过定义并联支路,将浅层特征图像信息融合到深层特征图像中,提出新的空洞空间金字塔模... 语义分割是计算机视觉中的基本任务,是对图像中的不同目标进行像素级的分割与分类.针对多尺度的目标分割难题,本文提出了一种基于Res Net网络的方法,通过定义并联支路,将浅层特征图像信息融合到深层特征图像中,提出新的空洞空间金字塔模块,该模块采用并行的不同采样率的空洞卷积进行特征提取与融合,从而更有效的提取不同层的特征以及上下文信息,并且在新模块中加入批规范化计算,增强参数调优的稳定性.本文还采用了Adam自适应优化函数,在训练的过程中,使得每个参数的更新都具有独立性,提升了模型训练的稳定性.本文结果在PASCAL VOC 2012语义分割测试集中取得了77.31%mIOU的成果,优于Deeplab V3的效果. 展开更多
关键词 语义分割 神经网络 空洞卷积 空洞空间金字塔模块
下载PDF
利用Deeplab v3提取高分辨率遥感影像道路 被引量:10
10
作者 韩玲 杨朝辉 +2 位作者 李良志 刘志恒 黄勃学 《遥感信息》 CSCD 北大核心 2021年第1期22-28,共7页
针对传统道路提取方法存在的道路边缘粗糙、抗干扰性弱、提取精度低等问题,提出了一种基于编码解码器的空洞卷积模型(Deeplab v3)的道路提取方法。首先,对原始高分辨率遥感影像进行标注;其次,利用标注数据集对Deeplab v3模型进行训练、... 针对传统道路提取方法存在的道路边缘粗糙、抗干扰性弱、提取精度低等问题,提出了一种基于编码解码器的空洞卷积模型(Deeplab v3)的道路提取方法。首先,对原始高分辨率遥感影像进行标注;其次,利用标注数据集对Deeplab v3模型进行训练、测试;最后,得到高分辨率遥感影像道路提取结果。分析结果可知,该模型能够较好地提取高分辨率遥感影像中的道路边缘特征,相比其他道路提取方法具有更高的提取精度和更加完整的道路信息,正确率可达到93%以上。 展开更多
关键词 道路提取 高分辨率遥感影像 深度学习 Deeplab v3 空洞卷积 空洞空间金字塔池化(ASPP)
下载PDF
基于多尺度特征编码和双重注意力融合的绝缘子缺陷检测 被引量:9
11
作者 李利荣 陈鹏 +3 位作者 张云良 张开 熊炜 巩朋成 《激光与光电子学进展》 CSCD 北大核心 2022年第24期73-82,共10页
针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征... 针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征,并在之后嵌入空洞空间金字塔池化模块实现多个尺度捕捉绝缘子及其缺陷的特征;其次,为了减少解码网络中特征信息的缺失,将主干网络的不同层特征与efficient channel attention注意力模块串联,并分别与经过squeeze and excitation注意力模块的各反卷积特征相加形成双重注意力融合。实验结果表明,所提方法的均值平均精度值约为95.35%,每秒传输帧数约为65.95,与其他方法相比,该方法对无人机绝缘子缺陷的准确检测具有一定的参考价值。 展开更多
关键词 图像处理 绝缘子缺陷检测 空洞空间金字塔池化 多尺度特征编码 双重注意力融合
原文传递
编码-解码多尺度卷积神经网络人群计数方法 被引量:9
12
作者 孟月波 纪拓 +2 位作者 刘光辉 徐胜军 李彤月 《西安交通大学学报》 EI CAS CSCD 北大核心 2020年第5期149-157,共9页
针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感... 针对基于多列卷积神经网络的人群计数方法存在的多尺度特征信息丢失、融合不佳以及密度图质量不高等问题,提出了一种编码-解码结构的多尺度卷积神经网络人群计数方法。编码器采用多列卷积捕获多尺度特征,通过空洞空间金字塔池化扩大感受野并减少参数量,保留尺度特征和图像的上下文信息;解码器对编码器输出进行上采样,实现高层语义信息和编码器前端低层特征信息有效融合,从而提升了密度图的输出质量。为增强网络对计数的敏感性,在以往像素空间损失的基础上考虑了计数误差,提出了一种新型损失函数。采用Shanghai Tech、Mall以及自建数据集进行了对比实验,结果表明:与之前最优方法相比,所提方法在Shanghai Tech数据集Part_A部分的平均绝对误差和均方误差分别降低了8.3%和21.3%,Part_B部分分别降低了12.9%和12.0%,Mall数据集分别降低了15.1%和23.8%,自建数据集分别降低了13.5%和7.1%;在不同人群场景下,所提方法的人群计数准确性和鲁棒性均优于其他对比方法的。 展开更多
关键词 人群计数 编码-解码结构 多尺度 空洞空间金字塔池化 计数误差 损失函数
下载PDF
Res_ASPP_UNet++:结合分离卷积与空洞金字塔的遥感影像建筑物提取网络 被引量:8
13
作者 吕少云 李佳田 +3 位作者 阿晓荟 杨超 杨汝春 尚晓梅 《遥感学报》 EI CSCD 北大核心 2023年第2期502-519,共18页
针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atr... 针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atrous Spatial Pyramid Pooling)来提升网络性能,并将改进后的建筑物提取网络称为残差空洞空间金字塔网络(Res_ASPP_UNet++)。为验证Res_ASPP_UNet++网络结构的有效性和适用性,以经过数据增强预处理的WHU和Massachusetts数据集作为数据源,对Res_ASPP_UNet++网络与目前常用的语义分割网络进行了试验和精度评估,并将Res_ASPP_UNet++网络与文献中的研究成果进行了对比。结果表明Res_ASPP_UNet++在模型参数量与精度两个方面均表现出优势,能够在大幅压缩模型参数量的前提下,显著提升建筑物提取精度,提取建筑物的边界更加平滑和精确,对不同尺度的建筑物表现出较强的泛化能力。 展开更多
关键词 遥感影像 建筑物提取 UNet++ 深度可分离卷积 深度残差结构 空洞空间金字塔池化
原文传递
改进YOLOv5s算法的地铁场景行人目标检测 被引量:8
14
作者 张秀再 邱野 张晨 《激光与光电子学进展》 CSCD 北大核心 2023年第6期134-143,共10页
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性.针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果.构建地铁场景行人数据集,... 地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性.针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果.构建地铁场景行人数据集,标注对应标签,进行数据预处理操作.本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框.实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著. 展开更多
关键词 行人目标检测 YOLOv5s 注意力机制 改进空洞空间金字塔池化
原文传递
基于FPN的高分辨率建筑物图像的语义分割 被引量:8
15
作者 杨建华 《遥感信息》 CSCD 北大核心 2021年第4期133-141,共9页
针对目前的语义分割网络仅使用部分卷积层产生最终输出而导致的建筑物的边缘精度较低、预测图像质量不高等问题,提出了一种基于特征金字塔结构的BuildingNet网络,并引入了空洞空间金字塔池化模块,使得该网络具有针对不同分辨率图像的良... 针对目前的语义分割网络仅使用部分卷积层产生最终输出而导致的建筑物的边缘精度较低、预测图像质量不高等问题,提出了一种基于特征金字塔结构的BuildingNet网络,并引入了空洞空间金字塔池化模块,使得该网络具有针对不同分辨率图像的良好特征提取性能。另外,设计了一种改进的Lovász损失函数训练所提出的网络,有效提高了提取结果的图像质量。实验表明,对于高分辨率建筑物图像的语义分割,所提出的BuildingNet网络在两个实验数据集上的F1得分分别为94.58%和92.15%,优于常用的三种语义分割网络(SegNet、U-Net、Deeplabv3+),证明了其有效性。 展开更多
关键词 深度学习 语义分割 建筑物提取 特征金字塔网络 空洞空间金字塔池化
下载PDF
实时视觉目标跟踪与视频对象分割多任务框架 被引量:8
16
作者 李瀚 刘坤华 +1 位作者 刘嘉杰 张晓晔 《中国图象图形学报》 CSCD 北大核心 2021年第1期101-112,共12页
目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧... 目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架。方法文中提出的架构使用了由空洞深度可分离卷积组成的更加多尺度的空洞空间金字塔池化模块,以及具备帧间信息的帧间掩模传播模块,使得网络对多尺度目标对象分割能力更强,同时具备更好的鲁棒性。结果本文方法在视觉目标跟踪VOT-2016和VOT-2018数据集上的期望平均重叠率(expected average overlap,EAO)分别达到了0.462和0.408,分别比Siam Mask高了0.029和0.028,达到了最先进的结果,并且表现出更好的鲁棒性。在视频对象分割DAVIS(densely annotated video segmentation)-2016和DAVIS-2017数据集上也取得了有竞争力的结果。其中,在多目标对象分割DAVIS-2017数据集上,本文方法比Siam Mask有更好的性能表现,区域相似度的杰卡德系数的平均值J_(M)和轮廓精确度的F度量的平均值F_(M)分别达到了56.0和59.0,并且区域和轮廓的衰变值J_(D)和F_(D)都比Siam Mask中的低,分别为17.9和19.8。同时运行速度为45帧/s,达到了实时的运行速度。结论文中提出的融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架,充分捕捉了多尺度上下文信息并且利用了视频帧间的信息,使得网络对多尺度目标对象分割能力更强的同时具备更好的鲁棒性。 展开更多
关键词 视觉目标跟踪 视频对象分割 全卷积网络 空洞空间金字塔池化 帧间掩模传播
原文传递
健身行为的人体姿态估计及动作识别 被引量:4
17
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
下载PDF
DECANet:基于改进DeepLabv3+的图像语义分割方法 被引量:7
18
作者 唐璐 万良 +1 位作者 王婷婷 李树胜 《激光与光电子学进展》 CSCD 北大核心 2023年第4期82-90,共9页
在图像的语义分割任务中,不同对象之间像素值存在差异,导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题,提出一种图像语义分割方法(DECANet)。首先,引入通道注意力网络模块,通过对所有通道的依赖关系进行建... 在图像的语义分割任务中,不同对象之间像素值存在差异,导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题,提出一种图像语义分割方法(DECANet)。首先,引入通道注意力网络模块,通过对所有通道的依赖关系进行建模提高网络的表达能力,选择性地学习并强化通道特征,提取有用信息,抑制无用信息。其次,利用改进的空洞空间金字塔池化(ASPP)结构,对提取到的图像卷积特征进行多尺度融合,减少图像细节信息丢失,且在权重参数不改变的情况下提取语义像素位置信息,加快模型的收敛速度。最后,DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%,与现有的先进网络模型相比,检测性能更优,可以有效地捕获局部细节信息,减少图像语义像素分类错误。 展开更多
关键词 图像语义分割 注意力机制 空洞空间金字塔池化 多尺度融合
原文传递
基于改进Deeplab V3+网络的语义分割 被引量:8
19
作者 席一帆 孙乐乐 +1 位作者 何立明 吕悦 《计算机系统应用》 2020年第9期178-183,共6页
深度学习的语义分割在计算机视觉领域中有非常广阔的发展前景,但许多分割效果较好网络模型占用内存大和处理单张图片耗时长.针对这个问题,把Deeplab V3+模型的骨干网(ResNet101)的瓶颈单元设计为1D非瓶颈单元,且对空洞空间金字塔池化模... 深度学习的语义分割在计算机视觉领域中有非常广阔的发展前景,但许多分割效果较好网络模型占用内存大和处理单张图片耗时长.针对这个问题,把Deeplab V3+模型的骨干网(ResNet101)的瓶颈单元设计为1D非瓶颈单元,且对空洞空间金字塔池化模块(Atrous Spatial Pyramid Pooling,ASPP)的卷积层进行分解.该算法能大幅度降低Deeplab V3+网络的参数量,提高网络推理速度.基于PASCAL VOC 2012数据集进行对比实验,实验结果显示改进网络模型拥有更快的处理速度和更优的分割效果,且消耗更少的内存. 展开更多
关键词 语义分割 Deeplab V3+模型 骨干网(ResNet101) 1D非瓶颈单元 空洞空间金字塔池化(ASPP)
下载PDF
带语义分割的轻量化车道线检测算法 被引量:7
20
作者 陈正斌 叶东毅 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1877-1883,共7页
为了解决在计算资源有限的车载嵌入式设备中车道线检测算法存在实时性差、精度不高的问题,提出了一种带语义分割的轻量化车道线检测算法(SegLaneNet).首先通过简化并联的空洞卷积支路,增加跳跃连接结构,提出新的空洞空间金字塔池化模块(... 为了解决在计算资源有限的车载嵌入式设备中车道线检测算法存在实时性差、精度不高的问题,提出了一种带语义分割的轻量化车道线检测算法(SegLaneNet).首先通过简化并联的空洞卷积支路,增加跳跃连接结构,提出新的空洞空间金字塔池化模块(ASPP-tiny);接着定义模型的多尺度输入、跳跃连接的浅层特征与深层特征融合、并联不同采样率的空洞卷积特征融合;再有对自编码器中的上采样与下采样卷积进行剪枝操作,提出一种新的轻量化全卷积语义分割算法SegLaneNet应用于车道线检测;最后与Baseline算法相比,本文的SegLaneNet算法在图森(TuSimple)车道线检测挑战数据集上测试的准确率提高了约2%,假正例(FP)减少了3%以上,假负例(FN)减少了约2%.在GPU服务器上测试运行速度达165帧/秒(FPS),同时在嵌入式设备中运算速度达到16帧/秒(FPS).测试结果表明带语义分割的轻量化车道线检测算法能够满足车载嵌入式设备实时、准确的车道线检测工作. 展开更多
关键词 车道线检测 语义分割 空洞空间金字塔池化 多尺度 全卷积神经网络 深度学习
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部