期刊文献+
共找到116篇文章
< 1 2 6 >
每页显示 20 50 100
基于U-Net的国产高分卫星影像海水养殖区分类提取方法 被引量:4
1
作者 刘继鹏 王常颖 初佳兰 《海洋环境科学》 CAS CSCD 北大核心 2023年第3期471-482,共12页
针对海水养殖区具有类型多样(筏式养殖、围海养殖、网箱养殖等)、差异较小和难以实现高精度分类提取的问题,本文将空洞金字塔卷积模块与U-Net神经网络模型融合,提出一种适用于海水养殖区的多分类提取方法。首先,采用变差函数分析方法发... 针对海水养殖区具有类型多样(筏式养殖、围海养殖、网箱养殖等)、差异较小和难以实现高精度分类提取的问题,本文将空洞金字塔卷积模块与U-Net神经网络模型融合,提出一种适用于海水养殖区的多分类提取方法。首先,采用变差函数分析方法发现不同类别的海水养殖区的变差函数波形与基台值的差异;其次,定义一种相仿于变差函数搜索域的不同扩张率空洞卷积并联的卷积结构,用其替换U-Net模型中普通卷积结构,构建ASP-U-Net模型;最后,为验证采用ASP-U-Net模型的海水养殖区分类提取能力,选取7景我国高分1/2号卫星影像为数据源,相较于经典FCN、SegNet、PspNet和经典UNet模型,ASP-U-Net模型对海洋养殖区的分类提取在多种指标下均最优,这说明使用提出的卷积结构能够有效扩大感受野,更适合于多类海水养殖区的特征表达。 展开更多
关键词 U-Net模型 空洞空间金字塔 变差函数 高分辨率 海水养殖区
原文传递
融合多尺度特征的脑肿瘤分割算法
2
作者 苏赋 马傲 李沁 《光电子.激光》 CAS CSCD 北大核心 2024年第12期1337-1344,共8页
脑肿瘤核磁共振成像(magnetic resonance imaging,MRI)分割是脑肿瘤诊断和治疗的重要环节,针对U-Net网络结构对图像特征感受野大小有所限制、上下文信息存在鸿沟导致的分割准确率较低的问题,本文提出了一种融合多尺度特征的脑肿瘤MRI分... 脑肿瘤核磁共振成像(magnetic resonance imaging,MRI)分割是脑肿瘤诊断和治疗的重要环节,针对U-Net网络结构对图像特征感受野大小有所限制、上下文信息存在鸿沟导致的分割准确率较低的问题,本文提出了一种融合多尺度特征的脑肿瘤MRI分割算法。首先,设计了一种多尺度聚合模块(multi-scale aggregation module,MAM)来替换原始U-Net网络中的常规卷积层,增加网络的深度以及宽度,来捕获特征图的边界细节信息。其次,在跳跃连接中用上下文空洞空间金字塔模块(context atrous spatial pyramid,CASP)代替直接拼接操作,扩大网络的感受野,增强对不同尺度大小的病灶的提取能力。最后,在U型的底部设计了一种多层次聚合注意力模块(multi-level aggregation attention,MAA),使网络模型关注图像分割区域有效特征,排除背景噪声。将改进算法在癌症基因组图谱(脑肿瘤数据)数据库(the Cancer Genome Atlas,TCGA)上进行实验验证,其结果表明所提算法的平均交并比(mean intersection over union,mIoU)、Dice系数、敏感性、特异性、准确率等指标分别为:91.39%、92.81%、89.14%、99.95%、95.78%。 展开更多
关键词 核磁共振成像(MRI) 脑肿瘤分割 特征聚合 空洞空间金字塔 混合注意力机制
原文传递
基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法
3
作者 王广帅 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第3期26-37,共12页
针对无人机影像场景复杂、视角差异大、异物遮挡多,因而难以实现影像钢轨线高精度自动提取的问题,提出基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法。在传统U-net网络基础上增加并行的空洞空间金字塔模块(Atrous Spatial Pyramid... 针对无人机影像场景复杂、视角差异大、异物遮挡多,因而难以实现影像钢轨线高精度自动提取的问题,提出基于CBAS_Unet的无人机多视角影像钢轨线自动提取方法。在传统U-net网络基础上增加并行的空洞空间金字塔模块(Atrous Spatial Pyramid Pooling,ASPP)及卷积注意力模块(Convolutional Block Attention Module,CBAM),以增强网络对不同尺度的邻域信息的获取能力,有效提升对钢轨的分割性能;再通过基于RANSAC最小二乘拟合的像素编组及邻域钢轨线串联,实现完整钢轨矢量线的高精度提取。结果表明:与Unet及Deeplab v3+2种经典模型相比,所提方法针对多视角无人机影像钢轨分割的交并比分别提升2.09%和1.98%,综合能力评价指标分别提升1.50和1.42;钢轨线提取完整度达到了90.7%,优于U-net模型的83.3%;钢轨线提取的误差平均值约0.58像素,中误差约0.77像素,实现了亚像素级的钢轨线提取。该方法能够满足无人机多视角影像中钢轨线提取的自动化、完整性以及高精度应用的需求。 展开更多
关键词 无人机影像 钢轨线提取 空洞空间金字塔 注意力机制 U-net
下载PDF
基于改进U-Net的遥感图像道路提取算法 被引量:1
4
作者 熊雅行 《长江信息通信》 2023年第6期84-87,共4页
针对基于U-Net模型对遥感图像道路特征提取能力不足、分割结果不清晰等问题,文章提出了一种改进的U-Net算法:首先在编码器中引入级联的空洞空间金字塔模块充分利用图像全局上下文信息从而改善分割结果模糊的问题;再通过在通道中嵌入坐... 针对基于U-Net模型对遥感图像道路特征提取能力不足、分割结果不清晰等问题,文章提出了一种改进的U-Net算法:首先在编码器中引入级联的空洞空间金字塔模块充分利用图像全局上下文信息从而改善分割结果模糊的问题;再通过在通道中嵌入坐标注意力机制模块加强对道路特征信息的提取,最后在解码器部分引入空间注意力机制旨在提高道路分割边缘的清晰度。实验表明:在马赛诸塞州数据集下改进后的U-Net模型比原始U-Net网络模型在Recall、F1-S cores和Io U三个指标下分别了提高了0.085、0.038、0.045,提取的道路结构更完整且相互连通,证明了算法优化的有效性。 展开更多
关键词 遥感图像 道路提取 U-Net 空洞空间金字塔 坐标注意力机制 空间注意力机制
下载PDF
基于视频深度学习的铁路周界入侵检测算法研究 被引量:21
5
作者 王瑞 李霄峰 +1 位作者 史天运 邹琪 《交通运输系统工程与信息》 EI CSCD 北大核心 2020年第2期61-68,共8页
基于视频智能分析的铁路周界入侵检测算法相比于雷达、振动光纤,具有成本低、误报率低的优点.针对视频中存在不同分辨率目标的问题,提出一种改进的Cascade Mask RCNN(CMR)模型,使用级联结构获得目标的准确定位.为增强模型对小目标的检... 基于视频智能分析的铁路周界入侵检测算法相比于雷达、振动光纤,具有成本低、误报率低的优点.针对视频中存在不同分辨率目标的问题,提出一种改进的Cascade Mask RCNN(CMR)模型,使用级联结构获得目标的准确定位.为增强模型对小目标的检测能力,在原始模型的基础上,增加基于特征金字塔网络(FPN)的多尺度特征提取模块和基于空洞金字塔汇聚(ASPP)子网络的空间上下文增强模块.在实际铁路周界入侵场景视频中验证了模型的有效性.结果表明,该模型可实现不同场景下的铁路周界入侵检测,相较于原始模型,新模型对小目标检测的F-measure提高了0.24.模型既解决了不同场景下铁路周界入侵检测问题,又有效地提高了视频智能分析对小目标检测的准确率. 展开更多
关键词 铁路运输 视频智能分析 深度学习 周界入侵检测 特征金字塔 空洞卷积
下载PDF
基于改进DeepLabv3+网络的图像语义分割方法 被引量:21
6
作者 徐聪 王丽 《激光与光电子学进展》 CSCD 北大核心 2021年第16期217-224,共8页
针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征... 针对DeepLab网络不能充分利用多尺度特征信息,忽略了高分辨率浅层特征以及直接上采样倍数过大导致的重要像素信息丢失问题,提出了一种基于改进DeepLabv3+网络的图像语义分割方法。首先,充分利用了网络产生的多尺度特征信息,并采用特征金字塔网络有效融合了高分辨率的浅层特征;然后,使用逐层上采样增强图像中像素信息的连续性;最后,将空洞空间金字塔池化模块中的标准卷积替换为深度可分离卷积,提高了网络模型的训练效率。在语义分割标准数据集PASCAL VOC2012验证集上的实验结果表明,本方法的平均交并比可达到79.97%。相比DeepLab网络,可预测出更精细的语义分割结果。 展开更多
关键词 图像处理 改进的DeepLabv3+网络 特征金字塔网络 空洞空间金字塔池化模块
原文传递
全卷积注意力机制神经网络的图像语义分割 被引量:16
7
作者 欧阳柳 贺禧 瞿绍军 《计算机科学与探索》 CSCD 北大核心 2022年第5期1136-1145,共10页
全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积... 全卷积神经网络是一种强大的端到端的模型,在语义分割领域应用广泛,获得了巨大的成功。研究人员提出了一系列基于完全卷积神经网络的方法,但是随着卷积和池化的持续性下采样,图像的上下文信息将会丢失,影响了像素级分类。针对完全卷积网络上下文信息丢失问题,提出基于像素的注意力方法。该方法利用计算高级特征图像素之间的联系来获取全局信息,增强像素之间的相关性,再结合空洞空间金字塔池化进一步提取图像的特征信息。针对图像的高层特征图像素丢失的问题,提出了基于图像不同层级的注意力方法。该方法将高层特征图中的信息作为指导对低层特征图中隐藏的信息进行挖掘,然后和高级特征图进行融合,充分利用高级特征图信息和低级特征图的信息。在实验方面,通过对比所提不同模块对全卷积神经网络分割性能的影响,验证了所提方法的有效性。同时在公认的图像语义分割数据集Cityscapes上与当前先进的网络进行实验对比,结果显示所提方法在客观评价指标和主观效果方面均存在优越性,并在Cityscapes官网测试集中达到了69.3%的准确率,性能比近期几个先进网络高出3~5个百分点。 展开更多
关键词 全卷积神经网络 空洞空间金字塔池化 注意力模型 语义分割
下载PDF
一种改进DeepLabV3+网络的高分辨率遥感影像道路提取方法 被引量:13
8
作者 葛小三 曹伟 《遥感信息》 CSCD 北大核心 2022年第1期40-46,共7页
道路网络提取是高分辨率遥感影像数据应用研究的难点之一。针对现有的道路提取方法普遍注重区域精度而边界质量缺失考虑的问题,提出一种基于DeepLabV3+语义分割神经网络的深度学习提取道路的方法。该网络模型采用编码器-解码器网络(enco... 道路网络提取是高分辨率遥感影像数据应用研究的难点之一。针对现有的道路提取方法普遍注重区域精度而边界质量缺失考虑的问题,提出一种基于DeepLabV3+语义分割神经网络的深度学习提取道路的方法。该网络模型采用编码器-解码器网络(encoder-decoder)和多孔空间金字塔池(atrous spatial pyramid pooling,ASPP)相结合的方式,增强了对道路边界的划分效果。模型在Massachusetts roads数据集进行了道路网络提取实验。分析结果表明,基于该方法的道路提取精度优于U-Net等网络模型,F1分数达到87.27%,与其他方法相比较,该方法能够更有效、完整地从遥感图像中提取道路。 展开更多
关键词 编码器-解码器 多孔金字塔池化 道路提取 DeepLabV3+ 深度学习
下载PDF
基于改进U-Net网络的腺体细胞图像分割算法 被引量:11
9
作者 贝琛圆 于海滨 +2 位作者 潘勉 蒋洁 吕炳赟 《电子科技》 2019年第11期18-22,共5页
针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金... 针对腺体图像在自动分割过程中由于多尺度目标和信息丢失影响导致准确率降低的问题,文中采用了一种引入注意力模块的全卷积神经网络模型。该模型遵循编码器-解码器结构,在编码网络中用空洞残差卷积层代替原有的普通卷积层,并添加空洞金字塔池;再在解码网络中加入注意力模块,使模型输出高分辨率特征图,提高对多尺度目标的分割精度。实验结果表明,提出的网络模型参数少分割精度高,对腺体图像的平均分割精度高达89.7%,具有较好的鲁棒性。 展开更多
关键词 全卷积神经网络 编码器-解码器结构 空洞金字塔池 注意力模块 高分辨率特征图 分割精度高
下载PDF
利用Deeplab v3提取高分辨率遥感影像道路 被引量:10
10
作者 韩玲 杨朝辉 +2 位作者 李良志 刘志恒 黄勃学 《遥感信息》 CSCD 北大核心 2021年第1期22-28,共7页
针对传统道路提取方法存在的道路边缘粗糙、抗干扰性弱、提取精度低等问题,提出了一种基于编码解码器的空洞卷积模型(Deeplab v3)的道路提取方法。首先,对原始高分辨率遥感影像进行标注;其次,利用标注数据集对Deeplab v3模型进行训练、... 针对传统道路提取方法存在的道路边缘粗糙、抗干扰性弱、提取精度低等问题,提出了一种基于编码解码器的空洞卷积模型(Deeplab v3)的道路提取方法。首先,对原始高分辨率遥感影像进行标注;其次,利用标注数据集对Deeplab v3模型进行训练、测试;最后,得到高分辨率遥感影像道路提取结果。分析结果可知,该模型能够较好地提取高分辨率遥感影像中的道路边缘特征,相比其他道路提取方法具有更高的提取精度和更加完整的道路信息,正确率可达到93%以上。 展开更多
关键词 道路提取 高分辨率遥感影像 深度学习 Deeplab v3 空洞卷积 空洞空间金字塔池化(ASPP)
下载PDF
基于多尺度特征编码和双重注意力融合的绝缘子缺陷检测 被引量:9
11
作者 李利荣 陈鹏 +3 位作者 张云良 张开 熊炜 巩朋成 《激光与光电子学进展》 CSCD 北大核心 2022年第24期73-82,共10页
针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征... 针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征,并在之后嵌入空洞空间金字塔池化模块实现多个尺度捕捉绝缘子及其缺陷的特征;其次,为了减少解码网络中特征信息的缺失,将主干网络的不同层特征与efficient channel attention注意力模块串联,并分别与经过squeeze and excitation注意力模块的各反卷积特征相加形成双重注意力融合。实验结果表明,所提方法的均值平均精度值约为95.35%,每秒传输帧数约为65.95,与其他方法相比,该方法对无人机绝缘子缺陷的准确检测具有一定的参考价值。 展开更多
关键词 图像处理 绝缘子缺陷检测 空洞空间金字塔池化 多尺度特征编码 双重注意力融合
原文传递
Res_ASPP_UNet++:结合分离卷积与空洞金字塔的遥感影像建筑物提取网络 被引量:8
12
作者 吕少云 李佳田 +3 位作者 阿晓荟 杨超 杨汝春 尚晓梅 《遥感学报》 EI CSCD 北大核心 2023年第2期502-519,共18页
针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atr... 针对连续池化操作丢失低层语义信息而导致建筑物提取精度低的问题,尝试以UNet++网络为基础,通过将编码器的标准卷积及最大池化替换成深度可分离卷积,以及在编码器末端利用不同采样率的空洞卷积构建多尺度空洞空间金字塔池化结构ASPP(Atrous Spatial Pyramid Pooling)来提升网络性能,并将改进后的建筑物提取网络称为残差空洞空间金字塔网络(Res_ASPP_UNet++)。为验证Res_ASPP_UNet++网络结构的有效性和适用性,以经过数据增强预处理的WHU和Massachusetts数据集作为数据源,对Res_ASPP_UNet++网络与目前常用的语义分割网络进行了试验和精度评估,并将Res_ASPP_UNet++网络与文献中的研究成果进行了对比。结果表明Res_ASPP_UNet++在模型参数量与精度两个方面均表现出优势,能够在大幅压缩模型参数量的前提下,显著提升建筑物提取精度,提取建筑物的边界更加平滑和精确,对不同尺度的建筑物表现出较强的泛化能力。 展开更多
关键词 遥感影像 建筑物提取 UNet++ 深度可分离卷积 深度残差结构 空洞空间金字塔池化
原文传递
改进YOLOv5s算法的地铁场景行人目标检测 被引量:8
13
作者 张秀再 邱野 张晨 《激光与光电子学进展》 CSCD 北大核心 2023年第6期134-143,共10页
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性.针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果.构建地铁场景行人数据集,... 地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性.针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果.构建地铁场景行人数据集,标注对应标签,进行数据预处理操作.本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框.实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著. 展开更多
关键词 行人目标检测 YOLOv5s 注意力机制 改进空洞空间金字塔池化
原文传递
实时视觉目标跟踪与视频对象分割多任务框架 被引量:8
14
作者 李瀚 刘坤华 +1 位作者 刘嘉杰 张晓晔 《中国图象图形学报》 CSCD 北大核心 2021年第1期101-112,共12页
目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧... 目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差。针对此问题,本文提出一个融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架。方法文中提出的架构使用了由空洞深度可分离卷积组成的更加多尺度的空洞空间金字塔池化模块,以及具备帧间信息的帧间掩模传播模块,使得网络对多尺度目标对象分割能力更强,同时具备更好的鲁棒性。结果本文方法在视觉目标跟踪VOT-2016和VOT-2018数据集上的期望平均重叠率(expected average overlap,EAO)分别达到了0.462和0.408,分别比Siam Mask高了0.029和0.028,达到了最先进的结果,并且表现出更好的鲁棒性。在视频对象分割DAVIS(densely annotated video segmentation)-2016和DAVIS-2017数据集上也取得了有竞争力的结果。其中,在多目标对象分割DAVIS-2017数据集上,本文方法比Siam Mask有更好的性能表现,区域相似度的杰卡德系数的平均值J_(M)和轮廓精确度的F度量的平均值F_(M)分别达到了56.0和59.0,并且区域和轮廓的衰变值J_(D)和F_(D)都比Siam Mask中的低,分别为17.9和19.8。同时运行速度为45帧/s,达到了实时的运行速度。结论文中提出的融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架,充分捕捉了多尺度上下文信息并且利用了视频帧间的信息,使得网络对多尺度目标对象分割能力更强的同时具备更好的鲁棒性。 展开更多
关键词 视觉目标跟踪 视频对象分割 全卷积网络 空洞空间金字塔池化 帧间掩模传播
原文传递
健身行为的人体姿态估计及动作识别 被引量:4
15
作者 付惠琛 高军伟 车鲁阳 《液晶与显示》 CAS CSCD 北大核心 2024年第2期217-227,共11页
人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法... 人体姿态估计和动作识别在安防、医疗和运动等领域有着重要的应用价值。为了解决不同背景及角度下各类运动动作的人体姿态估计和动作识别问题,本文提出了一种改进的YOLOv7-POSE算法,并自行拍摄制作各种拍摄角度的数据集进行训练。此算法以YOLOv7为基础,对原始网络模型添加了分类的功能,在Backbone主干网络中引入CA卷积注意力机制,提升了网络在对人体骨骼关节点和动作的分类的重要特征的识别能力。用HorNet网络结构代替原模型的CBS卷积核,提高了模型的人体关键点检测精度和动作分类的准确度。将Head层的空间金字塔池化结构替换为空洞空间金字塔池化结构,提升了检测精度并且加快了模型收敛。将目标检测框的回归函数由CIOU替换为EIOU,提高了坐标回归的精度。设计了两组对照实验,实验结果证明,改进后的YOLOv7-POSE在验证集上的mAP为95.7%,相比于原始YOLOv7算法提高了4%,各类运动动作识别准确率显著上升,在实际推理中的关键点错检、漏检等情况明显减少,关键点位置估计误差明显降低。 展开更多
关键词 图像处理 关键点检测 姿态估计 注意力机制 空洞空间金字塔池化
下载PDF
基于全卷积网络的图像语义分割算法 被引量:8
16
作者 李英杰 张惊雷 《计算机应用与软件》 北大核心 2020年第8期213-218,273,共7页
基于卷积神经网络的语义分割模型易存在提取特征不充分、上采样恢复原图尺寸时丢失细节等问题,导致分割精度降低。对比提出一种基于全卷积网络DeepLab v3的改进算法。采用LeakyReLU激活函数,增强网络提取较弱特征的能力;输入图像在多孔... 基于卷积神经网络的语义分割模型易存在提取特征不充分、上采样恢复原图尺寸时丢失细节等问题,导致分割精度降低。对比提出一种基于全卷积网络DeepLab v3的改进算法。采用LeakyReLU激活函数,增强网络提取较弱特征的能力;输入图像在多孔空间金字塔池化(ASPP)后,使用密集上采样卷积(DUC)恢复与原图尺寸一致的预测图;在训练时使用Nadam优化器,提高网络的收敛速度和鲁棒性。在PASCAL VOC 2012数据集上进行了验证与评测,结果表明算法平均交并比(mIoU)相比于原算法提高0.6%。 展开更多
关键词 语义分割 深度卷积网络 多孔空间金字塔池化 密集上采样卷积
下载PDF
基于改进Deeplab V3+网络的语义分割 被引量:8
17
作者 席一帆 孙乐乐 +1 位作者 何立明 吕悦 《计算机系统应用》 2020年第9期178-183,共6页
深度学习的语义分割在计算机视觉领域中有非常广阔的发展前景,但许多分割效果较好网络模型占用内存大和处理单张图片耗时长.针对这个问题,把Deeplab V3+模型的骨干网(ResNet101)的瓶颈单元设计为1D非瓶颈单元,且对空洞空间金字塔池化模... 深度学习的语义分割在计算机视觉领域中有非常广阔的发展前景,但许多分割效果较好网络模型占用内存大和处理单张图片耗时长.针对这个问题,把Deeplab V3+模型的骨干网(ResNet101)的瓶颈单元设计为1D非瓶颈单元,且对空洞空间金字塔池化模块(Atrous Spatial Pyramid Pooling,ASPP)的卷积层进行分解.该算法能大幅度降低Deeplab V3+网络的参数量,提高网络推理速度.基于PASCAL VOC 2012数据集进行对比实验,实验结果显示改进网络模型拥有更快的处理速度和更优的分割效果,且消耗更少的内存. 展开更多
关键词 语义分割 Deeplab V3+模型 骨干网(ResNet101) 1D非瓶颈单元 空洞空间金字塔池化(ASPP)
下载PDF
基于卷积神经网络的语义分割算法研究 被引量:7
18
作者 熊炜 童磊 +3 位作者 金靖熠 王传胜 王娟 曾春艳 《计算机应用研究》 CSCD 北大核心 2021年第4期1261-1264,共4页
针对语义分割中残差网络并不能完好地提取图像信息和分割效果差的问题,提出一种联合特征金字塔模型(JFP)用来融合残差网络的输出特征,并结合暗黑空间金字塔池化模型(ASPP)进一步提取特征。在解码部分应用简单的解码结构,恢复图像尺寸完... 针对语义分割中残差网络并不能完好地提取图像信息和分割效果差的问题,提出一种联合特征金字塔模型(JFP)用来融合残差网络的输出特征,并结合暗黑空间金字塔池化模型(ASPP)进一步提取特征。在解码部分应用简单的解码结构,恢复图像尺寸完成语义分割;同时引入注意力模型作为辅助语义分割网络,辅助神经网络进行训练。该方法分别在Pascal VOC 2012数据集和增强的Pascal VOC 2012数据集上对网络进行训练,并在Pascal VOC 2012的验证集上进行测试,其平均交并集之比(mIoU)分别达到了78.55%和80.14%,表明该方法具有良好的语义分割性能。 展开更多
关键词 图像语义分割 联合特征金字塔模型 暗黑空间金字塔模型 注意力模型
下载PDF
基于多尺度特征模糊卷积神经网络的遥感图像分割 被引量:3
19
作者 马翔悦 徐金东 倪梦莹 《山东大学学报(工学版)》 CAS CSCD 北大核心 2024年第3期44-54,共11页
为解决高分辨率遥感图像“同谱异物、同物异谱”的不确定性以及大量空间信息利用率低的问题,提出一种基于多尺度特征的模糊卷积神经网络模型。该模型在长跳跃连接部分加入模糊学习模块去除噪声特征,缓解类别间的不确定性;利用多孔空间... 为解决高分辨率遥感图像“同谱异物、同物异谱”的不确定性以及大量空间信息利用率低的问题,提出一种基于多尺度特征的模糊卷积神经网络模型。该模型在长跳跃连接部分加入模糊学习模块去除噪声特征,缓解类别间的不确定性;利用多孔空间金字塔池化融合多尺度特征,提取完备的空间上下文信息,提升分割性能。试验结果表明,该模型在Potsdam数据集和Vaihingen数据集上的整体准确度分别达到92.65%和93.19%,明显优于现有流行的深度学习模型,能够显著提升高分辨率遥感图像的语义分割性能。 展开更多
关键词 模糊学习 多孔空间金字塔池化 多尺度特征 编码器-解码器 卷积神经网络
原文传递
基于小目标类别注意力机制与特征融合的AF-ICNet非结构化场景语义分割方法 被引量:6
20
作者 艾青林 张俊瑞 吴飞青 《光子学报》 EI CAS CSCD 北大核心 2023年第1期181-194,共14页
针对非结构化道路分割难度大、小目标检测精度较低等问题,构建基于小目标类别注意力机制与特征融合的AF-ICNet轻量级实时语义分割网络。采用空洞空间卷积池化金字塔融合不同尺度特征感受野以增强网络的全局感知能力。嵌入CA注意力机制,... 针对非结构化道路分割难度大、小目标检测精度较低等问题,构建基于小目标类别注意力机制与特征融合的AF-ICNet轻量级实时语义分割网络。采用空洞空间卷积池化金字塔融合不同尺度特征感受野以增强网络的全局感知能力。嵌入CA注意力机制,建立通道信息和空间位置信息以增强网络对非结构化道路小目标类别语义特征的提取能力。针对类别分布不均衡问题,改进权重交叉熵损失函数。利用AF-ICNet模型对Cityscapes与IDD数据集进行训练,在Cityscapes测试图像中分割的MIoU达到了71.5%,在IDD测试图像中分割的MIoU达到了62.5%。搭建实验测试系统进行实景测试,测试结果表明,AF-ICNet有效提升了非结构化道路及小目标类别的分割精度,并满足测试的实时性要求。 展开更多
关键词 小目标类别语义分割 AF-ICNet CA注意力机制 空洞空间卷积池化金字塔 损失函数
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部