期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
Attention Res-Unet:一种高效阴影检测算法 被引量:11
1
作者 董月 冯华君 +2 位作者 徐之海 陈跃庭 李奇 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2019年第2期373-381,406,共10页
图像中阴影像素的存在会导致图像内容的不确定性,对计算机视觉任务有害,因此常将阴影检测作为计算机视觉算法的预处理步骤.提出全新的阴影检测网络结构,通过结合输入图像中包含的语义信息和像素之间的关联,提升网络性能.使用预训练后的... 图像中阴影像素的存在会导致图像内容的不确定性,对计算机视觉任务有害,因此常将阴影检测作为计算机视觉算法的预处理步骤.提出全新的阴影检测网络结构,通过结合输入图像中包含的语义信息和像素之间的关联,提升网络性能.使用预训练后的深层网络ResNeXt101作为特征提取前端,提取图像的语义信息,并结合U-net的设计思路,搭建网络结构,完成特征层的上采样过程.在输出层之前使用非局部操作,为每一个像素提供全局信息,建立像素与像素之间的联系.设计注意力生成模块和注意力融合模块,进一步提高检测准确率.分别在SBU、UCF这2个阴影检测数据集上进行验证,实验结果表明,所提方法的目视效果及客观指标皆优于此前最优方法所得结果,在2个数据集上的平均检测错误率分别降低14.4%和14.9%. 展开更多
关键词 阴影检测 特征提取 语义信息 像素关联 非局部操作 注意力机制 卷积神经网络(CNN)
下载PDF
像素聚合和特征增强的任意形状场景文本检测 被引量:6
2
作者 师广琛 巫义锐 《中国图象图形学报》 CSCD 北大核心 2021年第7期1614-1624,共11页
目的获取场景图像中的文本信息对理解场景内容具有重要意义,而文本检测是文本识别、理解的基础。为了解决场景文本识别中文字定位不准确的问题,本文提出了一种高效的任意形状文本检测器:非局部像素聚合网络。方法该方法使用特征金字塔... 目的获取场景图像中的文本信息对理解场景内容具有重要意义,而文本检测是文本识别、理解的基础。为了解决场景文本识别中文字定位不准确的问题,本文提出了一种高效的任意形状文本检测器:非局部像素聚合网络。方法该方法使用特征金字塔增强模块和特征融合模块进行轻量级特征提取,保证了速度优势;同时引入非局部操作以增强骨干网络的特征提取能力,使其检测准确性得以提高。非局部操作是一种注意力机制,能捕捉到文本像素之间的内在关系。此外,本文设计了一种特征向量融合模块,用于融合不同尺度的特征图,使尺度多变的场景文本实例的特征表达得到增强。结果本文方法在3个场景文本数据集上与其他方法进行了比较,在速度和准确度上均表现突出。在ICDAR(International Conference on Document Analysis and Recognition)2015数据集上,本文方法比最优方法的F值提高了0.9%,检测速度达到了23.1帧/s;在CTW(Curve Text in the Wild)1500数据集上,本文方法比最优方法的F值提高了1.2%,检测速度达到了71.8帧/s;在Total-Text数据集上,本文方法比最优方法的F值提高了1.3%,检测速度达到了34.3帧/s,远远超出其他方法。结论本文方法兼顾了准确性和实时性,在准确度和速度上均达到较高水平。 展开更多
关键词 目标检测 场景文本检测 神经网络 非局部模块 像素聚合 实时检测 任意形状
原文传递
基于卷积循环网络与非局部模块的语音增强方法 被引量:4
3
作者 李辉 景浩 +1 位作者 严康华 徐良浩 《电子科技》 2022年第3期8-15,共8页
现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想。针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法。通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进... 现有的深度神经网络语音增强方法忽视了相位谱学习的重要性,从而造成增强语音质量不理想。针对这一问题,文中提出了一种基于卷积循环网络与非局部模块的语音增强方法。通过设计一种编解码网络,将语音信号的时域表示作为编码端的输入进行深层特征提取,从而充分利用语音信号的幅值信息以及相位信息。在编码端和解码端的卷积层中加入非局部模块,在提取语音序列关键特征的同时,抑制无用特征,并引入门控循环单元网络捕捉语音序列间的时序相关性信息。在ST-CMDS中文语音数据集上实验结果表明,与未处理的含噪语音相比,使用文中方法生成的增强语音质量和可懂度平均提升了61%和7.93%。 展开更多
关键词 语音增强 深度神经网络 卷积循环网络 非局部模块 监督学习 门控循环单元 幅值谱 相位谱
下载PDF
基于非局部高分辨率网络的轻量化人体姿态估计方法 被引量:3
4
作者 孙琪翔 何宁 +1 位作者 张敬尊 宏晨 《计算机应用》 CSCD 北大核心 2022年第5期1398-1406,共9页
人体姿态估计是计算机视觉中的基本任务之一,可应用于动作识别、游戏、动画制作等领域。当前深度网络模型的设计大多通过加深网络以获得更好的性能,结果导致计算资源的需求超出嵌入式设备和移动设备的计算能力,达不到实际应用要求。针... 人体姿态估计是计算机视觉中的基本任务之一,可应用于动作识别、游戏、动画制作等领域。当前深度网络模型的设计大多通过加深网络以获得更好的性能,结果导致计算资源的需求超出嵌入式设备和移动设备的计算能力,达不到实际应用要求。针对上述问题,提出了一种融合Ghost模块结构的轻量级网络模型,即使用Ghost模块替换原高分辨率网络中的基础模块,从而减少网络模型的参数量。此外,设计了非局部高分辨率网络,即在网络1/32分辨率阶段融合非局部网络模块,使网络具有获取全局特征的能力,从而提高人体姿态估计的准确率,并在保证模型准确率的前提下降低网络参数量。在MPII人体姿态估计数据集和COCO人体姿态估计数据集上的实验结果表明,所提网络模型与原高分辨率网络相比,在网络模型参数量降低40%的情况下,人体姿态估计准确率提升了1.8个百分点。 展开更多
关键词 人体姿态估计 非局部模块 轻量化 Ghost模块 高分辨率网络
下载PDF
基于混合特征提取的细粒度图像识别方法 被引量:2
5
作者 李明峰 邵琳钰 蔡昌利 《南昌大学学报(工科版)》 CAS 2023年第3期297-306,共10页
由于细粒度图像类内差异大、类间差异小的特点,导致其识别具有较大的难度,针对该问题,提出了一种基于混合特征提取的细粒度图像识别方法。借助混合增强(Mixup)思想混合卷积神经网络中间层,提取类内和类间的特征信息,并通过非局部模块加... 由于细粒度图像类内差异大、类间差异小的特点,导致其识别具有较大的难度,针对该问题,提出了一种基于混合特征提取的细粒度图像识别方法。借助混合增强(Mixup)思想混合卷积神经网络中间层,提取类内和类间的特征信息,并通过非局部模块加强模型提取特征的能力。同时,为了降低Mixup方法引入的噪声和歧义,设计了与训练过程耦合的多损失函数。该模型在广泛使用的公开细粒度图像数据集CUB-200-2011和Stanford Cars上分别达到了87.4%和93.8%的识别精度,与多个基线方法相比有显著的性能提升。 展开更多
关键词 计算机视觉 细粒度图像识别 非局部模块 混合特征 多损失函数
下载PDF
基于上下文特征的视网膜血管分割算法 被引量:2
6
作者 彭仁杰 梁礼明 +1 位作者 冯骏 尹江 《科学技术与工程》 北大核心 2022年第2期600-605,共6页
针对视网膜血管分布复杂且多变,提出一种基于上下文特征提取的视网膜血管分割算法。首先通过霍特林变换(Karhunen-Loeve,K-L)生成灰度图并经过预处理增强对比度。然后经过局部信息熵进行采样。该网络编码部分的多感受野残差编码模块在... 针对视网膜血管分布复杂且多变,提出一种基于上下文特征提取的视网膜血管分割算法。首先通过霍特林变换(Karhunen-Loeve,K-L)生成灰度图并经过预处理增强对比度。然后经过局部信息熵进行采样。该网络编码部分的多感受野残差编码模块在兼顾速度的同时对特征进行充分的提取。同时底部的特征融合模块由非对称融合非局部模块和非对称金字塔非局部模块两部分组成,用于融合图片的上下文特征。而解码部分由多个微型U型网络组成,保证将底层特征和高层映射特征有效融合并进行深层次的再提取。本文算法在血管分割的数字视网膜图像数据集(digital retinal image for vessel extraction,DRIVE)数据集进行仿真,准确率为96.45%,特异性为98.37%,敏感度为82.7%,实验结果表明能有效地分割视网膜血管。 展开更多
关键词 上下文特征 视网膜血管分割 多重感受野 非局部模块
下载PDF
深度学习在视频动作识别中的应用 被引量:2
7
作者 潘陈听 《计算技术与自动化》 2020年第4期123-127,共5页
快速有效地识别出视频中的人体动作,具有极其广泛的应用前景及潜在的经济价值,深度学习的火热给视频动作自动识别带来了巨大的发展。提出了一种基于深度学习和非局域平均法的自注意时间段网络,作用于剪切好的视频片段。通过构造非局域... 快速有效地识别出视频中的人体动作,具有极其广泛的应用前景及潜在的经济价值,深度学习的火热给视频动作自动识别带来了巨大的发展。提出了一种基于深度学习和非局域平均法的自注意时间段网络,作用于剪切好的视频片段。通过构造非局域模块并将其加入到以ResNet为基本模型的时间段网络,可以得到新模型。经过在TDAP数据集上验证,该模型可较为精确地识别出人体动作,与原有模型相比在不增加时间复杂度的前提下有一定程度的提升。 展开更多
关键词 动作识别 非局域模块 时间段网络
下载PDF
引入全局上下文模块和高效注意力机制的车辆跟踪算法 被引量:1
8
作者 李畅 王一丁 +1 位作者 孙芮 何忠贺 《科学技术与工程》 北大核心 2022年第11期4424-4433,共10页
孪生全卷积神经网络目标跟踪算法(SiamFC)近些年成为车辆跟踪领域的研究热点。但该算法缺乏对目标车辆的深层特征提取和整体感知,在背景复杂、低分辨率、光照变化的情况下容易跟丢。提出使用深度残差网络ResNet50作为主干网络,根据跟踪... 孪生全卷积神经网络目标跟踪算法(SiamFC)近些年成为车辆跟踪领域的研究热点。但该算法缺乏对目标车辆的深层特征提取和整体感知,在背景复杂、低分辨率、光照变化的情况下容易跟丢。提出使用深度残差网络ResNet50作为主干网络,根据跟踪模型特性,从剪裁特征图、调整网络总步长和嵌入高效通道注意力模块三方面对其进行优化,高效提取特征的同时增强模型的差异化认知,并在分支网络引入全局上下文模块(non-local network,NLNet),增强跟踪模型对目标车辆的整体感知。经实验证明,提出的算法在低分辨率、光照变化和复杂背景的情况下跟踪速度和鲁棒性显著提升。在VOT2018和OTB2015数据集中测试均能得到较好的跟踪结果,与经典跟踪模型SiamFC相比,在OTB2015数据集中测试的跟踪精度提高了5.5%,跟踪成功率提高了2.7%,跟踪速度提高了14%可达98帧/s。 展开更多
关键词 孪生神经网络 车辆跟踪 高效注意力模块 全局上下文模块
下载PDF
复杂背景下基于深度学习的视频动作识别 被引量:1
9
作者 潘陈听 谭晓阳 《计算机与现代化》 2020年第7期97-103,共7页
快速有效地识别视频中的人体动作,具有广泛的应用前景及潜在的经济价值。但目前的视频动作识别方法易受到运动人体晃动、背景变化、摄相机抖动、运动人体阴影等背景因素影响。为解决上述问题,本文提出一种非局域时间段网络方法。该方法... 快速有效地识别视频中的人体动作,具有广泛的应用前景及潜在的经济价值。但目前的视频动作识别方法易受到运动人体晃动、背景变化、摄相机抖动、运动人体阴影等背景因素影响。为解决上述问题,本文提出一种非局域时间段网络方法。该方法在双流网络的基础上,通过加入非局域计算使网络能关注到更大时空范围的信息,并进一步融入光流信息使网络更精确地将注意力放在动作区域,从而增强对视频复杂静态背景的鲁棒性。此外,为了融合双流分段网络的多路判别结果,本文使用可学习的加权平均取代简单平均来融合多模态信息。经过在TDAP数据集上的实验验证,本文的模型可在复杂背景下较为精确地识别出人体动作,与原有模型相比在几乎不增加时间复杂度的前提下提升了识别性能。 展开更多
关键词 动作识别 非局域模块 时间段网络 复杂背景 自注意力
下载PDF
面向大规模多类别的病虫害识别模型 被引量:12
10
作者 温长吉 王启锐 +4 位作者 陈洪锐 吴建双 倪军 杨策 苏恒强 《农业工程学报》 EI CAS CSCD 北大核心 2022年第8期169-177,共9页
早期病虫害精准识别是预警和防控的关键,但是病虫害种类繁多数量巨大,外部形态存在类间相似度较高而类内差异性较大等性状特征,导致病虫害识别仍然是一项极具挑战的工作。为实现病虫害识别分类任务中差异化特征的提取和表示,该研究提出... 早期病虫害精准识别是预警和防控的关键,但是病虫害种类繁多数量巨大,外部形态存在类间相似度较高而类内差异性较大等性状特征,导致病虫害识别仍然是一项极具挑战的工作。为实现病虫害识别分类任务中差异化特征的提取和表示,该研究提出一种大规模多类别精细病虫害识别网络模型(a large-scale multi-category fine-grained pest and disease network,PD-Net)。首先通过在基准网络模型中引入卷积块注意力模型,通过混合跨特征通道域和特征空间域实现模型在通道和空间两个维度上对关键特征提取和表示,用以增强网络对差异化特征的提取和表示能力。其次引入跨层非局部模块,提升模型在多个特征提取层之间对于多尺度特征的融合。在61类病害数据集和102类虫害数据集上的试验结果表明,对比AlexNet、VGG16、GoogleNet、Inception-v3、DenseNet121和ResNet50模型,该研究提出的面向大规模多类别病虫害识别模型,Top1识别准确率在病害和虫害集上分别达到88.617%和74.668%,精确率分别达到了0.875和0.745,召回率分别达到0.874和0.738,F1值达到0.874和0.732,试验结果对比其他模型均有一定幅度的提升,验证了PD-Net模型在大规模多类别病虫害识别上的有效性。 展开更多
关键词 模型 深度学习 病虫害 精细分类 卷积块注意力模块 跨层非局部模块
下载PDF
基于轻量级图卷积的人体骨架动作识别方法 被引量:8
11
作者 孙琪翔 何宁 +1 位作者 张聪聪 刘圣杰 《计算机工程》 CAS CSCD 北大核心 2022年第5期306-313,共8页
视频中的人体动作识别在计算机视觉领域得到广泛关注,基于人体骨架的动作识别方法可以明确地表现人体动作,因此已逐渐成为该领域的重要研究方向之一。针对多数主流人体动作识别方法网络参数量大、计算复杂度高等问题,设计一种融合多流... 视频中的人体动作识别在计算机视觉领域得到广泛关注,基于人体骨架的动作识别方法可以明确地表现人体动作,因此已逐渐成为该领域的重要研究方向之一。针对多数主流人体动作识别方法网络参数量大、计算复杂度高等问题,设计一种融合多流数据的轻量级图卷积网络,并将其应用于人体骨架动作识别任务。在数据预处理阶段,利用多流数据融合方法对4种特征数据流进行融合,通过一次训练就可得到最优结果,从而降低网络参数量。设计基于图卷积网络的非局部网络模块,以捕获图像的全局信息从而提高动作识别准确率。在此基础上,设计空间Ghost图卷积模块和时间Ghost图卷积模块,从网络结构上进一步降低网络参数量。在动作识别数据集NTU60 RGB+D和NTU120 RGB+D上进行实验,结果表明,与近年主流动作识别方法ST-GCN、2s AS-GCN、2s AGCN等相比,基于该轻量级图卷积网络的人体骨架动作识别方法在保持较低网络参数量的情况下能够取得较高的识别准确率。 展开更多
关键词 人体骨架动作识别 数据融合 图卷积 非局部网络模块 Ghost网络
下载PDF
基于非局部高分辨率网络的人体姿态估计方法 被引量:5
12
作者 孙琪翔 张睿哲 +1 位作者 何宁 张聪聪 《计算机工程与应用》 CSCD 北大核心 2022年第13期227-234,共8页
人体姿态估计是计算机视觉中的基础任务,其可应用于动作识别、游戏、动画制作等。受非局部均值方法的启发,设计了非局部高分辨率网络(non-local high-resolution,NLHR),在原始图像1/32分辨率的网络阶段融合非局部网络模块的,使网络有了... 人体姿态估计是计算机视觉中的基础任务,其可应用于动作识别、游戏、动画制作等。受非局部均值方法的启发,设计了非局部高分辨率网络(non-local high-resolution,NLHR),在原始图像1/32分辨率的网络阶段融合非局部网络模块的,使网络有了获取全局特征的能力,从而提高人体姿态估计的准确率。NLHR网络在MPII数据集上训练,在MPII验证集上测试,PCKh@0.5评价标准下的平均准确率为90.5%,超过HRNet基线0.2个百分点;在COCO人体关键点检测数据集上训练,在COCO验证集上测试,平均准确率为76.7%,超过HRNet基线2.3个百分点。通过3组消融实验,验证NLHR网络针对人体姿态估计在精度上能够超过现有的人体姿态估计网络。 展开更多
关键词 人体姿态估计 非局部均值 非局部网络模块 HRNet基线
下载PDF
基于改进YOWO算法的学生课堂行为识别
13
作者 徐鑫磊 张景异 《计算机系统应用》 2024年第4期113-122,共10页
当前,大部分的学生课堂行为识别工作主要基于单帧图像进行,忽略了行为的连贯性,因此不能充分利用视频信息来对学生的课堂行为进行准确刻画.所以,本文提出一种改进的YOWO算法模型,有效利用视频信息对学生课堂行为进行识别.首先,本文采集... 当前,大部分的学生课堂行为识别工作主要基于单帧图像进行,忽略了行为的连贯性,因此不能充分利用视频信息来对学生的课堂行为进行准确刻画.所以,本文提出一种改进的YOWO算法模型,有效利用视频信息对学生课堂行为进行识别.首先,本文采集某高校真实课堂教学中的授课录像,制作出包含5类学生课堂行为的AVA格式视频数据集;其次,采用时移模块TSM(temporal shift module),用来增强模型获取时间上下文信息的能力;最后,采用非局部操作模块non-local来提高模型提取关键位置信息的能力.实验结果表明,通过对YOWO模型的优化,使得网络的识别性能更佳.在学生课堂行为数据集上,改进后的算法的mAP值为95.7%,相较于原YOWO算法在mAP值上提高了4.6%;模型参数量为81.97×10^(6),计算量为22.6 GFLOPs,参数量和计算量分别降低32.3%和9.6%;检测速度为24.03 f/s,提升了约3 f/s. 展开更多
关键词 YOWO算法 TSM non-local 学生课堂行为 行为识别 注意力机制
下载PDF
一种双注意力融合生成对抗网络的水下图像增强模型 被引量:1
14
作者 胡海峰 李凤英 《桂林电子科技大学学报》 2023年第5期371-380,共10页
针对水下图像在生成过程中会受到水下杂质污染以及光的吸收等问题,提出了一种双注意力融合生成对抗网络的水下图像增强模型。该模型使用了最新的Pix2Pix网络架构,并通过构建的双注意力机制结构建立丰富的上下文信息来处理水下图像,在模... 针对水下图像在生成过程中会受到水下杂质污染以及光的吸收等问题,提出了一种双注意力融合生成对抗网络的水下图像增强模型。该模型使用了最新的Pix2Pix网络架构,并通过构建的双注意力机制结构建立丰富的上下文信息来处理水下图像,在模型生成器UNet网络首部增加了改进型Non-local模块,从多尺度角度获取更多全局特征,从而得到更加清晰的图像,在生成器尾部引入了Transformer模块,通过其优异的多头注意力块和多层感知机等结构来提升模型综合性能,从而进一步提升模型语义信息提取能力。实验结果表明,该模型在基准数据集EUVP上的峰值信噪比、结构相似性、水下图像质量评价指标相比其他模型平均提升了5.83%、4.88%和18.02%,而在基准数据集EUVP上的相应指标平均提升了6.21%、17.33%和15.96%。在主观可视化结果下,该模型也能适当处理图像退化问题,使图像呈现更好的清晰度和对比度。 展开更多
关键词 生成对抗网络 全局信息 改进型non-local模块 双注意力融合 水下图像增强
下载PDF
联合特征细化和耐噪声对比学习的无监督行人重识别 被引量:1
15
作者 钱亚萍 王凤随 +1 位作者 熊磊 闫涛 《光电子.激光》 CAS CSCD 北大核心 2023年第7期762-770,共9页
针对无监督行人重识别(person re-identification,ReID)中行人特征表达不充分以及聚类过程产生噪声标签的问题,提出一种联合特征细化和耐噪声对比学习的无监督ReID方法。首先,为丰富无标记的行人表征,设计了非局部通道细化模块(non-loca... 针对无监督行人重识别(person re-identification,ReID)中行人特征表达不充分以及聚类过程产生噪声标签的问题,提出一种联合特征细化和耐噪声对比学习的无监督ReID方法。首先,为丰富无标记的行人表征,设计了非局部通道细化模块(non-local channel refinement module,NCRM)对关键特征信息进行加权强化,其融合了非局部通道的重要特征来捕获无标记数据的类间区别表征,形成更具有鉴别度的特征描述符。其次,考虑到特征的充分表达,采用广义均值(generalized mean,GEM)池化自适应调整参数来增强不同细粒度区域信息的提取能力。再次,为了减轻噪声标签对网络的负面影响,设计了耐噪声的动态对比均衡(dynamic contrastive equilibrium,DCE)损失函数进行无监督联合学习。最终,在两个公共数据集上的实验结果验证了所提方法的有效性和先进性,mAP分别达到了83.1%和71.9%,优于其他先进方法。 展开更多
关键词 行人重识别(ReID) 无监督 深度特征网络 非局部通道细化模块(NCRM) 耐噪声对比学习
原文传递
融合带权非局部模块的铝型材表面缺陷分类
16
作者 王杰 潘凤 +3 位作者 张艳莎 谭棉 严晓波 王林 《计算机与现代化》 2023年第5期86-92,共7页
针对铝型材表面缺陷分类任务中存在的极端长宽比、小面积缺陷分类困难问题,提出基于融合带权非局部模块和辅助分类器的表面缺陷分类方法(Fusion of Weighted Non-local Modules and Auxiliary Classifier Networks,FWACNet)。该方法通... 针对铝型材表面缺陷分类任务中存在的极端长宽比、小面积缺陷分类困难问题,提出基于融合带权非局部模块和辅助分类器的表面缺陷分类方法(Fusion of Weighted Non-local Modules and Auxiliary Classifier Networks,FWACNet)。该方法通过提出带权非局部模块,利用点积相似度计算特征图空间上不同位置的相似性,以提升模型捕捉长距离依赖关系及上下文信息的能力;同时考虑到浅层特征中的纹理、边缘等细节信息会影响表面缺陷分类效果,设计深层和浅层特征融合的辅助分类器,以提升模型对浅层特征中细节信息的挖掘能力。为验证所提FWACNet方法的有效性,在公开的铝型材表面缺陷数据集上进行仿真实验,实验结果表明FWACNet较主流分类网络在极端长宽比、小面积的缺陷分类困难的问题上具有一定优势,分类准确率达95.7%。 展开更多
关键词 铝型材表面缺陷分类 带权非局部模块 特征融合 辅助分类器
下载PDF
位置感知注意力及其在行人重识别中的应用
17
作者 陈江萍 张索非 +2 位作者 宋越 吴晓富 林嘉 《计算机技术与发展》 2023年第1期150-156,共7页
行人重识别领域的众多工作都表明,采用多分支神经网络搭配注意力模块是一种实现高性能特征嵌入的有效方式。传统方案主要关注于多分支网络结构的设计,而在注意力机制的设计上存在明显不足,如当前注意力机制缺乏对特征位置信息的有效挖... 行人重识别领域的众多工作都表明,采用多分支神经网络搭配注意力模块是一种实现高性能特征嵌入的有效方式。传统方案主要关注于多分支网络结构的设计,而在注意力机制的设计上存在明显不足,如当前注意力机制缺乏对特征位置信息的有效挖掘和利用。为此,该文在多尺度特征金字塔分支(Feature Pyramid Branch, FPB)网络的框架下,分析了不同注意力模块的引入对系统性能的影响;在此基础上,讨论了两种在注意力机制中融入位置信息的方法,提出了一种新的位置感知注意力模块,该模块具有即插即用的优点,便于融入各种主干网络。在多个流行行人重识别标准数据集上的实验表明,融入位置感知注意力模块的FPB网络相比于原FPB网络,仅需增加0.29 M参数就可以显著提升最终的模型识别准确率:rank-1在Market1501上提高0.7百分点,在DukeMTMC上提高1.5百分点,在CUHK03-Labeled上提高2.4百分点,在CUHK03-Detected上提高3.8百分点。 展开更多
关键词 位置编码 非局部注意力模块 位置感知注意力模块 特征金字塔分支 行人重识别
下载PDF
双线性非局部特征结合中继监督网络用于视网膜血管分割
18
作者 杨东旭 赵红东 +1 位作者 耿立新 于快快 《中国医学物理学杂志》 CSCD 2022年第12期1516-1524,共9页
对眼底图像中的视网膜血管精准分割是检测多种疾病的关键技术,在相关疾病自动筛查系统中发挥着重要的作用。针对现存方法追求分割精度时忽略对算法复杂性的考虑,导致在资源受限的医疗设备上部署困难的问题。本文通过进一步合理减少卷积... 对眼底图像中的视网膜血管精准分割是检测多种疾病的关键技术,在相关疾病自动筛查系统中发挥着重要的作用。针对现存方法追求分割精度时忽略对算法复杂性的考虑,导致在资源受限的医疗设备上部署困难的问题。本文通过进一步合理减少卷积层的特征通道数量来轻量化分割网络并提出了BNIS-Net。该网络采用多尺度图像作为输入融合到编码过程中,使得不同感受野之间建立良好的联系,并提出一种双线性非局部模块来增强相关上下文信息的捕捉能力。最后,在解码过程中采用中继监督的策略,为解码部分各级输出提供监督来约束网络的学习,这样可以有效改善收敛行为使浅层部分得到充分训练。BNIS-Net以0.41 M的参数量在DRIVE、STARE和CHASE_DB1 3个公开数据集上分别取得了81.02%、81.07%、78.15%的DSC值和0.983 3、0.986 1、0.985 9的AUC值。通过大量对比实验和消融研究证明,该方法能够更好地分割血管的边缘细节。 展开更多
关键词 糖尿病视网膜病变 图像处理 视网膜血管分割 双线性非局部模块 多尺度输入 中继监督
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部