基于空间注意力的CNN特征增强方法被引量：4

Feature Augment of Convolutional Neural Network Based on Spatial Attention

下载PDF

导出

摘要卷积神经网络一般被用于特征提取,它通过提取图像底层的点、线、面的几何特征,进而映射到高层的语义特征,然而传统的卷积网络只对输入的样本进行宽泛的特征提取,而不会刻意去区分图像的前景和后景,这使得模型提取到的特征包含大量的背景噪声,降低了模型的表征能力。在空间注意力的基础上,提出了一种名为特征增强网络(FA-block)的卷积网络分支,这种网络结构从样本的掩膜中学习目标的空间分布,为原始特征图上的每一个像素点训练得到代表重要程度的权重,然后通过加权的方式突出特征图中的目标部位。此方法旨在抑制背景噪声,增强待学习的目标特征,让主干网络提取到的特征更加纯净。在PASCAL VOC数据集上的实验证明了FA-block的有效性,最后经过MS COCO数据集的验证,FA-block使得Faster Rcnn基线的性能提高了5.5%。 Convolutional neural network is generally used for feature extraction.It extracts the geometric features of points,lines and surfaces at the bottom of the image,and then maps them to high-level semantic features.However,the traditional convolution network only extracts general features from the input samples,instead of deliberately distinguishing the foreground and background,which makes the features extracted by the model contain a lot of background noise and weakens its representation ability.On the basis of spatial attention,a convolution branch called feature augment block(FA-block)is proposed.This network structure learns the spatial distribution of the target from the mask of the sample and acquires a weight representing the importance degree for each pixel,then highlights the target part by weighting.This method aims to suppress background noise and augment the target features to be learned,make the features extracted from the backbone network more pure.The experiment on Pascal VOC dataset proves the effectiveness of FA-block.Through the validation of MS COCO dataset,FA-block improves the performance of a group of baselines of Faster Rcnn by 5.5%.

作者许畅王朝辉 XU Chang;WANG Zhao-hui(School of Computer Science and Technology,Wuhan University of Science and Technology,Wuhan 430065,China)

机构地区武汉科技大学计算机科学与技术学院

出处《计算机技术与发展》 2022年第6期74-78,111,共6页 Computer Technology and Development

基金国家自然科学基金资助项目(61806150)。

关键词计算机视觉卷积神经网络空间注意力特征增强高频噪声抑制 computer vision convolution neural network spatial attention feature augment high frequency noise suppression

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1王浩滢.深度学习及其发展趋势研究综述[J].电子制作,2021,29(10):92-95. 被引量：8
2朱晓慧,钱丽萍,傅伟.图像数据增强技术研究综述[J].软件导刊,2021,20(5):230-236. 被引量：51
3朱张莉,饶元,吴渊,祁江楠,张钰.注意力机制在深度学习中的研究进展[J].中文信息学报,2019,33(6):1-11. 被引量：144
4卢泓宇,张敏,刘奕群,马少平.卷积神经网络特征重要性分析及增强特征选择模型[J].软件学报,2017,28(11):2879-2890. 被引量：29
5马世拓,班一杰,戴陈至力.卷积神经网络综述[J].现代信息科技,2021,5(2):11-15. 被引量：13

二级参考文献23

1王超学,张涛,马春森.面向不平衡数据集的改进型SMOTE算法[J].计算机科学与探索,2014,8(6):727-734. 被引量：25
2郭祥云,胡敏,王文胜,刘亚辉.基于深度学习的非结构环境下海参实时识别算法[J].北京信息科技大学学报（自然科学版）,2019,34(3):27-31. 被引量：5
3戴晓爱,郭守恒,任淯,杨晓霞,刘汉湖.基于堆栈式稀疏自编码器的高光谱影像分类[J].电子科技大学学报,2016,45(3):382-386. 被引量：24
4张董,游福成,王惠华,姜超,李明.受限制Boltzmann机深度置信网络与手写数字识别[J].北京印刷学院学报,2016,24(4):56-58. 被引量：4
5高鑫,欧阳宁,袁华.基于快速去噪和深度信念网络的高光谱图像分类方法[J].桂林电子科技大学学报,2016,36(6):469-476. 被引量：11
6张一飞,陈忠,张峰,欧阳超.基于栈式去噪自编码器的遥感图像分类[J].计算机应用,2016,36(A02):171-174. 被引量：12
7余涛.基于稀疏自编码器的手写体数字识别[J].数字技术与应用,2017,35(1):66-66. 被引量：8
8黄丽霞,王亚楠,张雪英,王洪翠.基于深度自编码网络语音识别噪声鲁棒性研究[J].计算机工程与应用,2017,53(13):49-54. 被引量：9
9朱芳枚,赵力,梁瑞宇,王青云,邹采荣.面向中文语音情感识别的改进栈式自编码结构[J].东南大学学报（自然科学版）,2017,47(4):631-636. 被引量：6
10刘辉海,赵星宇,赵洪山,宋鹏,邓春.基于深度自编码网络模型的风电机组齿轮箱故障检测[J].电工技术学报,2017,32(17):156-163. 被引量：49

共引文献240

1赵明明,蒋佳芹,尹泓澈,李礼,姚剑.基于非局部生成对抗网络的单张散焦图像去模糊[J].测绘地理信息,2022,47(S01):142-147.
2欧阳汉,廖文琪,田秋红.基于机器学习对电动汽车价格预测[J].广西质量监督导报,2021(4):204-206.
3弭博雯,田莹,王诗宁.基于优化卷积神经网络的人耳识别[J].辽宁科技大学学报,2018,41(4):299-307. 被引量：2
4肖弋.一种新的特征变换算法在网络数据安全检查中应用研究[J].科技通报,2019,35(5):127-131. 被引量：4
5冯晓荣,瞿国庆.基于深度学习与随机森林的高维数据特征选择[J].计算机工程与设计,2019,40(9):2494-2501. 被引量：16
6于游,付钰,吴晓平.中文文本分类方法综述[J].网络与信息安全学报,2019,5(5):1-8. 被引量：40
7方强强,朱全银,张柯文,冯万利,李翔,王文川,胥心心,王胜标.基于ATT-CNN的化工装备分类算法[J].淮阴工学院学报,2020,29(1):44-48.
8李晓莉,韩鹏,李晓光.基于典型样本的卷积神经网络技术[J].计算机工程与设计,2020,41(4):1113-1117. 被引量：2
9胡晓丽,张会兵,董俊超,吴冬强.基于CNN-LSTM的用户购买行为预测模型[J].计算机应用与软件,2020,37(6):59-64. 被引量：18
10高统超,张云华.基于注意力机制和RECWE模型的中文词向量方法[J].网络空间安全,2020,11(2):96-103.

同被引文献37

1朱伟伟.基于ZigBee的工程机械安全防护系统设计[J].国外电子测量技术,2022,41(2):78-83. 被引量：5
2魏立明,杨天野.基于图像增强和边缘检测的电力设备故障诊断研究[J].吉林建筑工程学院学报,2012,29(4):84-86. 被引量：4
3施兢业,刘俊,陆龚琪.电力设备红外图像的小波阈值去噪方法研究[J].光学技术,2017,43(2):162-165. 被引量：10
4黄文琦,许爱东,明哲,唐吉霖,胡浩基,邓子杰.基于生成对抗网络的变电站工作人员行为预测的方法[J].南方电网技术,2019,13(2):45-50. 被引量：14
5刘峰,朱强,干宗良.一种低复杂度的监控视频异物入侵检测算法[J].南京邮电大学学报（自然科学版）,2020,40(1):1-8. 被引量：5
6王德文,李业东.基于WGAN图片去模糊的绝缘子目标检测[J].电力自动化设备,2020,40(5):188-194. 被引量：16
7肖懿慧,雷新军,舒娟,余航.心脏听诊可视化数据库的建立和应用[J].实用心电学杂志,2020,29(3):185-187. 被引量：2
8王勋,王新,魏举锋.智能巡检系统在电力行业中的应用研究[J].四川水力发电,2021,40(1):109-112. 被引量：11
9李姣,郭鹏.基于ARGAN表面阴影预处理与迁移学习风电机组叶片故障识别[J].华北电力大学学报（自然科学版）,2021,48(2):73-79. 被引量：7
10马立新,豆晨飞,宋晨灿,杨天笑.基于特征融合卷积神经网络的绝缘子无损检测[J].电子科技,2021,34(7):26-30. 被引量：8

引证文献4

1陆嘉文,陈始圆,袁履凡,陈扶明,谢长勇,李川涛.基于Matlab深度学习的智能听诊系统应用程序开发[J].中国医学物理学杂志,2023,40(5):602-608. 被引量：1
2许放,欧清海,张晖,艾雪瑞,程方圆.基于移动终端双模定位的多场景入侵报警方法[J].电子设计工程,2024,32(9):6-10.
3蒋锐,陈儒娜,王小明,李大鹏,徐友云.基于注意力机制及多分支特征融合的实时语义分割算法[J].南京邮电大学学报（自然科学版）,2024,44(2):91-100.
4庄雪澄,邵洁.基于逐像素自适应对抗网络的电力巡检图像增强方法[J].南方电网技术,2024,18(6):138-147.

二级引证文献1

1龚浩,张莉莉,陈富荣,林丽霞,陈意君,张乐,孙春莲,孙键.基于深度神经网络的SSR分子标记对茶叶产地的溯源研究[J].广东农业科学,2023,50(9):108-116.

1张冀,曹艺,王亚茹,赵文清,翟永杰.融合VAE和StackGAN的零样本图像分类方法[J].智能系统学报,2022,17(3):593-601. 被引量：9
2西班牙推动发展循环经济[J].再生资源与循环经济,2022,15(5):46-46.
3老年人权益保护法律从不缺席中国老龄协会发布2021年度全国老年人权益保护警示教育案例[J].晚晴,2022(5):10-19.
4杨雨淇,王朕卿.基于SC-MCO法的煤炭企业安全绩效评价方法[J].北方经贸,2022(5):109-111.
5任诚,陈绪祥,唐斌文,王宇,李豪.多源多播服务功能链优化部署算法[J].计算机应用研究,2022,39(6):1814-1819.
6董君,邹斯晴,吴亮,于辉,齐琳.SN思维创新法在建筑设计教学中的应用[J].中国建筑教育,2021(1):138-142.

计算机技术与发展

2022年第6期

浏览历史

内容加载中请稍等...

基于空间注意力的CNN特征增强方法被引量：4

参考文献5

二级参考文献23

共引文献240

同被引文献37

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于空间注意力的CNN特征增强方法 被引量：4

参考文献5

二级参考文献23

共引文献240

同被引文献37

引证文献4

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于空间注意力的CNN特征增强方法被引量：4