融合策略优选和双注意力的单阶段目标检测被引量：4

Single stage object detection algorithm based on fusing strategy optimization selection and dual attention mechanism

导出

摘要目的特征融合是改善模糊图像、小目标以及受遮挡物体等目标检测困难的有效手段之一,为了更有效地利用特征融合来整合不同网络层次的特征信息,显著表达其中的重要特征,本文提出一种基于融合策略优选和双注意力机制的单阶段目标检测算法FDA-SSD(fusion double attention single shot multibox detector)。方法设计融合策略优化选择方法,结合特征金字塔(feature pyramid network, FPN)来确定最优的多层特征图组合及融合过程,之后连接双注意力模块,通过对各个通道和空间特征的权重再分配,提升模型对通道特征和空间信息的敏感性,最终产生包含丰富语义信息和凸显重要特征的特征图组。结果本文在公开数据集PASCAL VOC2007(pattern analysis, statistical modelling and computational learning visual object classes)和TGRS-HRRSD-Dataset(high resolution remote sensing detection)上进行对比实验,结果表明,在输入为300×300像素的PASCAL VOC2007测试集上,FDA-SSD模型的精度达到79.8%,比SSD(single shot multibox detector)、RSSD(rainbow SSD)、DSSD(de-convolution SSD)、FSSD(feature fusion SSD)模型分别高了2.6%、1.3%、1.2%、1.0%,在Titan X上的检测速度为47帧/s(frame per second, FPS),与SSD算法相当,分别高于RSSD和DSSD模型12 FPS和37.5 FPS。在输入像素为300×300的TGRS-HRRSD-Dataset测试集上的精度为84.2%,在Tesla V100上的检测速度高于SSD模型10%的情况下,准确率提高了1.5%。结论通过在单阶段目标检测模型中引入融合策略选择和双注意力机制,使得预测的速度和准确率同时得到提升,并且对于小目标、受遮挡以及模糊图像等难目标的检测能力也得到较大提升。 Objective Object detection is essential to computer vision and in-depth learning recently. It has been widely used in industrial detection, intelligent transportation, human facial recognition and contexts. There are two main categories of recognized target detection algorithms. One of current target detection algorithms is two-stage algorithm, such as region-based convolution neural network(R-CNN), Fast R-CNN, online hard example mining(OHEM), Faster R-CNN, Mask R-CNN etc. The methods generate target candidate boxes first, and implement the candidate boxes classification and regression following. The other one is single-stage algorithms, such as you only look once(YOLO), single shot multibox detector(SSD) etc. In addition, the demonstrated corner network(CornerNet) & center network(CenterNet)-anchor free models have tried to ignore the anchor frame and conduct detection and matching based on key points, which has achieved quite good results, but there is still a little gap from the detection method based on anchor frame. In the practical application of single-stage target detection, a main challenging issue is target detection like blurred image, small target and occluded object, and the predicted performance and efficiency. Feature fusion can improve the detection ability of difficult targets effectively by fusing different deep and shallow features of the network, which has been used in many improved SSD models in common. However, most of the improved models use feature fusion methods directly, and the specific fusion strategies like the issues of fused graphs option and fused graphs processing. In addition, current attention mechanism can make the feature graph have a certain “focus” effect by giving dimension weight. The issue of combining attention mechanism to single-stage target detection effectively has its potentials. Method The shallow Visual Geometry Group(VGG) network in the original SSD algorithm is replaced by the deep residual network as the backbone network. First, an optimized selection meth

作者戴坤许立波黄世旸李鋆铃 Dai Kun;Xu Libo;Huang Shiyang;Li Yunling(School of Computer and Data Enginering,NingboTech Unixersity,Ningbo 315000,China)

机构地区浙大宁波理工学院计算机与数据工程学院

出处《中国图象图形学报》 CSCD 北大核心 2022年第8期2430-2443,共14页 Journal of Image and Graphics

基金国家自然科学基金项目(61872321) 宁波市科技创新2025重大专项项目(2019B10036,2020Z005)。

关键词单阶段目标检测 SSD算法特征金字塔(FPN) 特征融合注意力机制 single-stage object detection single shot multibox detector(SSD) feature pyramid network(FPN) feature fusion attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1葛宝义,左宪章,胡永江.视觉目标跟踪方法研究综述[J].中国图象图形学报,2018,23(8):1091-1107. 被引量：66
2方路平,何杭江,周国民.目标检测算法研究综述[J].计算机工程与应用,2018,54(13):11-18. 被引量：111
3刘涛,汪西莉.采用卷积核金字塔和空洞卷积的单阶段目标检测[J].中国图象图形学报,2020,0(1):102-112. 被引量：11
4郑浦,白宏阳,李伟,郭宏伟.复杂背景下的小目标检测算法[J].浙江大学学报（工学版）,2020,54(9):1777-1784. 被引量：17
5张焕龙,胡士强,杨国胜.基于外观模型学习的视频目标跟踪方法综述[J].计算机研究与发展,2015,52(1):177-190. 被引量：64
6尹宏鹏,陈波,柴毅,刘兆栋.基于视觉的目标检测与跟踪综述[J].自动化学报,2016,42(10):1466-1489. 被引量：289
7唐乾坤,胡瑜.基于正负锚点框均衡及特征对齐的单阶段目标检测算法[J].计算机辅助设计与图形学学报,2020,32(11):1773-1783. 被引量：2

二级参考文献133

1侯志强,韩崇昭.视觉跟踪技术综述[J].自动化学报,2006,32(4):603-617. 被引量：254
2万缨,韩毅,卢汉清.运动目标检测算法的探讨[J].计算机仿真,2006,23(10):221-226. 被引量：121
3王永忠,潘泉,赵春晖,程咏梅.一种对光照变化鲁棒的均值漂移跟踪方法[J].电子与信息学报,2007,29(10):2287-2291. 被引量：5
4王震宇,张可黛,吴毅,卢汉清.基于SVM和AdaBoost的红外目标跟踪[J].中国图象图形学报,2007,12(11):2052-2057. 被引量：11
5Adam A,Rivlin E,Shimshoni I.Robust fragments-basedtracking using theintegral histogram[C]// Proc of the 19th IEEE Computer Vision and Pattern Recognition.LosAlamitos,CA:IEEE Computer Society,2006;798-805. 被引量：1
6Comaniciu D,Ramesh V,Meer P.Kernel-based objecttracking[J],IEEE Trans on Pattern Analysis and Machine Intelligence,2003,25(5):564-575. 被引量：1
7Liang D,Huang Q,Jiang S,et al.Mean-shift blob trackingwith adaptive feature selection and scale adaptation[C]//Proc of the 11th IEEE Int Conf on Computer Vision.LosAlamitos,CA:IEEE Computer Society,2007:369-372. 被引量：1
8Ning J,Zhang L,Zhang D,et al.Scale and orientationadaptive mean shift tracking[J].Computer Vision,IET,2012,6(1);52-61. 被引量：1
9Yu T,Wu Y.Differential tracking based on spatial-appearance model (SAM)[C]// Proc of the 19th IEEE Computer Vision and Pattern Recognition.Los Alamitos,CA:IEEE Computer Society,2006:720-727. 被引量：1
10Han B,Davis L.On-line density-based appearance modeling for object tracking[C]// Proc of the 10th IEEE Int Conf onComputer Vision.Los Alamitos,CA:IEEE Computer Society,2005:1492-1499. 被引量：1

共引文献538

1吴道恒,朱恩昌,徐亮.基于尺度滤波器的时空上下文目标跟踪算法[J].中国水运（下半月）,2020,20(6):72-74.
2常天庆,张雷,褚凯轩,赵立阳,张杰.地面突击装备火控系统智能化技术发展研究[J].装甲兵学报,2022(1):89-97.
3张辉,易俊飞,王耀南,吴刘宸,陈瑞博.医药质量检测关键技术及其应用综述[J].仪器仪表学报,2020,41(3):1-17. 被引量：14
4郑浦,白宏阳,李政茂,郭宏伟.抖动干扰下运动目标精准检测与跟踪算法设计[J].仪器仪表学报,2019,40(11):90-98. 被引量：19
5王君至,张忠山,沈大勇,黄静波,王沛,闫俊刚.基于YOLOv3的人员照片标识识别算法研究[J].网络安全与数据治理,2023,42(S01):221-225.
6高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
7南晓虎,丁雷.深度学习的典型目标检测算法综述[J].计算机应用研究,2020,37(S02):15-21. 被引量：54
8陈丽君,薄纯娟,张俊星.基于UpYOLO的现实场景车标检测算法研究[J].计算机应用研究,2020,37(S01):400-402.
9陈金令,程茂凯,徐紫涵.改进型FCOS目标检测算法[J].计算机科学,2022,49(S02):467-472. 被引量：1
10付兴武,杨哲,姜文涛.因式分解卷积运算的多尺度目标跟踪算法[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):463-471.

同被引文献18

1宋志娜,眭海刚,李永成.高分辨率可见光遥感图像舰船目标检测综述[J].武汉大学学报（信息科学版）,2021,46(11):1703-1715. 被引量：12
2陈志芬,黄靖玲,李亚.适应城市消防规划需求的火灾风险评估研究[J].中国安全生产科学技术,2019,15(5):185-191. 被引量：17
3严娟,方志军,高永彬.结合混合域注意力与空洞卷积的3维目标检测[J].中国图象图形学报,2020,25(6):1221-1234. 被引量：3
4赵文清,孔子旭,周震东,赵振兵.增强小目标特征的航空遥感目标检测[J].中国图象图形学报,2021,26(3):644-653. 被引量：20
5王建明,黎向锋,叶磊,左敦稳,张丽萍.基于信道注意结构的生成对抗网络医学图像去模糊[J].计算机科学,2021,48(S01):101-106. 被引量：6
6聂光涛,黄华.光学遥感图像目标检测算法综述[J].自动化学报,2021,47(8):1749-1768. 被引量：56
7韦哲,李从利,沈延安,刘永峰,周浦城.基于两阶段模型的无人机图像厚云区域内容生成[J].计算机学报,2021,44(11):2233-2247. 被引量：4
8杜文汉,李东兴,王倩楠,武帅.融合改进帧差和边缘提取算法的运动目标检测[J].科学技术与工程,2022,22(5):1944-1949. 被引量：14
9江晗,张月婷,郭嘉逸,赵鑫,李芳芳,黄丽佳,胡玉新,雷斌,丁赤飚.遥感图像中油罐目标精确定位与参数提取[J].中国图象图形学报,2021,26(12):2953-2963. 被引量：3
10田枫,白欣宇,刘芳,姜文文,于巾涛.1种基于视频的油田危险区域入侵检测智能综合识别技术研究[J].中国安全生产科学技术,2022,18(3):68-75. 被引量：6

引证文献4

1石争浩,仵晨伟,李成建,尤珍臻,王泉,马城城.航空遥感图像深度学习目标检测技术研究进展[J].中国图象图形学报,2023,28(9):2616-2643. 被引量：3
2晋帅,李煊鹏,杨凤,张为公.伪激光点云增强的道路场景三维目标检测[J].中国图象图形学报,2023,28(11):3520-3535. 被引量：2
3赵泽华,王亚超,赵江平,张洪基.基于改进YOLOv7-x的多场景火灾识别算法[J].中国安全生产科学技术,2023,19(12):115-120.
4张浩,董锴龙,高尚兵,刘斌,华奇凡,张格.融合非临近跳连与多尺度残差结构的小目标车辆检测[J].中国图象图形学报,2023,28(12):3797-3809. 被引量：1

二级引证文献6

1张德银,赵志恒,谢逸戈,黄少晗.基于改进YOLOv8的遥感图像飞机目标检测研究[J].自动化应用,2024,65(2):193-195.
2潘培玉,刘宏州,孙欣,李瑞,石磊.基于多尺度特征增强的列车摘钩关键部件检测[J].信息技术与信息化,2024(1):122-125.
3周末.基于深度学习算法的遥感图像识别检测技术研究[J].信息记录材料,2024,25(4):162-164. 被引量：1
4郭宝云,姚玉凯,李彩林,王悦,孙娜,鲁一慧.改进的3D-BoNet算法应用于点云实例分割与三维重建[J].测绘通报,2024(6):30-35.
5贾明达,杨金明,孟维亮,郭建伟,张吉光,张晓鹏.融合点云与图像的环境目标检测研究进展[J].中国图象图形学报,2024,29(6):1765-1784.
6王梓祺,李阳,张睿,王家宝,李允臣,陈瑶.小样本SAR图像分类方法综述[J].中国图象图形学报,2024,29(7):1902-1920.

1陈观寿.智能网关在配网供电可靠性评估与策略优选算法中的应用[J].中国新技术新产品,2021(21):9-11. 被引量：1
2肖振久,宗佳旭,兰海,魏宪,唐晓亮.流形正则化约束的图像语义分割[J].中国图象图形学报,2022,27(4):1204-1215. 被引量：1
3郝思瑶,杨春兰,李志梅,任洁钏.基于局部一致性和多变量模式分析的颞叶癫痫诊断方法研究[J].医疗卫生装备,2022,43(6):1-6. 被引量：1
4李舒婷.传统节日文化在小学德育中的价值及策略[J].中小学班主任,2022(13):40-42. 被引量：1
5Yuzhou Zhang,Guang Gao,Lidan Shou,Dun Wu,Guangping Fang,Hua Sun.Developing Statistical Modellings to Investigate the Internal Drivers for the Trend of Output Values in the Manufacturing Industry:Evidence from Chinese Enterprises[J].Proceedings of Business and Economic Studies,2021,4(5):52-58.
6刘影,陈爽.微电影广告的情感叙事分析[J].新闻研究导刊,2022,13(8):18-20.
7昆西高中[J].世界建筑导报,2022,37(4):126-127.
8朱鑫彦.基于SD模型的陕西省农产品电商物流协调发展研究[J].农业工程,2022,12(6):157-160. 被引量：3
9沈雨.查士丁尼征服汪达尔人的策略优选[J].时代人物,2022(17):59-61.
10朱红瑞,谭代伦.改进快速单亲遗传算法解均衡多旅行商问题[J].六盘水师范学院学报,2022,34(3):96-105. 被引量：1

中国图象图形学报

2022年第8期

浏览历史

内容加载中请稍等...

融合策略优选和双注意力的单阶段目标检测被引量：4

参考文献7

二级参考文献133

共引文献538

同被引文献18

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

融合策略优选和双注意力的单阶段目标检测 被引量：4

参考文献7

二级参考文献133

共引文献538

同被引文献18

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

融合策略优选和双注意力的单阶段目标检测被引量：4