基于补偿注意力机制的Siamese网络跟踪算法

Siamese Network Tracking Algorithm Based on Compensated Attention Mechanism

下载PDF

导出

摘要为了应对视觉目标跟踪中常见的目标尺寸变化、运动模糊、目标被遮挡、目标受相似物干扰等问题,提出一种基于补偿注意力机制的Siamese网络跟踪算法CDAM-Siam。首先采用Res Net-50网络构建Siamese的骨干网络以进行不同层次的特征提取,加深网络同时充分利用不同层所提取的特征;其次在骨干网络中融入具有补偿机制的双重注意力网络CDAM,强化特征图中的有效特征并减弱一些边缘特征,以提高CDAM-Siam算法面对复杂场景时的鲁棒性;最后构建特征融合网络并将其添加到主干网络中,对来自不同层次的特征图进行有效融合以获得高分辨率和信息丰富的特征图,最终实现准确的目标跟踪。在GOT-10K和You Tube-BB数据集上对CDAM-Siam算法进行训练后,在OTB100数据集上进行检测,结果表明,CDAM-Siam的跟踪成功率和精度分别达到68.3%和89.5%,在面临跟踪任务中的常见挑战时其仍能保持较好的跟踪效果,跟踪速度可达56帧/s,满足实时跟踪需求;在VOT2018数据集中的测试结果显示,该算法的准确率、鲁棒性和平均重叠率分别可达53.8%、39.4%和26.5%。 To tackle prevalent challenges in visual object tracking,including variations in target size,motion blur,occlusion,and interference from similar objects,the Compensatory Dual Attention Mechanism(CDAM)-Siam was introduced.This Siamese network tracking algorithm leverages a compensatory attention mechanism for enhanced performance.First,the ResNet-50 network is used to construct the backbone network of the Siamese network for feature extraction at different levels,deepening the network while fully utilizing the features extracted from different layers.The CDAM-Siam algorithm integrates a compensatory dual attention network,enhancing key features and reducing-edge details to improve robustness in complex environments.Finally,a feature fusion network is constructed and added to the backbone network to effectively fuse feature maps from different levels to obtain high-resolution and informative feature maps,ultimately achieving accurate target tracking.After training the CDAM-Siam algorithm on the GOT-10K and YouTube-BB datasets,the detection was performed on the OTB100 dataset.The results showed that the tracking success rate and accuracy of CDAM-Siam were 68.3%and 89.5%,respectively.Despite challenges,the algorithm maintains strong performance,tracking at up to 56 frames per second for real-time requirements.On the VOT2018 dataset,it achieves 53.8%accuracy,39.4%robustness,and a 26.5%Expected Average Overlap(EAO).

作者安玉葛海波何文昊马赛程梦洋 AN Yu;GE Haibo;HE Wenhao;MA Sai;CHENG Mengyang(School of Electronic Engineering,Xi'an University of Posts and Telecommunications,Xi'an 710121,Shaanxi,China)

机构地区西安邮电大学电子工程学院

出处《计算机工程》 CAS CSCD 北大核心 2024年第4期187-196,共10页 Computer Engineering

基金陕西省自然科学基金(2011JM8038) 陕西省重点产业创新链(群)项目(S2019-YF-ZDCXL-0098)。

关键词目标跟踪 Siamese网络 Res Net-50网络注意力机制特征融合 target tracking Siamese network ResNet-50 network attention mechanism feature fusion

分类号 TP751 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献4

1孙伟,常鹏帅,戴亮,张小瑞,陈旋,代广昭.基于注意力引导数据增强的车型识别[J].计算机工程,2022,48(7):300-306. 被引量：3
2李柯泉,陈燕,刘佳晨,牟向伟.基于深度学习的目标检测算法综述[J].计算机工程,2022,48(7):1-12. 被引量：91
3韩明,王景芹,王敬涛,孟军英,刘教民.基于孪生网络的目标跟踪研究综述[J].河北科技大学学报,2022,43(1):27-41. 被引量：2
4黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：402

二级参考文献231

1马素刚,赵祥模,侯志强,王忠民,孙韩林.一种基于ResNet网络特征的视觉目标跟踪算法[J].北京邮电大学学报,2020(2):129-134. 被引量：9
2王素玉,沈兰荪.智能视觉监控技术研究进展[J].中国图象图形学报,2007,12(9):1505-1514. 被引量：82
3Bouwmans T, El Baf F, Vachon B. Background modeling using mixture of Gaussians for foreground detection: A survey. Recent Patents on Computer Science, 2008, 1(3) 219-237. 被引量：1
4Wojek C, Dollar P, Schiele B, Perona P. Pedestrian detection: An evaluation o{ the state o{ the art. IEEE Pattern Analysis and Machine Intelligence, 2012, 34(4): 743-761. 被引量：1
5Yilmaz A, Javed O, Shah M. Object trackingt A survey. ACM Computing Surveys (CSUR), 2006, 38(4) 1-29. 被引量：1
6Wang X. Intelligent multi-camera video surveillance: A review. Pattern Recognition Letters, 2012, 34 (1) : 3-19. 被引量：1
7Wu Y, Lira J, Yang M H. Online object tracking: A bench- mark//Proceedings of the IEEE International Conference on Computer Vision and Pattern Recognition. Portland, USA, 2013 2411-2418. 被引量：1
8Andreopoulos A, Tsotsos J K. 50 years of object recognition: Directions forward. Computer Vision and Image Understanding, 2013, 117(8) 827-891. 被引量：1
9Zhang X, Yang Y H, Han Z, et al. Object class detection: A survey. Association for Computing Machinery Computing Surveys (CSUR), 2013, 46(1) : 1311-1325. 被引量：1
10Morris B T, Trivedi M M. A survey of vision-based trajectory learning and analysis for surveillance. IEEE Transactions on Circuits and Systems for Video Technology, 2008, 18(8): 1114-1127. 被引量：1

共引文献493

1邹剑,陈征,刘长龙,张乐,张玺亮,蓝飞,王威.基于YOLOv5s-CBAM的海上平台注水流程现场漏液智能检测[J].系统仿真技术,2024,20(2):175-179.
2刘海锋.煤矿智能化升级平台建设及运维保障研究[J].工矿自动化,2021,47(S01):32-35. 被引量：9
3梁平汉,郭宇辰,赵玉兰.地方政府建设智能视频监控系统的影响因素研究[J].复旦公共行政评论,2023(2):20-45.
4张兴国,周英迪,石新雨,罗霄月,顾杨旸.一种球机视频全景拼接及空间化方法[J].测绘科学,2022,47(5):203-211. 被引量：1
5汪辉,高尚兵,周君,周建,张莉雯.基于YOLOv3的多车道车流量统计及车辆跟踪方法[J].国外电子测量技术,2020,39(2):42-46. 被引量：15
6于长秋.论住房抵押贷款的证券化[J].金融理论与实践,2000(3):33-35. 被引量：1
7吴投文.论艺术家的孤独体验[J].湖北大学学报（哲学社会科学版）,2000,27(2):59-62. 被引量：7
8施巍松,孙辉,陈彦明.基于边缘计算的新型视频监控系统展望[J].自动化博览,2018,35(12):60-63. 被引量：5
9罗日成,方梦鸽,李志前,李稳,邹德华,李浙.基于传感器信息综合的带电作业安全防护系统[J].中国安全科学学报,2018,28(10):73-78. 被引量：5
10常玉兰,栗红梅,庄超明.浅析视频监控系统中设备的身份认证问题[J].国外电子测量技术,2018,37(11):5-9. 被引量：3

1郑滨汐,杨志钢,丁钰峰.基于主干增强和特征重排的反无人机目标跟踪[J].液晶与显示,2024,39(4):532-542.
2佟佳惠.公共卫生服务补偿机制存在的问题与对策[J].中国市场,2024(13):41-44.
3孙愉亚,龚声蓉,钟珊,周立凡,范利.基于近端策略优化模板更新的实时目标跟踪方法[J].计算机工程与设计,2024,45(5):1499-1507.
4段毛毛,翟睿.基于融合卷积神经网络的花卉识别方法[J].计算机与数字工程,2024,52(2):567-571. 被引量：1
5祁笑寒,伊力哈木·亚尔买买提.结合可变形卷积与全局信息的目标跟踪算法[J].传感器与微系统,2024,43(5):153-157. 被引量：1
6史国庆,程嘉毅,张建东,杨啟明,吴勇,武凡.基于反馈线性化的广义预测控制机械臂轨迹跟踪算法[J].西北工业大学学报,2024,42(2):368-376.
7丁文俊,柴亚军,杨宇贤,刘佳敏,毛昭勇.基于空海异构无人平台的水下目标搜索与跟踪[J].水下无人系统学报,2024,32(2):237-249.
8刘仕兵,周诗涵.高铁接触网绝缘子检测算法研究[J].计算机工程,2024,50(5):200-208.
9吴海涛,林鑫星,杨晓磊,杨志群.ERCP结合腹腔镜胆囊切除术对胆囊结石合并胆总管结石患者肝功能的影响[J].吉林医学,2024,45(5):1027-1030. 被引量：1
10National Economy Saw an Increase in the First Two Months[J].China's Foreign Trade,2024(2):18-19.

计算机工程

2024年第4期

浏览历史

内容加载中请稍等...

基于补偿注意力机制的Siamese网络跟踪算法

参考文献4

二级参考文献231

共引文献493

相关作者

相关机构

相关主题

浏览历史