基于稀疏注意力的孪生网络目标跟踪算法

Siamese network object tracking algorithm based on sparse attention

导出

摘要利用改进的Inception-Resnet-V2(IRV2)网络和局部-全局-局部(local-global-local,LGL)模块设计一种结合CNN和Transformer编码结构的孪生网络SiamLGL(siamese local-global-local network)用于目标跟踪.首先,算法特征提取部分采用改进后的IRV2网络,由于网络的层数更深,图片经过IRV2网络提取的特征较浅层网络提取的特征效果更优,特征融合部分采用深度互相关将特征图上的信息进行融合;其次,融合后的特征图利用LGL模块获取目标的全局和局部信息,模块内部采用两个编码器串联,第1个编码器利用深度可分离卷积获取目标的局部信息,第2个编码器利用自注意力获取图片的全局特征,为了降低自注意力结构的时间复杂度,采用稀疏注意力的方式进行计算,在降低时间复杂度的同时保证网络的精度;最后将特征图输入至分类回归网络中,生成对应的目标位置,其中分类网络采用二元交叉熵损失函数,回归网络采用Distance-IoU(DIoU)作为损失函数.算法在GOT-10k、LaSOT、TrackingNet、UAV123、OTB100和VOT2019等6个公开数据集上进行实验评估,结果验证了算法的有效性. An improved Inception-Resnet-V2(IRV2)network and local-global-local(LGL)module are used to design a siamese network structure based on CNN and Transformer coding structure for object tracking-SiamLGL(siamese local-global-local network).Firstly,due to the improved(IRV2)network with deep layers,the features extracted by the IRV2 network in the images are better than those extracted by the shallow network.Furthermore,the information on the feature map is fused through deep intercorrelation.Secondly,the fused feature map uses the LGL module to obtain the global and local information of the object,and two encoder layers are used in series inside the module,the first encoder layer with depth-separable convolution obtain the local information of the object,and the second encoder layer with self-attention obtain the global features of the picture.In order to reduce the time complexity of the self-attention structure,the sparse attention approach is used for the computation,which ensures the accuracy of the network while reducing the time complexity.Finally,the feature map is input to the classification and regression network to generate the corresponding object location.The classification network adopts the binary cross entropy loss function,and the regression network adopts Distance-IoU(DIoU)as the loss function.The algorithm is evaluated on six public datasets:GOT-10k,LaSOT,TrackingNet,UAV123,OTB100 and VOT2019.The experimental results verify the effectiveness of the proposed algorithm.

作者陈志旺杨天宇曹索航吕昌昊彭勇 CHEN Zhi-wang;YANG Tian-yu;CAO Suo-hang;LV Chang-hao;PENG Yong(Engineering Research Center of the Ministry of Education for Intelligent Control System and Intelligent Equipment,Yanshan University,Qinhuangdao 066004,China;Key Laboratory of Industrial Computer Control Engineering of Hebei Province,Yanshan University,Qinhuangdao 066004,China;Key Lab of Power Electronics for Energy Conservation and Motor Drive of Hebei Province,Yanshan University,Qinhuangdao 066004,China;School of Electrical Engineering,Yanshan University,Qinhuangdao 066004,China)

机构地区燕山大学智能控制系统与智能装备教育部工程研究中心燕山大学工业计算机控制工程河北省重点实验室燕山大学电力电子节能与传动控制河北省重点实验室燕山大学电气工程学院

出处《控制与决策》 EI CSCD 北大核心 2024年第12期4017-4026,共10页 Control and Decision

基金河北省研究生专业学位精品教学案例(库)项目(KCJPZ2023012) 国家自然科学基金项目(61573305) 河北省自然科学基金项目(F2022203038,F2019203511)。

关键词目标跟踪孪生网络 Inception-Resnet-V2网络稀疏注意力 Distance-IoU损失 object tracking siamese network Inception-Resnet-V2 network sparse attention Distance-IoU loss

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1程旭,刘丽华,王莹莹,余梓彤,赵国英.基于多帧一致性修正的自监督孪生网络目标跟踪方法[J].计算机学报,2022,45(12):2544-2560. 被引量：4
2张子烁,宋勇,杨昕,赵宇飞,周雅.基于动态特征注意模型的三分支网络目标跟踪[J].光学学报,2022,42(15):130-139. 被引量：4
3侯志强,郭凡,杨晓麟,马素刚,范九伦.基于混合注意力的Transformer视觉目标跟踪算法[J].控制与决策,2024,39(3):739-748. 被引量：4
4仲训杲,范东嘉,仲训昱,周承仙,赵晶,刘强.融合多模板注意力深度网的自适应目标框跟踪算法[J].控制与决策,2024,39(4):1123-1132. 被引量：2
5韩瑞泽,冯伟,郭青,胡清华.视频单目标跟踪研究进展综述[J].计算机学报,2022,45(9):1877-1907. 被引量：38

二级参考文献15

1黄凯奇,陈晓棠,康运锋,谭铁牛.智能视频监控技术综述[J].计算机学报,2015,38(6):1093-1118. 被引量：402
2刘彩虹,张磊,黄华.交通路口监控视频跨视域多目标跟踪的可视化[J].计算机学报,2018,41(1):221-235. 被引量：28
3卢湖川,李佩霞,王栋.目标跟踪算法综述[J].模式识别与人工智能,2018,31(1):61-76. 被引量：165
4葛宝义,左宪章,胡永江.视觉目标跟踪方法研究综述[J].中国图象图形学报,2018,23(8):1091-1107. 被引量：67
5孟琭,李诚新.近年目标跟踪算法短评——相关滤波与深度学习[J].中国图象图形学报,2019,24(7):1011-1016. 被引量：13
6李玺,查宇飞,张天柱,崔振,左旺孟,侯志强,卢湖川,王菡子.深度学习的目标跟踪算法综述[J].中国图象图形学报,2019,24(12):2057-2080. 被引量：111
7陈云芳,吴懿,张伟.基于孪生网络结构的目标跟踪算法综述[J].计算机工程与应用,2020,56(6):10-18. 被引量：29
8董吉富,刘畅,曹方伟,凌源,高翔.基于注意力机制的在线自适应孪生网络跟踪算法[J].激光与光电子学进展,2020,57(2):313-321. 被引量：4
9李勇,杨德东,韩亚君,宋鹏.融合扰动感知模型的孪生神经网络目标跟踪[J].光学学报,2020,40(4):114-125. 被引量：16
10李畅,杨德东,宋鹏,郭畅.基于全局感知孪生网络的红外目标跟踪[J].光学学报,2021,41(6):166-176. 被引量：15

共引文献46

1陈仁祥,何家乐,杨黎霞,余腾伟,张霞.基于加权在线样本更新的目标长时跟踪方法[J].仪器仪表学报,2023,44(6):66-73. 被引量：3
2王蓓,李东文,陈佳.结合扩展卡尔曼滤波的快速判别尺寸空间滤波跟踪算法[J].西安工业大学学报,2023,43(3):287-294.
3林彬,王华通,封全喜.基于双模型竞争机制的目标跟踪算法[J].电子学报,2023,51(5):1381-1387. 被引量：4
4赵建光,范晶晶,韩泽山.基于改进YOLOv5与Deep SORT的行人多目标跟踪算法研究[J].长江信息通信,2023,36(6):29-31. 被引量：2
5谢斌红,于如潮.基于多支路的孪生网络目标跟踪[J].计算机系统应用,2023,32(7):163-170.
6侯艳丽,魏义仑,王鑫涛.融合坐标信息与模板更新的孪生网络目标跟踪[J].计算机系统应用,2023,32(7):284-292.
7王鑫,刘中旺.基于MATLAB的相关滤波跟踪算法仿真分析[J].计算机测量与控制,2023,31(8):224-230.
8郭刚,李明利,杨波涛,白鑫,王喜升,王子陵.面向矿业摄像仪的图像增强与目标跟踪[J].现代科学仪器,2023,40(4):148-153.
9晏开祥,周冬明,王长城,周子为.多尺度选择注意力的双模态目标追踪算法[J].无线电工程,2023,53(10):2261-2269. 被引量：1
10肖选杰,张浩天,艾剑良.空中“低慢小”目标检测跟踪算法的应用研究[J].复旦学报（自然科学版）,2023,62(5):605-614. 被引量：2

1LI SiJia,SHEN YanJie,QIAN Ye.Research on rock hand specimen naming method based on deep learning and Inception-v3 model[J].Global Geology,2024,27(4):196-206.
2谢奕涛,苏鹭梅,杨帆,陈宇涵.面向目标类别分类的无数据知识蒸馏方法[J].中国图象图形学报,2024,29(11):3401-3416.
3裴非飞,聂梓龙,许国敏,战友,龚先祁,艾长发,邓媛,姬峥云,王世法.Friction-1D Transformer:用于沥青路面抗滑预测的一维VIT混合模型[J].中外公路,2024,44(6):51-58.
4Andrés M.Rueda-Ramírez,Benjamin Bolm,Dmitri Kuzmin,Gregor J.Gassner.Monolithic Convex Limiting for Legendre-Gauss-Lobatto Discontinuous Galerkin Spectral-Element Methods[J].Communications on Applied Mathematics and Computation,2024,6(3):1860-1898.
5邢海涛,黄剑梅,曾馨慧,叶怡,马中华.一种小型化类条形码无芯片电子标签的设计[J].集美大学学报（自然科学版）,2024,29(6):540-544.
6Tao Wang,Dong Leng,Zhongkun Cai,Binlong Chen,Jing Li,Hua Kui,Diyan Li,Zhuanjian Li.Insights into left-right asymmetric development of chicken ovary at the single-cell level[J].Journal of Genetics and Genomics,2024,51(11):1265-1277.
7吴泓成,林国军,朱晏梅,王志舜.基于多特征融合的生成对抗网络图像修复算法[J].内江师范学院学报,2024,39(12):39-45.
8王逸婧,陈梦杰,许俊华.低血糖生成指数联合低血糖生成负荷饮食干预对2型糖尿病合并脂质代谢紊乱患者血糖控制、脂质代谢及肠道功能的影响[J].慢性病学杂志,2024(7):1028-1031.

控制与决策

2024年第12期

浏览历史

内容加载中请稍等...

基于稀疏注意力的孪生网络目标跟踪算法

参考文献5

二级参考文献15

共引文献46

相关作者

相关机构

相关主题

浏览历史