基于交叉注意力机制的多特征行人重识别

Multi-feature person re-identification based on cross-attention mechanism

下载PDF

导出

摘要针对现有的行人重识别方法难以避免环境噪声导致的特征提取不精确、易被误认为行人特征等问题,提出一种基于动态卷积与注意力机制的行人多特征融合分支网络.首先,由于拍摄时存在光照变化、人体姿势调整以及物体遮挡等不确定因素,提出使用动态卷积替换ResNet50中的静态卷积得到具有更强鲁棒性的Dy-ResNet50模型;其次,考虑到拍摄行人图片的视角有较大差异且存在行人被物体遮挡的情况,提出将自注意力机制与交叉注意力机制嵌入骨干网络;最后,将交叉熵损失函数和难样本三元损失函数共同作为模型损失函数,在DukeMTMC-ReID、Market-1501和MSMT17公开数据集上进行实验,并与主流网络模型进行比较.结果表明:在3个公开数据集上,本文所提模型的Rank-1(第一次命中)与mAP(平均精度均值)相比当前主流模型均有所提升,具有较高的识别准确率. Existing person re-identification(Re-ID)methods often struggle with inaccurate feature extraction and misidentification of person features due to environmental noise.Here,we propose a multi-feature fusion branch network for person Re-ID based on dynamic convolution and attention mechanism.First,considering the uncertainties in illumination,human posture and occlusion,dynamic convolution is proposed to replace static convolution in ResNet50 to obtain a more robust Dy-ResNet50 model.Second,given the great difference in camera perspective and the likelihood of people being occluded by objects,self-attention and cross-attention mechanisms are embedded into the backbone network.Finally,the cross entropy loss function and the hard triplet loss function are used as the model s loss functions,and experiments are carried out on public datasets of DukeMTMC-ReID,Market-1501 and MSMT17.The results show that the proposed model outperforms current mainstream models in Rank-1(first hit)and mAP(mean Average Precision)on three public datasets,indicating its high identification accuracy.

作者邬心怡邓志良刘云平董娟李嘉琦 WU Xinyi;DENG Zhiliang;LIU Yunping;DONG Juan;LI Jiaqi(School of Automation,Nanjing University of Information Science&Technology,Nanjing 210044,China;School of Electronics&Information Engineering,Nanjing University of Information Science&Technology,Nanjing 210044,China)

机构地区南京信息工程大学自动化学院南京信息工程大学电子与信息工程学院

出处《南京信息工程大学学报》 CAS 北大核心 2024年第4期461-471,共11页 Journal of Nanjing University of Information Science & Technology

基金国家自然科学基金(51875293) 国家重点研发计划(2018YFC1405703)。

关键词行人重识别动态卷积自注意力机制交叉注意力机制 person re-identification dynamic convolution self-attention mechanism cross-attention mechanism

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1郭彤,赵倩,赵琰,王成龙.多分支融合注意力机制的行人重识别方法[J].计算机工程与设计,2022,43(8):2260-2267. 被引量：3
2段炼,胡涛,朱欣焰,叶信岳,王少华.顾及时空语义的疑犯位置时空预测[J].武汉大学学报（信息科学版）,2019,44(5):765-770. 被引量：10
3饶天荣,潘涛,徐会军.基于交叉注意力机制的煤矿井下不安全行为识别[J].工矿自动化,2022,48(10):48-54. 被引量：7
4赵小虎,尹良飞,赵成龙.基于全局-局部特征和自适应注意力机制的图像语义描述算法[J].浙江大学学报（工学版）,2020,54(1):126-134. 被引量：6
5耿韶松,李晋国.基于动态卷积与注意力的多特征融合行人重识别[J].计算机工程与设计,2023,44(4):1228-1234. 被引量：1
6宋婉茹,赵晴晴,陈昌红,干宗良,刘峰.行人重识别研究综述[J].智能系统学报,2017,12(6):770-780. 被引量：43
7李明哲..基于时空注意力机制的视频行人再识别方法研究[D].哈尔滨工程大学,2020:
8冉瑞生,石凯,江小鹏,王宁.基于双注意力CrossViT的微表情识别方法[J].南京信息工程大学学报（自然科学版）,2023,15(5):541-550. 被引量：1
9刘忠洋,周杰,陆加新,缪则林,邵根富,江凯强,高伟.基于注意力机制的多尺度特征融合图像去雨方法[J].南京信息工程大学学报（自然科学版）,2023,15(5):505-513. 被引量：1
10李金轩,杜军平,周南.基于注意力特征提取网络的图像描述生成算法[J].南京信息工程大学学报（自然科学版）,2019,11(3):295-301. 被引量：3

二级参考文献16

1刘浩,刘海滨,孙宇,王竞陶,黄辉.煤矿井下员工不安全行为智能识别系统[J].煤炭学报,2021,46(S02):1159-1169. 被引量：27
2梁锐,朱清新,廖淑娇,牛新征.基于多特征融合的深度视频自然语言描述方法[J].计算机应用,2017,37(4):1179-1184. 被引量：6
3马浩原,安高云,阮秋琦.平均光流方向直方图描述的微表情识别[J].信号处理,2018,34(3):279-288. 被引量：7
4陈首兵,王洪元,金翠,张玮.基于孪生网络和重排序的行人重识别[J].计算机应用,2018,38(11):3161-3166. 被引量：7
5徐家臻,李婷,杨巍.多尺度局部特征选择的行人重识别算法[J].计算机工程与应用,2020,56(2):141-145. 被引量：10
6党伟超,张泽杰,白尚旺,龚大力,吴喆峰.基于改进双流法的井下配电室巡检行为识别[J].工矿自动化,2020,46(4):75-80. 被引量：9
7熊炜,杨荻椿,艾美慧,李敏,李利荣.基于多支路特征融合的行人重识别研究[J].计算机工程与科学,2021,43(2):329-339. 被引量：2
8张立亚.基于图像识别的煤矿井下安全管控技术[J].煤矿安全,2021,52(2):165-168. 被引量：11
9马婧婧,黄煜峰,陈翔.多尺度沙漏结构的单幅图像去雨算法研究[J].小型微型计算机系统,2021,42(3):561-565. 被引量：2
10黄瀚,程小舟,云霄,周玉,孙彦景.基于DA-GCN的煤矿人员行为识别方法[J].工矿自动化,2021,47(4):62-66. 被引量：6

共引文献72

1陈丹,李永忠,于沛泽,邵长斌.跨模态行人重识别研究与展望[J].计算机系统应用,2020(10):20-28. 被引量：8
2李星儒,李宗辰,薛宇旸,沈辰珏,严浩恩,于译凯.基于视频监控的人员重识别系统设计[J].电子技术（上海）,2021(1):132-133.
3张仕远,丁学明.融合损失优化的行人重识别方法[J].智能计算机与应用,2021,11(4):65-71. 被引量：2
4李学春.农村人口的社会保障权利研究[J].兰州大学学报（社会科学版）,2000,28(1):10-16. 被引量：9
5刘仁春,孟朝晖.基于孪生对抗SGAN的行人重识别研究[J].电子测量技术,2019,0(15):155-160. 被引量：4
6王娟,兰月新,吴春颖,陈蕾,张双狮.时空分析和K近邻算法在犯罪分析中的应用研究[J].福建电脑,2019,35(7):35-37. 被引量：5
7曲比伟石,赵振斌,邓元杰,张熠.成都市主城区“两抢一盗”犯罪的多尺度时空格局研究[J].浙江大学学报（理学版）,2019,46(6):745-754. 被引量：11
8武忠,贺丽丽,姚利花,王峰霞.基于VGG-NET的行人重识别[J].山西大同大学学报（自然科学版）,2019,35(6):10-12.
9韩俊,任进.基于特征增强的多尺度SSD行人检测算法[J].信息技术与信息化,2020(1):111-115. 被引量：1
10熊炜,熊子婕,杨荻椿,童磊,刘敏,曾春艳.基于深层特征融合的行人重识别方法[J].计算机工程与科学,2020,42(2):358-364. 被引量：5

1项俊,张金城,江小平,侯建华.Transformer-CNN特征跨注意力融合学习的行人重识别[J].计算机工程与应用,2024,60(16):94-104.

南京信息工程大学学报

2024年第4期

浏览历史

内容加载中请稍等...

基于交叉注意力机制的多特征行人重识别

参考文献11

二级参考文献16

共引文献72

相关作者

相关机构

相关主题

浏览历史