-
题名基于改进ViT的红外人体图像步态识别方法研究
被引量:4
- 1
-
-
作者
杨彦辰
云利军
梅建华
卢琳
-
机构
云南师范大学信息学院
云南省光电信息技术重点实验室
云南省烟草烟叶公司设备信息科
-
出处
《应用光学》
CAS
北大核心
2023年第1期71-78,共8页
-
基金
云南省应用基础研究计划重点项目(2018FA033)
云南师范大学研究生科研创新基金项目(YJSJJ21-B77)。
-
文摘
针对卷积神经网络在步态识别时准确率易饱和现象,以及Vision Transformer(ViT)对步态数据集拟合效率较低的问题,提出构建一个对称双重注意力机制模型,保留行走姿态的时间顺序,用若干独立特征子空间有针对性地拟合步态图像块;同时,采用对称架构的方式,增强注意力模块在拟合步态特征时的作用,并利用异类迁移学习进一步提升特征拟合效率。将该模型运用在中科院CASIA C红外人体步态库中进行多次仿真实验,平均识别准确率达到96.8%。结果表明,本文模型在稳定性、数据拟合速度以及识别准确率3方面皆优于传统ViT模型和CNN对比模型。
-
关键词
步态识别
对称双重注意力机制
迁移学习
红外人体图像
Vision
Transformer
卷积神经网络
-
Keywords
gait recognition
symmetrical dual attention mechanism
transfer learning
infrared human body images
vision transformer
convolutional neural network
-
分类号
TN219
[电子电信—物理电子学]
TP181
[自动化与计算机技术—控制理论与控制工程]
-