基于注意力机制的人体关键点隐式建模网络

Implicit Modeling Network of Human Keypoints Based on Attention Mechanism

下载PDF

导出

摘要人体姿态估计任务需要利用视觉线索和关节间的解剖关系来定位关键点,但基于卷积神经网络的方法难以关注远程上下文线索和建模远距离关节之间的依赖关系。为此,提出一种基于注意力机制的隐式建模方法,通过多阶段迭代计算关节之间的特征相关性来隐式建模关键点间的约束关系,消除卷积神经网络的局部操作,扩大网络的感受野,建模远距离关节之间的依赖关系。为了解决网络在训练过程中可能弱化不可见关键点的问题,采用焦点损失函数,使网络更关注于复杂的关键点。使用目前精度最高的特征提取高分辨率网络(HRNet)和经典特征提取残差网络(ResNet)作为主干网络进行实验,结果表明,在同等实验条件下,隐式建模方法可以提高人体姿态估计网络的性能,在MPII和MSCOCO人体姿态估计基准数据集上,以HRNet网络为主干网络的算法相较于原网络,精度分别提升了1.7%和2.6%。 Human pose estimation necessitates the use of visual cues and anatomical joint relationships to pinpoint key points.Existing Convolutional Neural Network(CNN)methods falter in addressing long-range contextual cues and modeling dependencies among distant joints.This paper introduces an attention-based implicit modeling method that iteratively computes feature correlations between joints,thus implicitly modeling the constraint relationships among key points.This method diverges from the localized operations characteristic of CNN by expanding the network's receptive field and modeling dependencies between distantly positioned joints.To counteract the diminished visibility of crucial keypoints during network training,a focal loss function is implemented,prompting the network to concentrate on complex keypoints.Comparative experiments were performed under identical conditions using the state-of-the-art High-Resolution Network(HRNet)and the classic Residual Network(ResNet)as backbone networks.Results reveal that the implicit modeling network enhances human pose estimation performance.For instance,utilizing HRNet as the backbone,the algorithm's accuracy on the MPII and MSCOCO human pose estimation benchmark datasets improved by 1.7%and 2.6%,respectively,surpassing the original network's performance.

作者赵佳圆张玉茹苏晓东徐红岩李世洲张玉荣 ZHAO Jiayuan;ZHANG Yuru;SU Xiaodong;XU Hongyan;LI Shizhou;ZHANG Yurong(School of Computer and Information Engineering,Harbin University of Commerce,Harbin 150028,Heilongjiang,China;Heilongjiang Key Laboratory of Electronic Commerce and Intelligent Information Processing,Harbin 150028,Heilongjiang,China)

机构地区哈尔滨商业大学计算机与信息工程学院黑龙江省电子商务与智能信息处理重点实验室

出处《计算机工程》 CAS CSCD 北大核心 2024年第3期317-325,共9页 Computer Engineering

基金黑龙江省自然科学基金(LH2022F035) 2022年哈尔滨商业大学教师“创新”项目支持计划项目(XL0068) 哈尔滨商业大学研究生创新科研项目(YJSCX2022-743HSD)。

关键词人体姿态估计卷积神经网络注意力机制焦点损失隐式建模 human pose estimation convolutional neural network attention mechanism focal loss implicit modeling

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1刘勇,李杰,张建林,徐智勇,魏宇星.基于深度学习的二维人体姿态估计研究进展[J].计算机工程,2021,47(3):1-16. 被引量：17
2刘勇,李杰,任立成,张建林,徐智勇.并联化高分辨网络的人体姿态估计方法[J].计算机工程与设计,2022,43(1):237-244. 被引量：3
3李坤,侯庆.基于注意力机制的轻量型人体姿态估计[J].计算机应用,2022,42(8):2407-2414. 被引量：7
4余保玲,虞松坤,孙耀然,杨振,傅旭波.基于DeepPose和Faster RCNN的多目标人体骨骼节点检测算法[J].中国科学院大学学报（中英文）,2020,37(6):828-834. 被引量：9
5江春灵,曾碧,姚壮泽,邓斌.融合权重自适应损失和注意力的人体姿态估计[J].计算机工程与应用,2023,59(18):145-153. 被引量：2
6刘豪,吴红兰,房宇轩.结合全局上下文信息的高效人体姿态估计[J].计算机工程,2023,49(7):102-109. 被引量：2

二级参考文献10

1Qi Dang,Jianqin Yin,Bin Wang,Wenqing Zheng.Deep Learning Based 2D Human Pose Estimation:A Survey[J].Tsinghua Science and Technology,2019,24(6):663-676. 被引量：17
2朱建宝,许志龙,孙玉玮,马青山.基于OpenPose人体姿态识别的变电站危险行为检测[J].自动化与仪表,2020,35(2):47-51. 被引量：29
3王丹峰,陈超波,马天力,李长红,苗春雨.基于深度可分离卷积的YOLOv3行人检测算法[J].计算机应用与软件,2020,37(6):218-223. 被引量：21
4董永昌,单玉刚,袁杰.基于改进SSD算法的行人检测方法[J].计算机工程与设计,2020,41(10):2921-2926. 被引量：14
5闫航,陈刚,佟瑶,姬波,胡北辰.基于姿态估计与GRU网络的人体康复动作识别[J].计算机工程,2021,47(1):12-20. 被引量：11
6钱慧芳,易剑平,付云虎.基于深度学习的人体动作识别综述[J].计算机科学与探索,2021,15(3):438-455. 被引量：33
7苏江毅,宋晓宁,吴小俊,於东军.多模态轻量级图卷积人体骨架行为识别方法[J].计算机科学与探索,2021,15(4):733-742. 被引量：8
8肖振久,杨晓迪,魏宪,唐晓亮.改进的轻量型网络在图像识别上的应用[J].计算机科学与探索,2021,15(4):743-753. 被引量：4
9Wenqiang Zhang,Jiemin Fang,Xinggang Wang,Wenyu Liu.Efficient Pose: Efficient human pose estimation with neural architecture search[J].Computational Visual Media,2021,7(3):335-347. 被引量：7
10何坚,郭泽龙,刘乐园,苏予涵.基于滑动窗口和卷积神经网络的可穿戴人体活动识别技术[J].电子与信息学报,2022,44(1):168-177. 被引量：14

共引文献33

1杨荣,宋亮,魏鹏绪,潘国新.机器视觉技术在康复领域的应用[J].北京生物医学工程,2021,40(4):425-429. 被引量：2
2吴蓬勃,张金燕,王帆,王拓.快递暴力分拣行为视觉识别系统[J].包装工程,2021,42(15):245-252. 被引量：5
3李平,喻洪流.基于两种分类标准的目标检测算法综述[J].计算机应用研究,2021,38(9):2582-2589. 被引量：6
4赵恩铭,杨松,姚志强.基于Faster-RCNN的民族服饰识别系统的设计与实现[J].大理大学学报,2021,6(12):23-28. 被引量：1
5张继凯,李琦,王月明,吕晓琪.基于单目RGB图像的三维手势跟踪算法综述[J].计算机科学,2022,49(4):174-187. 被引量：5
6廖鑫,黎懿熠,欧阳军林,周江盟,戴湘桃,秦拯.一种基于深度学习的移动端隐写方法[J].湖南大学学报（自然科学版）,2022,49(4):18-25.
7陈桂荣,邱仲禹,粟涛,陈弟虎.基于沙漏网络的多层次协同搜索方法[J].计算机应用研究,2022,39(8):2284-2289.
8尹继尧,周琳,李强,刘董经典.基于轻量化二维人体姿态估计的小样本动作识别算法[J].广西科学,2022,29(4):700-707. 被引量：3
9马康哲,皮家甜,熊周兵,吕佳.融合注意力特征的遮挡物体6D姿态估计[J].计算机应用,2022,42(12):3715-3722. 被引量：2
10张飙,王慧贤,韩冰.基于改进YOLOv3的高分辨率遥感图像复合目标检测[J].计算机与现代化,2022(12):74-80.

1龚映梅,汪黎东.家电企业网络口碑对消费者购买意愿的影响研究——基于双中介效应模型的分析[J].中国物价,2024(3):65-70.
2理解语篇,在语境中学习词语用法[J].初中生,2024(3):36-41.
3崔世杰,黄丽,王银珠,马瑞芬.基于k-体分划的D-concurrence多体纠缠测度[J].太原科技大学学报,2024,45(1):109-112.
4成应琪,黄正蔚.上颌窦解剖结构及其与上颌后牙显微根尖手术的关系[J].国际口腔医学杂志,2024,51(2):151-156.
5廖华英.例析带电粒子在匀强磁场中的临界问题[J].中学生数理化（高考理化）,2024(3):37-39.
6孙克彦.CT三维重建诊断踝关节骨折的价值观察[J].中文科技期刊数据库（引文版）医药卫生,2024(2):0168-0171.
7高明,陈国扬.基于无服务器边缘计算下的服务负载调度算法[J].计算机应用研究,2024,41(3):811-817.
8艾尔帕提·艾尔肯,亚力坤·亚生.上颌窦恶性肿瘤概述及临床诊治[J].临床医学进展,2024,14(2):3905-3910.
9陈郁,徐正武,常昕琦.基于HMS的双臂机器人运动学协调约束模型研究[J].计算机与数字工程,2023,51(12):2873-2878.
10刘海燕,黄燕.基于智能感知的人脸细微表情情绪推定算法[J].计算机仿真,2024,41(1):201-205.

计算机工程

2024年第3期

浏览历史

内容加载中请稍等...

基于注意力机制的人体关键点隐式建模网络

参考文献6

二级参考文献10

共引文献33

相关作者

相关机构

相关主题

浏览历史