基于局部深度一致性的自监督手部姿态估计被引量：1

Self-Supervised Hand Pose Estimation with Regional Depth Correspondence

下载PDF

导出

摘要基于深度图的3D手部姿态估计通常需要大量人工标注数据以达到高精确度和鲁棒性,然而关节点标注过程冗杂且存在一定误差.现有研究工作使用自监督方法解决对标注数据的依赖,通过在虚拟数据集上预训练网络,并在无标注的真实数据集上进行模型拟合,实现3D姿态估计.自监督方法的关键在于设计模型拟合的能量函数以减小模型在真实数据集上的精度下降程度.为了减小模型拟合难度,本文提出局部深度一致性损失,依据初始姿态估计结果,提取输入与输出深度图的局部表征,将深度图显式地解耦为以关节点为中心的不同区域.通过有针对性地对不同关节点进行局部优化,减少虚拟与真实深度图之间的固有领域误差对网络学习的影响,增加训练的稳定性.本文方法在NYU数据集上相比基础方法平均关节点误差提升了21.9%. Depth-based 3D hand pose estimation requires manually labelled data to achieve high accuracy and robust⁃ness.However,the labeling process is laborsome and bares inevitable biases.Researchers solve this problem by using selfsupervised methods.They pretrain model on synthetic dataset then finetune on unlabelled real dataset through model fit⁃ting.The biggest challenge is the design of model fitting term in fintuning stage to prevent severe accuracy drop.We pro⁃posed the regional depth correspondence loss which utilized initial pose estimation results to extract regional representation of input and output depth maps and transparently divided them into different regions.This allows network to finetune re⁃gions around joints without being affected by overall domain gaps between synthetic and real depth images.The proposed method outperforms baseline method by 21.9%on NYU hand pose dataset.

作者王敬宇黄伟亭刘聪戚琦孙海峰廖建新 WANG Jing-yu;HUANG Wei-ting;LIU Cong;QI Qi;SUN Hai-feng;LIAO Jian-xin(State key laboratory of Networking and Switching Techonology,Beijing University of Posts and Telecommunications,Beijing 100876,China;China Mobile Group Design Institute Co.,Ltd.,Beijing 100053,China)

机构地区北京邮电大学网络与交换国家重点实验室中国移动通信有限公司研究院

出处《电子学报》 EI CAS CSCD 北大核心 2023年第6期1644-1653,共10页 Acta Electronica Sinica

基金国家重点研发计划(No.2020YFB1807800) 国家自然科学基金(No.62071067,No.62001054,No.61771068) 教育部-中国移动科研基金(No.MCM20200202,No.MCM20180101) 博士后创新人才支持计划(No.BX20200067) 中国博士后科学基金资助(No.2021M690469)。

关键词自监督手部姿态估计局部一致性深度图深度学习 self-supervised hand pose estimation regional consistency depth images deep learning

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1任海兵,祝远新,徐光,林学,张哓平.基于视觉手势识别的研究—综述[J].电子学报,2000,28(2):118-121. 被引量：120
2管业鹏.复杂人机交互场景下的指势用户对象识别[J].电子学报,2014,42(11):2135-2141. 被引量：8
3徐一华,李善青,贾云得.一种基于视觉的手指屏幕交互方法[J].电子学报,2007,35(11):2236-2240. 被引量：23
4武汇岳,王建民,戴国忠.基于小样本学习的3D动态视觉手势个性化交互方法[J].电子学报,2013,41(11):2230-2236. 被引量：6
5齐静,徐坤,丁希仑.机器人视觉手势交互技术研究进展[J].机器人,2017,39(4):565-584. 被引量：28

二级参考文献95

1李瑞峰,贾建军.一种复杂背景下的手势提取方法[J].华中科技大学学报（自然科学版）,2008,36(S1):186-188. 被引量：6
2岳玮宁,董士海,王悦,汪国平,王衡,陈文广.普适计算的人机交互框架研究[J].计算机学报,2004,27(12):1657-1664. 被引量：45
3杜友田,陈峰,徐文立,李永彬.基于视觉的人的运动识别综述[J].电子学报,2007,35(1):84-90. 被引量：79
4[1]T.Ahmad,C.J.Taylor,A.Lanitis,T.F.Cootes.Tracking and recognising hand gestures, using statistical shape models.Image and Vision Computing,1997,15:345～352 被引量：1
5[2]Y.Azoz,L.Devi,and R.Sharma.Vision-Based Human Arm Tracking for Gesture Analysis Using Multimodal Constraint Fusion.Proc.1997 Advanced Display Federated Laboratory Symp.,Adelphi,Md.,1997 被引量：1
6[3]David Alan Becker,Sensi.A Real-Time Recognition,Feedback and Training System for T'ai Chi Gestures.(David Alan Becker, Master thesis),MIT Media Lab,May,1997 被引量：1
7[4]A.Bobick,J.Davis.Real-time recognition of activity using temporal templates.Proc.of Third IEEE Workshop on applications of computer vision,Florida,1996,39～42 被引量：1
8[5]G.Bradski,Boon-Lock Yeo,Minerva M.Yeung.Gesture for video content navigation.SPIE 3656 (Proc.of the IS&T/SPIE Conf.on Storage and Retrieval for Image and Video Database VII),San Jose,California,1999,230～242 被引量：1
9[6]Quek F.Unencumbered gestural interaction.IEEE Multimedia,1996:36～47 被引量：1
10[7]R.Cipolla and N.J.Hollinghurst.Human-robot interface by pointing with uncalibrated stereo vision.image and vision computing,Mar.1996,14:171～178 被引量：1

共引文献178

1王梅,张震,张曦,屠大维.基于复合特征和动态阈值圆法的手势识别算法研究[J].计算机应用研究,2020,37(2):630-634. 被引量：3
2娄会东,肖强.基于HDC提取关键点的手势识别算法[J].安阳工学院学报,2007,6(4):69-72.
3李瑞峰,贾建军.一种复杂背景下的手势提取方法[J].华中科技大学学报（自然科学版）,2008,36(S1):186-188. 被引量：6
4郭北苑,方卫宁.手势交互中手部目标的动态分割[J].系统仿真学报,2005,17(2):403-405. 被引量：3
5段洪伟,陈一民,林锋.基于LSSVM的静态手势识别[J].计算机工程与设计,2004,25(12):2352-2353. 被引量：5
6胡友树.手势识别技术综述[J].中国科技信息,2005(2):42-42. 被引量：27
7汤志彦,冯哲.适用于机器人视觉的手势识别系统[J].计算机工程与应用,2005,41(16):51-54. 被引量：4
8戴俊,葛元,王林泉.高阶NMI值的字母手势识别[J].计算机工程,2005,31(14):164-166. 被引量：2
9孔晓明,陈一民,陈养彬,殷烨.基于视觉的动态手势识别[J].计算机工程与设计,2005,26(11):2934-2936. 被引量：14
10李文昊.基于SPCA563B芯片的图像识别系统设计[J].单片机与嵌入式系统应用,2006(8):40-43. 被引量：2

同被引文献8

1罗会兰,童康,孔繁胜.基于深度学习的视频中人体动作识别进展综述[J].电子学报,2019,47(5):1162-1173. 被引量：64
2沈栎,陈莹.带特征监控的高维信息编解码端到端无标记人体姿态估计网络[J].电子学报,2020,48(8):1528-1537. 被引量：4
3Xuan Zhao,Zhongdao Wang,Lei Gao,Yali Li,Shengjin Wang.Incremental Face Clustering with Optimal Summary Learning Via Graph Convolutional Network[J].Tsinghua Science and Technology,2021,26(4):536-547. 被引量：5
4任笑圆,蒋李兵,钟卫军,王壮.基于视觉的非合作空间目标三维姿态估计方法[J].电子与信息学报,2021,43(12):3476-3485. 被引量：3
5杨红红,王刘丽,张玉梅,吴晓军,党允彤.基于序列多尺度特征融合表示的层级舞蹈动作姿态估计方法[J].电子学报,2021,49(12):2428-2436. 被引量：10
6储珺,束雯,周子博,缪君,冷璐.结合语义和多层特征融合的行人检测[J].自动化学报,2022,48(1):282-291. 被引量：9
7李超,黄新宇,王凯.基于特征融合和自学习锚框的高分辨率图像小目标检测算法[J].电子学报,2022,50(7):1684-1695. 被引量：5
8赵海燕,马权益,曹健,陈庆奎.面向任务扩展的增量学习动态神经网络:研究进展与展望[J].电子学报,2023,51(6):1710-1724. 被引量：2

引证文献1

1江佳鸿,夏楠,李长吾,周思瑶,于鑫淼.基于多尺度增量学习的单人体操动作中关键点检测方法[J].电子学报,2024,52(5):1730-1742.

1李彩霞.基于类别图增强算法的融合异构数据会话推荐分析[J].电子产品世界,2023,30(8):69-71.
2赵一凡,李甲,田永鸿.局部关系泛化表征的小样本增量学习[J].中国科学：信息科学,2023,53(6):1132-1146.
3韩光,杨晟伟,袁培森,朱勐.基于改进Faster R-CNN的新能源电池炸点缺陷检测分析[J].自动化与仪器仪表,2023(7):113-117. 被引量：1
4朱叶,郝应光,王洪玉.基于深度学习的红外视频显著性目标检测[J].计算机科学,2023,50(9):227-234. 被引量：1
5余炜,吴鹏,涂圣贤.基于部分标注数据集的血管内超声图像深度学习分割[J].复旦学报（自然科学版）,2023,62(4):457-466.
6梁春雨,徐志渊,杨国辉,汪伟,李菲,沈新平.鼻咽癌放疗后认知功能损害的静息态功能磁共振成像研究[J].现代肿瘤医学,2023,31(17):3275-3279.
7袁红春,张文凤.融合SimAM注意力机制和双向ConvLSTM的异常检测方法[J].小型微型计算机系统,2023,44(8):1777-1784. 被引量：4
8黄中霞,王雨,刘雅文,张小旭,徐丹丹,杨艳萍,黄明明,余晖.静息态功能磁共振分析脑小血管病和帕金森病患者脑功能与嗅觉功能的相关性[J].中国组织工程研究,2024,28(20):3209-3215. 被引量：1
9朱鑫洋,迟呈英,战学刚.基于Transformer的英文粘连词还原方法[J].计算机应用与软件,2023,40(8):45-49. 被引量：1
10李琳,浦贵阳,李杨,王树超,蒋明峰.基于SA-CycleGAN的3T磁共振图像生成方法[J].软件工程,2023,26(9):52-58.

电子学报

2023年第6期

浏览历史

内容加载中请稍等...

基于局部深度一致性的自监督手部姿态估计被引量：1

参考文献5

二级参考文献95

共引文献178

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于局部深度一致性的自监督手部姿态估计 被引量：1

参考文献5

二级参考文献95

共引文献178

同被引文献8

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于局部深度一致性的自监督手部姿态估计被引量：1