结合时空注意力机制和自适应图卷积网络的骨架行为识别被引量：3

Skeleton-Based Action Recognition on Spatio-Temporal Attention Mechanism and Adaptive Graph Convolutional Network

下载PDF

导出

摘要针对骨架行为识别对时空特征提取不充分以及难以捕捉全局上下文信息的问题,研究了一种将时空注意力机制和自适应图卷积网络相结合的人体骨架行为识别方案。首先,构建基于非局部操作的时空注意力模块,辅助模型关注骨架序列中最具判别性的帧和区域;其次,利用高斯嵌入函数和轻量级卷积神经网络的特征学习能力,并考虑人体先验知识在不同时期的影响,构建自适应图卷积网络;最后,将自适应图卷积网络作为基本框架,并嵌入时空注意力模块,与关节信息、骨骼信息以及各自的运动信息构建双流融合模型。该算法在NTU RGB+D数据集的两种评价标准下分别达到了90.2%和96.2%的准确率,在大规模的数据集Kinetics上体现出模型的通用性,验证了该算法在提取时空特征和捕捉全局上下文信息上的优越性。 To solve the problem that skeleton behavior recognition can not extract spatio-temporal features sufficiently and it is difficult to capture global context information,a human skeleton behavior recognition scheme based on spatio-temporal attention mechanism and adaptive graph convolution network is studied.Firstly,a spatio-temporal attention module based on non-local operation is constructed to assist the model to focus on the most discriminative frames and regions in the skeleton sequence;secondly,an adaptive graph convolution network is constructed by using the feature learning ability of Gaussian embedding function and lightweight convolution neural network,and considering the effect of human prior knowledge in different time periods;finally,the adaptive graph convolution network is used as the basic framework,the spatio-temporal attention module is embedded to construct two-stream fusion model with joint information,bone information and their respective motion information.The accuracy of the algorithm is 90.2%and 96.2%respectively under the two evaluation standards of NTU RGB+D dataset.The universality of the model is reflected in the large-scale dataset Kinetics,which verifies that the algorithm is proved to be superior in extracting spatio-temporal features and capturing global context information.

作者张家想刘如浩金辰曦卢先领 ZHANG Jiaxiang;LIU Ruhao;JIN Chenxi;LU Xianling(Key Laboratory for Advanced Process Control for Light Industry of the Education Ministry of China,Jiangnan University,Wuxi,Jiangsu 214122,China;School of Internet of Things,Jiangnan University,Wuxi,Jiangsu 214122,China)

机构地区江南大学“轻工过程先进控制”教育部重点实验室江南大学物联网工程学院

出处《信号处理》 CSCD 北大核心 2021年第7期1226-1234,共9页 Journal of Signal Processing

基金国家自然科学基金项目(61573167) 教育部科技发展中心“云数融合科教创新”基金(2017A13055)。

关键词人体骨架行为识别非局部块注意力机制图卷积网络 human skeleton action recognition non-local block attention mechanism graph convolutional network

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1王增强,张文强,张良.引入高阶注意力机制的人体行为识别[J].信号处理,2020,36(8):1272-1279. 被引量：11
2孔玮,刘云,李辉,王传旭.基于图卷积网络的行为识别方法综述[J].控制与决策,2021,36(7):1537-1546. 被引量：22
3曹毅,刘晨,黄子龙,盛永健.时空自适应图卷积神经网络的骨架行为识别[J].华中科技大学学报（自然科学版）,2020,48(11):5-10. 被引量：8

二级参考文献5

1王军,许永明,王东辉,郭文波.基于多支点骨骼模型的实时行为识别方法[J].华中科技大学学报（自然科学版）,2013,41(S1):144-148. 被引量：4
2罗会兰,童康,孔繁胜.基于深度学习的视频中人体动作识别进展综述[J].电子学报,2019,47(5):1162-1173. 被引量：67
3WANG Tingting,GUO Haiyan,LYU Bin,YANG Zhen.Speech Signal Processing on Graphs: Graph Topology, Graph Frequency Analysis and Denoising[J].Chinese Journal of Electronics,2020,29(5):926-936. 被引量：7
4夏鑫,高品,陈康,姜进磊.基于图划分抽样算法的图表示学习[J].计算机应用研究,2020,37(9):2586-2590. 被引量：2
5钟忺,王灿,卢炎生,钟珞.基于ISA网络的视频人体行为分类识别[J].华中科技大学学报（自然科学版）,2019,47(2):103-108. 被引量：3

共引文献36

1吴松平,王天一.基于神经网络和迁移学习的视频人体行为识别[J].智能计算机与应用,2021,11(12):153-157. 被引量：4
2周前祥,郭华岭,廖德智.载人航天器地理位置指示器工效学设计仿真软件的研制[J].计算机仿真,2000,17(1):60-63.
3李航,于家祥,殷守林,孙可.基于模糊逻辑的人体行为识别分析[J].沈阳师范大学学报（自然科学版）,2021,39(1):54-59.
4胡正平,邱悦,翟丰鋆,赵梦瑶,毕帅.融入注意力机制的视频多尺度时序融合行为识别模型[J].信号处理,2021,37(8):1470-1478. 被引量：1
5刘文,胡琨林,李岩,刘钊.移动目标轨迹预测方法研究综述[J].智能科学与技术学报,2021,3(2):149-160. 被引量：6
6刘颉,杨超颖,周凯波.基于图数据深度挖掘的旋转机械故障诊断[J].华中科技大学学报（自然科学版）,2021,49(9):1-5. 被引量：7
7孔玮,刘云,李辉,王传旭,崔雪红.基于深度学习的行人轨迹预测方法综述[J].控制与决策,2021,36(12):2841-2850. 被引量：16
8孙峰,杨观赐,Ajith Kumar V,张安思.基于自我监督学习策略的层智能图卷积网络[J].计算机应用研究,2022,39(1):128-133.
9裴利沈,刘少博,赵雪专.人体行为识别研究综述[J].计算机科学与探索,2022,16(2):305-322. 被引量：11
10李颀,邓耀辉,王娇.基于轻量级图卷积网络的校园暴力行为识别[J].液晶与显示,2022,37(4):530-538. 被引量：2

同被引文献12

1孙彬,孔德慧,张雯晖,贾文浩.基于深度图像的人体行为识别综述[J].北京工业大学学报,2018,44(10):1353-1368. 被引量：8
2胡正平,张乐,尹艳华.时空深度特征AP聚类的稀疏表示视频异常检测算法[J].信号处理,2019,35(3):386-395. 被引量：12
3蔡强,邓毅彪,李海生,余乐,明少锋.基于深度学习的人体行为识别方法综述[J].计算机科学,2020,47(4):85-93. 被引量：32
4赫磊,邵展鹏,张剑华,周小龙.基于深度学习的行为识别算法综述[J].计算机科学,2020,47(S01):139-147. 被引量：24
5黄海新,王瑞鹏,刘孝阳.基于3D卷积的人体行为识别技术综述[J].计算机科学,2020,47(S02):139-144. 被引量：8
6钱慧芳,易剑平,付云虎.基于深度学习的人体动作识别综述[J].计算机科学与探索,2021,15(3):438-455. 被引量：34
7揭志浩,曾明如,周鑫恒,何强.结合Attention-ConvLSTM的双流卷积行为识别[J].小型微型计算机系统,2021,42(2):405-408. 被引量：7
8周雪雪,雷景生,卓佳宁.基于多模态特征学习的人体行为识别方法[J].计算机系统应用,2021,30(4):146-152. 被引量：4
9李扬志,袁家政,刘宏哲.基于时空注意力图卷积网络模型的人体骨架动作识别算法[J].计算机应用,2021,41(7):1915-1921. 被引量：16
10辛华磊,丁英强,高猛,陈恩庆.基于多分区时空图卷积网络的骨骼动作识别[J].信号处理,2022,38(2):241-249. 被引量：4

引证文献3

1梁绪,李文新,张航宁.人体行为识别方法研究综述[J].计算机应用研究,2022,39(3):651-660. 被引量：21
2胡正平,王雨露,张琦明,董佳伟,王昕宇.视频动作骨骼描述空间时空联合对齐小样本分类算法[J].信号处理,2024,40(8):1556-1568.
3张家波,唐上松,何阿娟.基于时间-通道拓扑解耦图卷积的异常行为检测[J].信号处理,2024,40(12):2193-2205.

二级引证文献21

1毛天雅,余磊,周啸辉,姚天,万文文,熊邦书,欧巧凤.基于改进MobileNet V1的红外图像人体行为识别方法[J].辽宁工程技术大学学报（自然科学版）,2023(3):362-369. 被引量：1
2王璇,王雄,张向阳,杨一,贾浩强.基于OpenPose+3S-AGCN的行为识别研究[J].电子技术与软件工程,2022(2):177-180.
3盛洋,王健庆.基于计算机视觉的人体姿态识别研究[J].现代信息科技,2022,6(16):87-91. 被引量：4
4龙霄汉,常兴治,花健.基于惯性传感器的人体行为数据采集系统[J].常州信息职业技术学院学报,2022,21(6):38-43. 被引量：2
5田鑫驰,王亚刚,尹钟.FuseNet:应用于移动端的轻量型图像识别网络[J].计算机应用研究,2023,40(1):288-293.
6赵子忠,王喆,郑月西.原子力与平台化:智能媒体的发展理论与模式[J].青年记者,2023(1):12-17. 被引量：1
7吴浩原,熊辛,闵卫东,赵浩宇,汪文翔.基于多级特征融合和时域扩展的行为识别方法[J].计算机工程与应用,2023,59(7):134-142.
8李建平,赖永倩.基于注意力机制和残差网络的视频行为识别[J].计算机技术与发展,2023,33(4):69-74.
9束阳,李汪根,高坤,王志格,葛英奎.基于轻量级语义信息融合的动作识别方法[J].计算机技术与发展,2023,33(6):181-188. 被引量：2
10郑永生,肖军,温高能,雷磊,彭勃兴,文润玉.基于边缘设备轻量化行为识别算法[J].现代电子技术,2023,46(23):137-143.

1曹毅,刘晨,盛永健,黄子龙,邓小龙.基于三维图卷积与注意力增强的行为识别模型[J].电子与信息学报,2021,43(7):2071-2078. 被引量：9
2赵倩,叶震,周朝政.Karcher均值算法在动作识别上的应用[J].理论数学,2021,11(6):1166-1180.
3柏永华,刘衡,张体江,田冲,王荣品,李武超.基于CT影像组学术前预测肾透明细胞癌WHO/ISUP分级[J].中国医学影像学杂志,2021,29(6):585-590. 被引量：3
4古春霞,李大成,赫华颖,杨毅.时空融合技术在城市精细变化检测中的应用研究[J].无线电工程,2021,51(8):725-731. 被引量：1

信号处理

2021年第7期

浏览历史

内容加载中请稍等...

结合时空注意力机制和自适应图卷积网络的骨架行为识别被引量：3

参考文献3

二级参考文献5

共引文献36

同被引文献12

引证文献3

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

结合时空注意力机制和自适应图卷积网络的骨架行为识别 被引量：3

参考文献3

二级参考文献5

共引文献36

同被引文献12

引证文献3

二级引证文献21

相关作者

相关机构

相关主题

浏览历史

结合时空注意力机制和自适应图卷积网络的骨架行为识别被引量：3