题名 基于深度学习的人体行为识别算法综述
被引量:131
1
作者
朱煜
赵江坤
王逸宁
郑兵兵
机构
华东理工大学信息科学与工程学院
出处
《自动化学报》
EI
CSCD
北大核心
2016年第6期848-857,共10页
基金
国家自然科学基金(61370174
61271349)
中央高校基本科研业务费专项资金(WH1214015)资助~~
文摘
人体行为识别和深度学习理论是智能视频分析领域的研究热点,近年来得到了学术界及工程界的广泛重视,是智能视频分析与理解、视频监控、人机交互等诸多领域的理论基础.近年来,被广泛关注的深度学习算法已经被成功运用于语音识别、图形识别等各个领域.深度学习理论在静态图像特征提取上取得了卓著成就,并逐步推广至具有时间序列的视频行为识别研究中.本文在回顾了基于时空兴趣点等传统行为识别方法的基础上,对近年来提出的基于不同深度学习框架的人体行为识别新进展进行了逐一介绍和总结分析;包括卷积神经网络(Convolution neural network,CNN)、独立子空间分析(Independent subspace analysis,ISA)、限制玻尔兹曼机(Restricted Boltzmann machine,RBM)以及递归神经网络(Recurrent neural network,RNN)及其在行为识别中的模型建立,对模型性能、成果进展及各类方法的优缺点进行了分析和总结.
关键词
行为识别
深度学习
卷积神经网络
限制玻尔兹曼机
Keywords
action recognition
deep learning
convolution neural network(CNN)
restricted Boltzmann machine(RBM)
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 人体动作行为识别研究综述
被引量:96
2
作者
李瑞峰
王亮亮
王珂
机构
哈尔滨工业大学机器人技术与系统国家重点实验室哈尔滨
出处
《模式识别与人工智能》
EI
CSCD
北大核心
2014年第1期35-48,共14页
基金
国家自然科学基金项目(No.61273336)
国家教育部博士点专项基金项目(No.20122302120039)
中央高校基本科研业务费专项资金项目(No.HIT.NSRIF.201172)资助
文摘
人体动作行为识别因其在视频监控、虚拟现实、人机智能交互等领域的广泛应用而成为计算机视觉领域的研究热点.文中将人体动作行为识别问题归纳为计算机经过检测动作数据而获取并符号化动作信息,继而提取和理解动作特征以实现动作行为分类的过程,在此基础上,从运动目标检测、动作特征提取和动作特征理解3个方面对涉及到的技术进行回顾分析,对相关方法进行分类,并讨论相关难点和研究方向.
关键词
动作识别
运动目标检测
动作特征提取
动作特征理解
Keywords
action recognition , Moving Object Detection , action Feature Extraction , action FeaturePerception
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于深度学习的视频中人体动作识别进展综述
被引量:64
3
作者
罗会兰
童康
孔繁胜
机构
江西理工大学信息工程学院
浙江大学计算机科学技术学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2019年第5期1162-1173,共12页
基金
国家自然科学基金(No.61462035
No.61862031)
+1 种基金
江西省自然科学基金(No.20171BAB202014)
江西省青年科学家培养对象计划资助(No.20153BCB23010)
文摘
视频中的人体动作识别是计算机视觉领域内一个充满挑战的课题.不论是在视频信息检索、日常生活安全、公共视频监控,还是人机交互、科学认知等领域都有广泛的应用.本文首先简单介绍了动作识别的研究背景、意义及其难点,接着从模型输入信号的类型和数量、是否结合了传统特征提取方法、模型预训练三个维度详细综述了基于深度学习的动作识别方法,及比较分析了它们在UCF101和HMDB51这两个数据集上的识别效果.最后分别从视频预处理、视频中人体运动信息表征、模型学习训练这三个角度对未来动作识别可能的发展方向进行了论述.
关键词
动作识别
综述
卷积神经网络
深度学习
Keywords
action recognition
review
convolutional neural network
deep learning
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 动作识别与行为理解综述
被引量:50
4
作者
徐光祐
曹媛媛
机构
清华大学计算机科学与技术系普适计算教育部重点实验室
出处
《中国图象图形学报》
CSCD
北大核心
2009年第2期189-195,共7页
基金
国家自然科学基金项目(60673189)
文摘
随着"以人为中心计算"的兴起和生活中不断涌现的新应用,动作识别和行为理解逐渐成为计算机视觉领域的研究热点。主要从视觉处理的角度分析了动作识别和行为理解的研究现状,从行为的定义、运动特征提取和动作表示以及行为理解的推理方法3个方面对目前的工作做了分析和比较,并且指出了目前这些工作面临的难题和今后的研究方向。
关键词
以人为中心计算
动作识别
行为理解
Keywords
human-centered computing, action recognition , activity understanding
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 人的视觉行为识别研究回顾、现状及展望
被引量:46
5
作者
单言虎
张彰
黄凯奇
机构
模式识别国家重点实验室(中国科学院自动化研究所)
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第1期93-112,共20页
基金
国家自然科学基金项目(61322209
61473290)
+1 种基金
国家"九七三"重点基础研究发展计划基金项目(2012CB316302)
新疆维吾尔自治区科技专项基金项目(201230122)~~
文摘
人的行为识别是计算机视觉领域中的重点研究问题之一.相对于静态图像中物体识别研究,行为识别更加关注如何感知感兴趣目标在图像序列中的时空运动变化.视觉行为的存在方式从二维空间到三维时空的扩展大大增加了行为表达及后续识别任务的复杂性,同时也为视觉研究者提供了更广阔的空间以尝试不同的解决思路和技术方法.近年来,人的行为识别相关工作层出不穷,已成为计算机视觉研究中的热点方向.以时间为顺序,对从21世纪初至今约15年中出现的视觉行为识别研究方法进行了梳理、归类和总结.相比其他综述性文章,以不同时期人的行为识别数据库的演化为线索,介绍不同时期行为识别研究所关注的研究重点问题和主要研究思路,能更清晰直观地体现行为识别研究的发展历程.同时,以数据库演化历程为顺序介绍行为识别,能更好地呼应当前视觉领域愈来愈受人关注的大数据驱动的研究思路.通过对相关工作的梳理和总结,还对今后行为识别研究的发展方向做出展望,希望对各位研究者方向把握上提供一些帮助.
关键词
计算机视觉
行为识别
时空运动
数据库演化
综述
Keywords
computer vision
action recognition
spatio-temporal motion
dataset evolution
survey
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 行为分析算法综述
被引量:40
6
作者
谷军霞
丁晓青
王生进
机构
清华大学电子工程系智能技术与系统国家重点实验室
出处
《中国图象图形学报》
CSCD
北大核心
2009年第3期377-387,共11页
基金
国家高技术研究发展计划(863)项目(2006AA01Z115)
国家自然科学基金项目(60472002)
文摘
行为分析有着广泛的应用背景,如智能监控、人机交互、运动员辅助训练、视频编码等等。近年来,在这些应用的驱动之下,行为分析已经成为图像分析、心理学、神经生理学等相关领域的研究热点。本文概述了图像领域行为分析相关研究的发展历史、研究现状及目前存在的主要问题。行为分析的相关研究起始于20世纪的70年代,80年代有了初步的进展,90年代是行为分析的逐步发展阶段,在这个时期提出了一些影响较大的研究方法。2000年之后,由于智能监控等方面的迫切需求,行为分析的描述方法和识别算法以及行为理解都取得了快速而深入的发展。行为分析最基本的两个问题是行为的描述和识别,行为的描述方法可分为两类:一类是基于低层图像信息的方法,一类是基于高层人体结构的方法。行为的识别算法也可分为两类:一类是基于模板匹配的算法,一类是基于状态空间的算法。本文基于行为描述和行为识别这两个基本问题,综述了目前行为分析主要研究算法,并比较了各类算法的优缺点。本文在研究了各类算法的发展历史和现状的基础上,总结了行为分析目前存在的主要问题及可能的发展方向。
关键词
行为分析
行为描述
行为识别
状态空间算法
模板匹配算法
Keywords
activity analysis, action representation, action recognition , state space method, template matching method
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于深度学习的学生课堂行为识别
被引量:37
7
作者
魏艳涛
秦道影
胡佳敏
姚璜
师亚飞
机构
华中师范大学教育信息技术学院
出处
《现代教育技术》
CSSCI
北大核心
2019年第7期87-91,共5页
基金
国家自然科学基金项目“基于记忆的不变图像特征学习方法研究”(项目编号:61502195)
湖北省自然科学基金项目“基于I理论的深度学习方法研究”(项目编号:2018CFB691)
中央高校基本科研业务费项目“基于深度学习的学生课堂行为识别研究”(项目编号:CCNU19QN023)的阶段性研究成果
文摘
随着教育步入智能时代,智能化的学生课堂行为识别变得越来越重要。但由于学生的课堂行为复杂多变,使得智能化的学生课堂行为识别存在困难。为了提高智能化学生行为识别的精度,文章首先采集了300名学生的7种典型课堂行为图像,并进行了数据预处理。随后,文章将已在ImageNet数据集上训练好的经典深度网络模型——VGG16网络模型迁移到学生课堂行为识别任务中。最后,通过与其它深度学习模型进行实验对比,文章验证了VGG16网络模型对学生课堂行为具有较高的识别精度。上述研究表明,基于深度学习的学生课堂行为识别能及时、精准地反馈学生的课堂学习情况,有利于教师改进教学方法、优化课堂教学与管理,从而提高教与学的效率,助力教学改革。
关键词
学生课堂行为
行为识别
深度学习
VGG16网络模型
Keywords
students’ classroom behavior
action recognition
deep learning
VGG16 network model
分类号
G40-057
[文化科学—教育学原理]
题名 面向智能监控的行为识别
被引量:33
8
作者
马钰锡
谭励
董旭
于重重
机构
北京工商大学计算机与信息工程学院食品安全大数据技术北京市重点实验室
出处
《中国图象图形学报》
CSCD
北大核心
2019年第2期282-290,共9页
基金
国家自然科学基金项目(61702020)
北京市自然科学基金项目(4172013)~~
文摘
目的为了进一步提高智能监控场景下行为识别的准确率和时间效率,提出了一种基于YOLO(you onlylook once:unified,real-time object detection)并结合LSTM(long short-term memory)和CNN(convolutional neural net-work)的人体行为识别算法LC-YOLO(LSTM and CNN based on YOLO)。方法利用YOLO目标检测的实时性,首先对监控视频中的特定行为进行即时检测,获取目标大小、位置等信息后进行深度特征提取;然后,去除图像中无关区域的噪声数据;最后,结合LSTM建模处理时间序列,对监控视频中的行为动作序列做出最终的行为判别。结果在公开行为识别数据集KTH和MSR中的实验表明,各行为平均识别率达到了96. 6%,平均识别速度达到215 ms,本文方法在智能监控的行为识别上具有较好效果。结论提出了一种行为识别算法,实验结果表明算法有效提高了行为识别的实时性和准确率,在实时性要求较高和场景复杂的智能监控中有较好的适应性和广泛的应用前景。
关键词
行为识别
目标检测
深度学习
卷积神经网络
循环神经网络
Keywords
action recognition
target detection
deep learning
convolutional neural network
recurrent neural network
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于改进的深度卷积神经网络的人体动作识别方法
被引量:31
9
作者
陈胜娣
魏维
何冰倩
陈思宇
刘基缘
机构
成都信息工程大学计算机学院
出处
《计算机应用研究》
CSCD
北大核心
2019年第3期945-949,953,共6页
基金
四川省教育厅重点科研项目(2017Z026)
文摘
针对现有的动作识别算法的特征提取复杂、识别率低等问题,提出了基于批归一化变换(batch normali-zation)与Goog Le Net网络模型相结合的网络结构,将图像分类领域的批归一化思想应用到动作识别领域中进行训练算法改进,实现了对视频动作训练样本的网络输入进行微批量(mini-batch)归一化处理。该方法以RGB图像作为空间网络的输入,光流场作为时间网络输入,然后融合时空网络得到最终动作识别结果。在UCF101和HMDB51数据集上进行实验,分别取得了93. 50%和68. 32%的准确率。实验结果表明,改进的网络架构在视频人体动作识别问题上具有较高的识别准确率。
关键词
动作识别
批归一化
深度学习
卷积神经网络
Keywords
action recognition
batch normalization
deep learning
convolutional neural network
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—计算机科学与技术]
题名 基于局部轮廓和随机森林的人体行为识别
被引量:29
10
作者
蔡加欣
冯国灿
汤鑫
罗志宏
机构
中山大学数学与计算科学学院
广东省计算科学重点实验室
中山大学信息科学与技术科学学院
出处
《光学学报》
EI
CAS
CSCD
北大核心
2014年第10期204-213,共10页
基金
国家自然科学基金(61272338)
文摘
基于视频信息的人体行为识别得到了越来越多的关注。针对人体行为的局部表达,提出了一种新的局部轮廓特征来描述人体的外观姿势,可以同时利用水平和竖直方向上的轮廓变化信息。该特征能有效区分不同动作,与轮廓起始点无关,具有平移、尺度和旋转不变性。针对该特征,提出了一种基于随机森林的两阶段分类方法,使用随机森林分类器对行为视频的局部轮廓进行初分类,并根据每个局部轮廓对应决策类的分类树数目占总分类树数目的比例,提出了一种基于袋外(OOB)数据误差加权投票准则的行为视频分类算法。在测试数据集上的实验结果证实了该方法的有效性。
关键词
机器视觉
行为识别
轮廓特征
随机森林
袋外误差
Keywords
machine vision
action recognition
contour feature
random forest
out of bag error
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于深度学习的视频预测研究综述
被引量:29
11
作者
莫凌飞
蒋红亮
李煊鹏
机构
东南大学仪器科学与工程学院
出处
《智能系统学报》
CSCD
北大核心
2018年第1期85-96,共12页
基金
国家十二五科技支撑计划重点项目(2015BAG09B01)
文摘
近年来,深度学习算法在众多有监督学习问题上取得了卓越的成果,其在精度、效率和智能化等方面的性能远超传统机器学习算法,部分甚至超越了人类水平。当前,深度学习研究者的研究兴趣逐渐从监督学习转移到强化学习、半监督学习以及无监督学习领域。视频预测算法,因其可以利用海量无标注自然数据去学习视频的内在表征,且在机器人决策、无人驾驶和视频理解等领域具有广泛的应用价值,近两年来得到快速发展。本文论述了视频预测算法的发展背景和深度学习的发展历史,简要介绍了人体动作、物体运动和移动轨迹的预测,重点介绍了基于深度学习的视频预测的主流方法和模型,最后总结了当前该领域存在的问题和发展前景。
关键词
视频预测
深度学习
无监督学习
运动预测
动作识别
卷积神经网络
递归神经网络
自编码器
Keywords
video prediction
deep learning
unsupervised learning
motion prediction
action recognition
convolution neural network
recurrent neural network
auto encoder
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于时空权重姿态运动特征的人体骨架行为识别研究
被引量:28
12
作者
丁重阳
刘凯
李光
闫林
陈博洋
钟育民
机构
西安电子科技大学计算机学院
北京遥测技术研究所
出处
《计算机学报》
EI
CSCD
北大核心
2020年第1期29-40,共12页
基金
国家自然科学基金面上项目(61571345)
国家自然科学基金重大研究计划培育项目(91538101)
+1 种基金
国家自然科学基金国际合作项目(61850410523)
空间测控通信创新探索基金(201701B)资助~~
文摘
人体行为识别在视觉领域的广泛应用使得它在过去的几十年里一直都是备受关注的研究热点.近些年来,深度传感器的普及以及基于深度图像实时骨架估测算法的提出,使得基于骨架序列的人体行为识别研究越来越吸引人们的注意.已有的研究工作大部分提取帧内骨架不同关节点的空间域信息和帧间骨架关节点的时间域信息来表征行为序列,但没有考虑到不同关节点和姿态对判定行为类别所起作用是不同的.因此本文提出了一种基于时空权重姿态运动特征的行为识别方法,采用双线性分类器迭代计算得到关节点和静止姿态相对于该类别动作的权重,确定那些信息量大的关节点和姿态;同时,为了对行为特征进行更好的时序分析,本文引入了动态时间规整和傅里叶时间金字塔算法进行时序建模,最后采用支持向量机完成行为分类.在多个数据集上的实验结果表明,该方法与其它一些方法相比,表现出了相当大的竞争力,甚至更好的识别效果.
关键词
行为识别
特征表示
骨架序列
线性分类器
时序模型
Keywords
action recognition
feature representation
skeleton sequence
linear classifier
temporal model
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于时空单词的两人交互行为识别方法
被引量:25
13
作者
韩磊
李君峰
贾云得
机构
北京理工大学计算机学院智能信息技术北京市重点实验室
出处
《计算机学报》
EI
CSCD
北大核心
2010年第4期776-784,共9页
基金
国家自然科学基金(60905006
90920009)
国家"八六三"高技术研究发展计划项目基金(2009AA01Z323)资助~~
文摘
文中提出一种基于时空单词的两人交互行为识别方法,该方法从行为视频中提取丰富的时空兴趣点,基于人体剪影的连通性分析和时空兴趣点的历史信息,把时空兴趣点划分给不同的人体,并在兴趣点样本空间聚类生成时空码本(spatial-temporal codebook).对于给定的时空兴趣点集,通过投票得到表示单人原子行为的时空单词(spatial-temporal words).采用条件随机场模型建模单人原子行为,在两人交互行为的语义建模过程中,人工建立表示领域知识(domain knowledge)的一阶逻辑知识库,并训练马尔可夫逻辑网用以两人交互行为的推理.两人交互行为库上的实验结果证明了该方法的有效性.
关键词
交互行为分析
行为识别
时空特征
条件随机场
马尔可夫逻辑网
Keywords
interaction analysis
action recognition
spatial-temporal feature
conditional random field
Markov logic network
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于视觉的人体运动分析综述
被引量:26
14
作者
阮涛涛
姚明海
瞿心昱
楼中望
机构
浙江工业大学信息工程学院
出处
《计算机系统应用》
2011年第2期245-254,共10页
基金
浙江省自然科学基金(20080376)
文摘
基于视觉的人运动分析越来越受到计算机视觉领域研究者的广泛关注,它成为图像分析、心理学、人工智能等领域的研究热点,在智能视频监控、虚拟现实、用户接口、运动分析等方面有着广泛的应用。从运动目标检测、运动目标分类、人体运动跟踪、人体行为识别与描述四个环节综述了人体运动分析的研究现状,分析了存在的一些问题和未来的研究发展方向。
关键词
人体运动分析
运动检测
跟踪
行为识别
Keywords
human motion analysis
motion detection
tracking
action recognition
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 时空域深度卷积神经网络及其在行为识别上的应用
被引量:24
15
作者
刘琮
许维胜
吴启迪
机构
同济大学电子与信息工程学院
出处
《计算机科学》
CSCD
北大核心
2015年第7期245-249,共5页
文摘
近年来深度卷积神经网络在静态图像识别上取得了较大进展,但在行为视频上建模运动信息的能力较弱。但是,运动信息是行为识别区别于静态图像识别的关键。基于滤波器响应积提出了时空域深度卷积神经网络。该网络先将相邻帧对应的卷积核分为两组,近似地形成傅里叶基函数对,后续的乘法层将不同帧产生的响应两两相乘后再输入加法层求和,从而将相邻帧映射到变换矩阵的特征值对应的不变子空间上,依靠相邻帧在不变子空间上的旋转角度检测它们之间的运动特征。理论分析证明,网络既对运动敏感,又对内容敏感。实验表明,该网络能对行为视频做出更准确的分类,并与近年出现的其他6种算法进行比较,结果体现了本算法的优越性。
关键词
时空域
卷积神经网络
深度学习
动作特征
行为识别
Keywords
Spatiotemporal
Convolutional neural networks
Deep learning
Motion feature
action recognition
分类号
TP301
[自动化与计算机技术—计算机系统结构]
题名 基于Kinect的人体动作识别方法
被引量:24
16
作者
辛义忠
邢志飞
机构
沈阳工业大学信息科学与工程学院
出处
《计算机工程与设计》
北大核心
2016年第4期1056-1061,共6页
基金
国家自然科学基金项目(61100091)
教育部留学回国人员科研启动基金项目([2013]693)
+2 种基金
辽宁省高等学校杰出青年学者成长计划基金项目(LJQ2012007)
沈阳工业大学青年学术骨干教师培养基金项目([2011]41)
沈阳工业大学博士科研启动基金项目([2011]30)
文摘
为解决在Kinect平台下人体动作识别中时空复杂性的问题,提出一种基于特征选择的模板识别方法。根据人体不同位置关节点对动作表达的贡献度的不同,将骨骼模型60维的关节点数据转化成24维的距离特征向量,该特征模型能够在空间上对动作进行表示,具有一定不变性,计算复杂度低;结合动态时间规整的思想,解决动作识别在时间轴上不统一的问题;基于所提出的方法实现动作识别系统,定义6种基于交互的上肢动作,在此动作库中进行两个实验共1320次测试,两个实验的平均识别率为93.6%和89.8%,实验结果验证了该方法的鲁棒性和有效性,可以满足交互任务的需求。
关键词
人机交互
骨骼跟踪
动作识别
动态时间规整
KINECT
Keywords
human-computer interaction
skeletal tracking
action recognition
dynamic time warping
Kinect
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 基于深度学习的行为识别算法综述
被引量:22
17
作者
赫磊
邵展鹏
张剑华
周小龙
机构
浙江工业大学计算机科学与技术学院
出处
《计算机科学》
CSCD
北大核心
2020年第S01期139-147,共9页
基金
国家自然科学基金(20160283,61603341)
浙江省自然科学基金(KYY-ZX-20190013,KYY-ZX-20180114)。
文摘
行为识别是计算机视觉领域的基本问题之一,基于深度学习的行为识别算法是当前行为识别的主流算法。在已有的研究中,传统特征提取方法一般是通过人工观察和设计,手动设计出能够表征视频动作的特征。然而,在手工特征表达的基础上构建复杂分类模型的方法已经不能适应高识别精度和应用性的要求,而深度学习的引入为行为识别带来了新的发展方向。文中主要综述了基于深度学习的行为识别算法,首先介绍了行为识别的研究背景和意义,并分别对行为识别的传统学习方法和深度学习方法进行了介绍;然后对深度学习下的算法模型结构进行分类介绍,包括Two-Stream、3D-ConvNet、融合CNN-LSTM 3种算法模型结构;最后介绍了目前常用的公开验证数据集,并主要针对基于两种数据模态的识别算法进行了横向比较,一种是基于RGB视频的UCF101和HMDB51数据集,一种是基于人体骨架序列视频的NTU RGB+D数据集。实验结果表明:深度学习方法已经取得了很大的进步,卷积神经网络的应用极大地促进了行为识别算法的发展,逐步替代了基于手工提取特征的传统方法,尤其采用了卷积神经网络算法之后在行为数据集上的准确率有了显著提高。对于RGB视频而言,Two-Stream和3DConvNet是算法模型结构的主流,对于骨架序列视频而言,Two-Stream和融合时空图模型是算法模型结构的主流。
关键词
行为识别
深度学习
卷积神经网络
循环神经网络
3D卷积
Keywords
action recognition
Deep learning
Convolutional neural network
Recurrent neural network
3D-ConvNet
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
题名 面向人机交互的快速人体动作识别系统
被引量:20
18
作者
桑海峰
田秋洋
机构
沈阳工业大学信息科学与工程学院
出处
《计算机工程与应用》
CSCD
北大核心
2019年第6期101-107,167,共8页
基金
国家自然科学基金(No.61773105)
辽宁省自然科学基金(No.20170540675)
文摘
针对在Kinect平台利用人体动作进行人机交互的时效性问题,提出了一种基于时间序列相似性的快速人体动作识别方法。通过Kinect获取人体全身20个关节点,提取关键点的空间三维坐标,转化成特征向量,该特征向量模型能很好地对全身动作进行表示;在动作识别方面提出了一种快速动态时间弯曲距离(Fast Dynamic TimeWarping,F-DTW)算法,解决了因动作速度不同导致的两时间序列在时间轴上不一致的问题,通过引入下界函数和提前终止技术对算法进行加速优化,解决动作识别的时延问题,从而能快速地控制机器人;定义20种动作进行识别,平均识别速度较传统算法大大提高,验证了方法的有效性,满足与机器人交互的要求。
关键词
动作识别
时间序列相似性
F-DTW算法
KINECT
机器人
Keywords
action recognition
time series similarity
Fast Dynamic Time Warping(F-DTW)algorithm
Kinect
robot
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
题名 基于图卷积网络的行为识别方法综述
被引量:20
19
作者
孔玮
刘云
李辉
王传旭
机构
青岛科技大学信息科学技术学院
出处
《控制与决策》
EI
CSCD
北大核心
2021年第7期1537-1546,共10页
基金
国家自然科学基金项目(61702295,61672305)。
文摘
行为识别技术具有巨大的应用前景和潜在的经济价值,广泛应用于视频监控、视频检索、人机交互、公共安全等领域.图卷积网络表现出基于图数据的依赖关系进行建模的强大功能,成为行为识别领域的研究热点.基于此,主要概述基于图卷积网络的行为识别方法.图卷积网络主要有两大方法:基于频谱的方法和基于空间的方法.首先,从不同侧面分析两种方法的优缺点,概述两种方法在行为识别领域的应用与发展;然后,根据行为识别中图网络模型和算法设计的差异,总结网络构造的关键方面,对比不同算法对模型性能产生的影响;最后,针对图卷积网络在行为识别中存在的问题,对未来图卷积网络的发展进行展望.
关键词
图卷积网络
行为识别
神经网络
深度学习
非欧氏空间
Keywords
graph convolutional networks
action recognition
neural networks
deep learning
non-Euclidean space
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 基于MDTW的飞行动作识别算法
被引量:19
20
作者
李鸿利
单征
郭浩然
机构
解放军信息工程大学网络空间安全学院
出处
《计算机工程与应用》
CSCD
北大核心
2015年第9期267-270,共4页
文摘
科学评估飞行训练质量,对提高飞行员的飞行驾驶技术以及保障飞行安全具有重要意义。动作识别是飞行评估的一项基本内容,许多评估内容都是建立在获取动作序列的基础上的。在动态时间规整(DTW)的基础上提出了一种多元动态时间规整算法(MDTW),通过多维融合的方法进行多元时间序列相似性运算。经实际应用验证,该算法有效提升了传统DTW动作识别的效率和准确性。
关键词
动作识别
时间序列
多元动态时间规整算法(MDTW)
多维融合
Keywords
action recognition
time series
multidimensional integration
分类号
TP319
[自动化与计算机技术—计算机软件与理论]