基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文）被引量：12

Action recognition with hierarchical convolutional neural networks features and bi-directional long short-term memory model

下载PDF

导出

摘要鲁棒的视频行为识别由于其复杂性成为了一项极具挑战的任务.如何有效提取鲁棒的时空特征成为解决问题的关键.在本文中,提出使用双向长短时记忆单元(Bi-LSTM)作为主要框架去捕获视频序列的双向时空特征.首先,为了增强特征表达,使用多层的卷积神经网络特征代替传统的手工特征.多层卷积特征融合了低层形状信息和高层语义信息,能够捕获丰富的空间信息.然后,将提取到的卷积特征输入Bi-LSTM,Bi-LSTM包含两个不同方向的LSTM层.前向层从前向后捕获视频演变,后向层反方向建模视频演变.最后两个方向的演变表达融合到Softmax中,得到最后的分类结果.在UCF101和HMDB51数据集上的实验结果显示本文的方法在行为识别上可以取得较好的性能. Robust action recognition in videos is a challenging task due to its complexity.To solve it,how to effectively capture the robust spatio-temporal features becomes very important.In this paper,we propose to exploit bi-directional long short-term memory(Bi--LSTM)model as main framework to capture bi-directional spatio-temporal features.First,in order to boost our feature representations,the traditional hand-crafted descriptors are replaced by the extracted hierarchical convolutional neural network features.The multiple convolutional layer features fuse the information of low level basic shapes and high level semantic contents to get powerful spatial features.Then,the extracted convolutional features are fed into Bi--LSTM which has two different directional LSTM layers.The forward layer captures the evolution from front to back over video time and the backward layer models the opposite directional evolution.The two directional representations of evolution are then fused into Softmax to get final classification result.The experiments on UCF101and HMDB51datasets show that our method can achieve comparable performance with the state of the art methods for action recognition.

作者葛瑞王朝晖徐鑫季怡刘纯平龚声蓉 GE Rui;WANG Zhao-hui;XU Xin;JI Yi;LIU Chun-ping;GONG Sheng-rong(School of computer science and technolgoy, Soochow University, Suzhou Jiangsu 215000, China;Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education, Jilin University, Changchun Jilin 130012, China;Collaborative Innovation Center of Novel Software Technology and Industrialization, Nanjing Jiangsu 210046, China;School of Computer Science and Engineering, Changshu Institute of Technology, Changshu Jiangsu 215500, China)

机构地区苏州大学计算机科学与技术学院吉林大学符号计算与知识工程教育部重点实验室软件新技术与产业化协同创新中心常熟理工学院计算机科学与工程学院

出处《控制理论与应用》 EI CAS CSCD 北大核心 2017年第6期790-796,共7页 Control Theory & Applications

基金 Supported by National Natural Science Foundation of China(61170124,61272258,61301299,61272005,61572085) Provincial Natural Science Foundation of Jiangsu(BK20151254,BK20151260) Key Laboratory of Symbolic Computation and Knowledge Engineering of Ministry of Education,Jilin University(93K172016K08) a Prospective Joint Research Projects from Joint Innovation and Research Foundation of Jiangsu Province(BY2014-05914) Collaborative Innovation Center of Novel Software Technology and Industrialization

关键词行为识别卷积神经网络递归神经网络双向递归神经网络 action recognition convolutional neural networks recurrent neural networks bi-directional recurrent neural networks

分类号 TP183 [自动化与计算机技术—控制理论与控制工程] TP391.41 [自动化与计算机技术—控制科学与工程]

引文网络
相关文献

同被引文献80

1崔杨,纪银锁,仲悟之,崔成伟,许伯阳,赵钰婷.计及需求响应及环保成本的含储热CHP与风电联合优化调度[J].电网技术,2020,44(2):655-663. 被引量：21
2杨宇,于德介,程军圣.基于EMD与神经网络的滚动轴承故障诊断方法[J].振动与冲击,2005,24(1):85-88. 被引量：143
3雷亚国,何正嘉,訾艳阳,胡桥.基于特征评估和神经网络的机械故障诊断模型[J].西安交通大学学报,2006,40(5):558-562. 被引量：39
4赵志宏,杨绍普.一种基于样本熵的轴承故障诊断方法[J].振动与冲击,2012,31(6):136-140. 被引量：130
5史运涛,杨震安,李志军,孙德辉,刘大千.基于数据驱动的混杂系统建模与优化控制研究[J].系统仿真学报,2013,25(11):2709-2716. 被引量：9
6巩晓倩,蒲亦非,杨智勇,周激流.基于有限状态自动机的人眼开度PERCLOS实现算法[J].计算机应用研究,2014,31(1):307-310. 被引量：17
7张丽霞,刘涛,潘福全,郭涛,刘瑞昌.驾驶员因素对道路交通事故指标的影响分析[J].中国安全科学学报,2014,24(5):79-84. 被引量：59
8徐涛,裴爱岭,刘勇.基于谐波小波包和SVM的滚动轴承故障诊断方法[J].沈阳航空航天大学学报,2014,31(4):50-54. 被引量：7
9孟宗,闫晓丽,王亚超.基于LMD和HMM的旋转机械故障诊断[J].中国机械工程,2014,25(21):2942-2946. 被引量：20
10雷亚国,贾峰,周昕,林京.基于深度学习理论的机械装备大数据健康监测方法[J].机械工程学报,2015,51(21):49-56. 被引量：329

引证文献12

1杨志杰,张梅,李冠龙,黄昌达.基于长短时记忆元的语音智能识别系统设计[J].电子设计工程,2020,28(1):55-58. 被引量：4
2吴潇颖,李锐,吴胜昔.基于CNN与双向LSTM的行为识别算法[J].计算机工程与设计,2020,41(2):361-366. 被引量：9
3施冬梅,孙翠改,盛雪丰,毕学超.基于卷积神经网络的驾驶安全监测系统设计[J].河北北方学院学报（自然科学版）,2020,36(9):57-F0003. 被引量：1
4詹秀菊,陈凤.基于Bi-LSTM神经网络的人类行为识别研究[J].现代计算机,2020,26(27):49-51. 被引量：1
5褚菲,苏嘉铭,梁涛,陈俊龙,王雪松,马小平.基于lasso和elastic net的宽度学习系统网络结构稀疏方法[J].控制理论与应用,2020,37(12):2543-2550. 被引量：9
6赵志宏,赵敬娇,魏子洋.基于BiLSTM的滚动轴承故障诊断研究[J].振动与冲击,2021,40(1):95-101. 被引量：38
7李文静,王潇潇.基于简化型LSTM神经网络的时间序列预测方法[J].北京工业大学学报,2021,47(5):480-488. 被引量：11
8王辉,潘俊辉,王浩畅,张强,张岩.基于改进的CBOW与BI-LSTM-ATT的文本分类研究[J].计算机与数字工程,2021,49(7):1372-1376. 被引量：4
9施冬梅,肖锋.基于改进长短时记忆网络的驾驶行为检测方法研究[J].汽车工程,2021,43(8):1203-1209. 被引量：10
10林丽星.基于智能算法的教育知识问答系统设计[J].佳木斯大学学报（自然科学版）,2021,39(5):148-151. 被引量：2

二级引证文献92

1葛海燕,左国华,高明发.^(131)I标记抗CEA单抗预防人结肠癌肝转移的实验研究[J].第三军医大学学报,2000,22(5):430-432. 被引量：5
2陈彦彤,陈伟楠,张献中,李雨阳,王俊生.基于深度卷积神经网络的蝇类面部识别[J].光学精密工程,2020,28(7):1558-1567. 被引量：12
3刘文佳,陶玉国.游客对空气质量感知的情感分析——基于双向LSTM模型[J].资源开发与市场,2020,36(9):929-935.
4詹秀菊,陈凤.基于Bi-LSTM神经网络的人类行为识别研究[J].现代计算机,2020,26(27):49-51. 被引量：1
5信博翔.基于分层多任务模型的呼叫中心满意度评估[J].信息技术,2021,45(3):60-65. 被引量：3
6马珍福,陈鲁,瞿健,田文德.基于动态模拟的油气集输站库生产过程安全参数智能预测[J].山东化工,2021,50(17):166-168. 被引量：3
7郭建鑫,赵玉顺,王志宇,丁立健.基于LMD和LSTM的盆式绝缘子典型缺陷局部放电模式识别方法[J].南方电网技术,2021,15(8):95-105. 被引量：14
8许立环,王春,徐翔,卫军会,许园,邓艾东.基于自适应变分模态分解的滚动轴承故障诊断研究[J].工业控制计算机,2021,34(12):86-88. 被引量：2
9彭玉芳,陈将浩,何志强.基于机器学习和深度学习的南海证据性数据抽取算法比较与应用[J].现代情报,2022,42(2):55-69. 被引量：6
10张斌,付俊怡,夏金祥.基于类间距优化的分心驾驶行为识别模型训练方法[J].汽车工程,2022,44(2):225-232. 被引量：2

1潘富江.卷积的研究[J].甘肃电力,1992(1):10-15.
2周六丁,程代杰.实圆卷积新算法及与现有算法的比较[J].重庆大学学报（自然科学版）,1992,15(1):114-120.
3糖心烙饼.反方向的伞[J].当代学生（探秘）,2017,0(5):32-32.
4曹博,刘志刚,刘文评,祝军.人体行为识别方法研究[J].中国科技信息,2017,0(18):71-71. 被引量：2
5杨定恭.关于Ahuja的一个结果[J].苏州大学学报（自然科学版）,1990,6(4):424-428.
6程麟趾,李程宽.广义函数的卷积[J].应用数学,1992,5(4):103-105.
7右右.不同方向不同样[J].数学大王（低年级）（1-2年级）,2017,0(10):18-18.
8孟宪云,王永茂,高作峰.卷积移时特性的一般形式及应用[J].齐齐哈尔师范学院学报（自然科学版）,1993,13(2):7-9.
9李必山.一族单叶函数的卷积[J].河海大学学报（自然科学版）,1991,19(4):52-58.
10肖玉兰.Fibonacci数列和Lucas数列的卷积[J].青海师范大学学报（自然科学版）,2005,21(3):12-13.

控制理论与应用

2017年第6期

浏览历史

内容加载中请稍等...

基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文）被引量：12

同被引文献80

引证文献12

二级引证文献92

相关作者

相关机构

相关主题

浏览历史

基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文） 被引量：12

同被引文献80

引证文献12

二级引证文献92

相关作者

相关机构

相关主题

浏览历史

基于多层卷积神经网络特征和双向长短时记忆单元的行为识别（英文）被引量：12