-
题名(2+1)D多时空信息融合模型及在行为识别的应用
被引量:3
- 1
-
-
作者
谈咏东
王永雄
陈姝意
缪银龙
-
机构
上海理工大学光电信息与计算机工程学院
江苏易往智能装备有限公司
-
出处
《信息与控制》
CSCD
北大核心
2019年第6期715-722,共8页
-
基金
国家自然科学基金资助项目(61673276,61703277).
-
文摘
针对常规的卷积神经网络时空感受野尺度单一,难以提取视频中多变的时空信息的问题,利用(2+1)D模型将时间信息和空间信息在一定程度上解耦的特性,提出了(2+1)D多时空信息融合的卷积残差神经网络,并用于人体行为识别.该模型以3×3空间感受野为主,1×1空间感受野为辅,与3种不同时域感受野交叉组合构建了6种不同尺度的时空感受野.提出的多时空感受野融合模型能够同时获取不同尺度的时空信息,提取更丰富的人体行为特征,因此能够更有效识别不同时间周期、不同动作幅度的人体行为.另外提出了一种视频时序扩充方法,该方法能够同时在空间信息和时间序列扩充视频数据集,丰富训练样本.提出的方法在公共视频人体行为数据集UCF101和HMDB51上子视频的识别率超过或接近最新的视频行为识别方法.
-
关键词
时空信息融合
人体行为识别
(2+1)D卷积残差神经网络
感受野
卷积神经网络
-
Keywords
spatio-temporal information fusion
human behavior recognition
(2+1)D convolution residual neural network
receptive field
convolutional neural network
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP183
[自动化与计算机技术—计算机科学与技术]
-