摘要
针对复杂场景下的动作识别,提出一种基于稀疏编码的时空金字塔匹配的动作识别方法.通过稀疏编码的方法学习更具有判别性的码书和计算局部块(cuboids)的稀疏表示;然后基于max pooling的时空金字塔匹配进行动作分类.该方法在KTH和YouTube两大公开数据集上进行了评价,实验结果表明,与基于K-means的时空金字塔匹配方法相比,该方法提高了2%-7%左右的识别率,在复杂的视频中取得了较好的识别效果.
A spatio-temporal pyramid matching (STPM ) using sparse coding is proposed for action recognition in complex environment, which learns a more discriminative codebook and computes the cuboids'sparse representations by sparse coding followed by action classification using the STPM based on the max pooling. Experiments are evaluated on KTH and YouTube datasets. The results demonstrate that our approach achieves 2% to 7% improvement over the STPM based on k-means and obtains high recognition rate in complex videos.
出处
《小型微型计算机系统》
CSCD
北大核心
2012年第1期169-172,共4页
Journal of Chinese Computer Systems
基金
国家自然科学基金项目(60873192)资助
江西省教育厅科技项目(GJJ09143)资助
江西师范大学青年基金项目资助
关键词
动作识别
稀疏编码
时空金字塔匹配
词袋
action recognition
sparse coding
spatio-temporal pyramid matching
bag of words