-
题名融合数据增强的迁移字典学习
被引量:1
- 1
-
-
作者
王子儒
李振民
-
机构
中南大学自动化学院
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第23期193-199,共7页
-
基金
国家自然科学基金(51678075)
湖南省科技厅重点计划项目(2017GK2271)。
-
文摘
提出利用迁移字典解决复杂行为数据集标签样本不足的问题。所提出的方法使用简单行为作为源域,来辅助识别由一系列简单行为组成的复杂行为。通过稠密轨迹提取视频的低级特征,利用字典学习从简单行为和复杂行为的低级特征中分别获得相应的稀疏表示,并利用简单行为的稀疏表示通过迁移矩阵改善复杂行为的稀疏表示。因此,即使在复杂行为标签样本较少的情况下,迁移字典也能够获得更有效的高级特征。同时,利用GAN在特征层面上进行数据增强,帮助学习表征能力更强的字典。提出的方法在UCF101和HMDB51两个数据上进行了实验,在小样本量的情况下获得了比现有方法更好的识别结果,证明了方法的有效性。
-
关键词
复杂行为识别
迁移字典
特征增强
-
Keywords
complex action recognition
transferable dictionary
feature augmentation
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于可转移字典对的跨视角动作识别
- 2
-
-
作者
吕卫
赵亚洲
褚晶辉
-
机构
天津大学电子信息工程学院
-
出处
《信息技术》
2017年第7期159-163,共5页
-
文摘
为人体动作寻找具有分辨力的视觉特征是机器视觉研究领域的重要课题,但当视角发生改变时其效果往往不够理想。文中提出了一种视角无关的动作识别方法,利用转移字典对完成视角间信息的转移。转移字典对包含两个字典,分别对应于源视角和目标视角。字典对的学习过程是自发的,其准则是尽量使两个视角中的同一动作具有相同的稀疏表示。提出了有监督和无监督条件下的算法,用于转移字典对的学习。利用转移字典对将两个视角中的视频进行稀疏表示之后,在源视角下训练得到的分类器即可直接用于目标视角。方法的有效性在多视角、多模态的数据库3M上进行验证,取得了良好的效果。
-
关键词
跨视角动作识别
转移字典对
HOG3D描述子
k-NN算法
-
Keywords
cross-view action recognition
transferable dictionary pair
HOG3D
k-NN algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-