期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于改进双流时空网络的人体行为识别 被引量:12
1
作者 张红颖 安征 《光学精密工程》 EI CAS CSCD 北大核心 2021年第2期420-429,共10页
针对传统双流网络无法捕捉视频序列中的时序关系从而导致对时序依赖较大的行为识别效果不理想的问题,提出一种基于改进双流时空网络的人体行为识别算法。首先利用时间移位思想,使卷积神经网络对视频中的时序关系建模,从而高效地捕捉视... 针对传统双流网络无法捕捉视频序列中的时序关系从而导致对时序依赖较大的行为识别效果不理想的问题,提出一种基于改进双流时空网络的人体行为识别算法。首先利用时间移位思想,使卷积神经网络对视频中的时序关系建模,从而高效地捕捉视频中的时空信息;同时使用注意力机制改善由于通道信息在时间轴上移动导致的空间特征学习能力下降的问题;在此基础上构建了一个包含时空表观信息流和时空运动信息流的双流网络结构;最后,采用加权平均的方式融合双流网络,得到最终的识别结果。在UCF101和HMDB51数据集上分别进行了实验,识别准确率为96.3%和77.7%,实验结果表明,与传统双流网络方法相比,识别准确率得到了一定的提升,验证了本文算法能够有效捕捉视频中的时序关系,增强网络的特征表达能力,提高对时序依赖较大的行为和近似行为的辨识能力。 展开更多
关键词 计算机视觉 行为识别 双流网络 时间移位 注意力机制
下载PDF
基于双流卷积神经网络的改进人体行为识别算法 被引量:9
2
作者 张怡佳 茅耀斌 《计算机测量与控制》 2018年第8期266-269,274,共5页
近年来人体行为识别成为计算机视觉领域的一个研究热点,而卷积神经网络(convolutional neural network,CNN)在图像分类和识别领域取得了重要突破,但是人体行为识别是基于视频分析的,视频包含空间域和时间域两部分的信息;针对基于视频的... 近年来人体行为识别成为计算机视觉领域的一个研究热点,而卷积神经网络(convolutional neural network,CNN)在图像分类和识别领域取得了重要突破,但是人体行为识别是基于视频分析的,视频包含空间域和时间域两部分的信息;针对基于视频的人体行为识别问题,提出一种改进的双流卷积神经网络(Two-Stream CNN)模型,对于空间域,将视频的单帧RGB图像作为输入,送入VGGNet_16模型;对于时间域,将多帧叠加后的光流图像作为输入,送入Flow_Net模型;最终将两个模型的Softmax输出加权融合作为输出结果,得到一个多模型融合的人体行为识别器。基于JHMDB公开数据库的实验,结果证明了改进的双流CNN在人体行为识别任务上的有效性。 展开更多
关键词 人体行为识别 深度学习 双流卷积神经网络 模型融合
下载PDF
基于深度学习的人体行为识别综述 被引量:17
3
作者 邓淼磊 高振东 +1 位作者 李磊 陈斯 《计算机工程与应用》 CSCD 北大核心 2022年第13期14-26,共13页
人体行为识别旨在对视频监控中的人体行为进行检索并识别,是人工智能领域的研究热点。基于传统方法的人体行为识别算法存在对样本数据依赖大、易受环境噪声影响等不足。为解决此问题,许多适用于不同应用场景的基于深度学习的人体行为识... 人体行为识别旨在对视频监控中的人体行为进行检索并识别,是人工智能领域的研究热点。基于传统方法的人体行为识别算法存在对样本数据依赖大、易受环境噪声影响等不足。为解决此问题,许多适用于不同应用场景的基于深度学习的人体行为识别算法被提出。介绍了人体行为识别任务中传统特征提取方法和基于深度学习的特征提取方法;从性能和应用两方面对基于深度学习的人体行为识别算法进行总结,重点分析了基于3D卷积神经网络、混合网络、双流卷积神经网络和少样本学习(few-shotlearning,FSL)的人体行为识别方法及其在UCF101和HMDB51数据集上的表现;在深度学习的基础上,归纳了主流模型迁移方法的优缺点及其有效性;总结了现有基于深度学习的人体行为识别算法存在的不足,并讨论了以元学习(meta-learning)和transformer为代表的FSL算法将成为未来模型主流算法的可能性,同时对未来基于深度学习的人体行为识别算法的发展方向进行展望。 展开更多
关键词 行为识别 深度学习 双流卷积网络 少样本学习 元学习
下载PDF
基于特征融合时序分割网络的行为识别研究 被引量:16
4
作者 李洪均 丁宇鹏 +1 位作者 李超波 张士兵 《计算机研究与发展》 EI CSCD 北大核心 2020年第1期145-158,共14页
行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3D卷积为主... 行为识别是当今计算机视觉领域的一个研究热点,是一项具有挑战性的任务.行为识别分析与其网络输入数据类型、网络结构、特征融合环节具有密切联系.目前,主流的行为识别网络输入数据为RGB图像和光流图像,网络结构主要以双流和3D卷积为主;而特征选择直接影响到识别的效率,多层次的特征融合工作还有很多问题有待解决.针对主流的双流卷积网络输入数据为RGB图像和光流图像的局限,利用低秩空间中稀疏特征能够有效捕捉视频中运动物体信息的特点,对网络输入数据进行补充.同时,针对网络中缺乏信息交互的特点,将深度网络中高层语义信息和低层细节信息结合起来共同识别行为动作,使时序分割网络性能更具优势.在行为识别数据集UCF101和HMDB51上取得了97.1%和76.7%的识别效果,较目前主流算法有了较大的提升.实验结果表明,该方法能够有效地提高行为识别的识别率. 展开更多
关键词 行为识别 稀疏特征 时序分割网络 双流卷积网络 特征融合
下载PDF
基于双流卷积与双中心loss的行为识别研究 被引量:3
5
作者 毛志强 马翠红 +1 位作者 崔金龙 王毅 《微电子学与计算机》 北大核心 2019年第3期96-100,共5页
针对行为视频中相似动作类内差异大、类间差异小,识别准确率不高的问题,提出了一种基于双流卷积网络与双中心loss的行为识别方法.该方法首先构建双流卷积网络结构,以C3Dnet模型作为双流结构的基础模型,分别提取多尺度RGB视频帧中的表观... 针对行为视频中相似动作类内差异大、类间差异小,识别准确率不高的问题,提出了一种基于双流卷积网络与双中心loss的行为识别方法.该方法首先构建双流卷积网络结构,以C3Dnet模型作为双流结构的基础模型,分别提取多尺度RGB视频帧中的表观短时运动信息和堆叠光流图中的长时运动信息;然后将双流结构提取的深度信息经长短时记忆(LSTM)网络解析后进行特征融合;最后,利用基于双中心loss的2C-softmax目标函数,来最大化类间距离和最小化类内距离,从而实现相似动作的分类与识别.在数据集KTH上的实验结果表明,该方法能够准确识别相似动作,识别准确率可达98.2%,具有很好的识别效果. 展开更多
关键词 双流卷积网络 中心loss 长短时记(LSTM) 光流图
下载PDF
基于深度LSTM与双流融合网络的行为识别 被引量:3
6
作者 马翠红 毛志强 +1 位作者 崔金龙 王毅 《计算机工程与设计》 北大核心 2019年第9期2631-2637,共7页
为充分利用视频序列中长时运动特征,提高行为识别准确率,提出一种深度残差长短时记忆(LSTM)双流卷积融合网络结构。以Res-C3D net作为表观短时运动流和长时运动流的基础模型,分别提取表观短时运动信息和长时运动信息,采用乘法交叉流残... 为充分利用视频序列中长时运动特征,提高行为识别准确率,提出一种深度残差长短时记忆(LSTM)双流卷积融合网络结构。以Res-C3D net作为表观短时运动流和长时运动流的基础模型,分别提取表观短时运动信息和长时运动信息,采用乘法交叉流残差单向连接融合两个运动流;以融合特征作为深度残差LSTM模块输入,递归学习长时动态特征;将学习到的深度特征输入到线性SVM中,实现行为分类与识别。在数据集UCF-101和HMDB51上的实验结果表明,该模型能够充分利用视频序列中的长时运动信息,识别准确率分别可达95.1%和74.6%,具有很好的识别效果。 展开更多
关键词 深度残差 双流卷积网络 长短时记忆 长时动态特征 线性SVM
下载PDF
一个快速动态风格传递算法
7
作者 吴凌琛 《福建电脑》 2019年第9期1-5,共5页
与传统风格传递任务不同,动态风格传递是将动态图像序列的周期性变化特征传递到静态目标图像上,生成具有相似变化特征的新动态图像序列。然而利用现有的方法进行动态风格传递需要消耗大量的时间。为了改善此问题,本文提出一种基于双流... 与传统风格传递任务不同,动态风格传递是将动态图像序列的周期性变化特征传递到静态目标图像上,生成具有相似变化特征的新动态图像序列。然而利用现有的方法进行动态风格传递需要消耗大量的时间。为了改善此问题,本文提出一种基于双流卷积网络的快速动态风格传递算法。本文借鉴已有的动态风格传递方法,在双流卷积神经网络的基础上,增加了一个针对特定动态风格预训练的前馈神经网络来快速获得动态风格传递的可行解。实验结果表明,相较于其它同类算法,本文算法在保持同等传递效果的同时提升了传递速度。 展开更多
关键词 风格传递 双流卷积神经网络 快速动态风格传递 前馈神经网络
下载PDF
融合双流三维卷积和注意力机制的动态手势识别 被引量:25
8
作者 王粉花 张强 +1 位作者 黄超 张苒 《电子与信息学报》 EI CSCD 北大核心 2021年第5期1389-1396,共8页
得益于计算机硬件以及计算能力的进步,自然、简单的动态手势识别在人机交互方面备受关注。针对人机交互中对动态手势识别准确率的要求,该文提出一种融合双流3维卷积神经网络(I3D)和注意力机制(CBAM)的动态手势识别方法CBAM-I3D。并且改... 得益于计算机硬件以及计算能力的进步,自然、简单的动态手势识别在人机交互方面备受关注。针对人机交互中对动态手势识别准确率的要求,该文提出一种融合双流3维卷积神经网络(I3D)和注意力机制(CBAM)的动态手势识别方法CBAM-I3D。并且改进了I3D网络模型的相关参数和结构,为了提高模型的收敛速度和稳定性,使用了批量归一化(BN)技术优化网络,使优化后网络的训练时间缩短。同时与多种双流3D卷积方法在开源中国手语数据集(CSL)上进行了实验对比,实验结果表明,该文所提方法能很好地识别动态手势,识别率达到了90.76%,高于其他动态手势识别方法,验证了所提方法的有效性和可行性。 展开更多
关键词 动态手势识别 深度学习 双流3维卷积神经网络 注意力机制 BN层
下载PDF
基于ECA-FV-CNN的水稻单籽粒质量分级方法 被引量:3
9
作者 陈孟燕 王敏娟 +3 位作者 宋青峰 朱新广 李民赞 郑立华 《农业机械学报》 EI CAS CSCD 北大核心 2023年第S02期235-243,共9页
为解决传统水稻质量分级依靠人工分拣,工作量大、错误率高、分级标准不严格等问题,本文提出一种基于ECA改进的双流卷积神经网络模型对水稻单粒质量分级进行研究。首先,获取每组水稻单籽粒(本文以7颗水稻单籽粒为1组)正视和俯视图像,对于... 为解决传统水稻质量分级依靠人工分拣,工作量大、错误率高、分级标准不严格等问题,本文提出一种基于ECA改进的双流卷积神经网络模型对水稻单粒质量分级进行研究。首先,获取每组水稻单籽粒(本文以7颗水稻单籽粒为1组)正视和俯视图像,对于5种简单的监督模型(朴素贝叶斯、决策树、随机森林、最邻近结点算法、支持向量机)、基于遗传算法和投票机制优化的模型(GA-SVM)、集成模型(RF+GA-SVM),通过图像预处理轮廓检测分离出单籽粒图像,利用颜色矩、LBP(Local binary pattern)和Canny算子提取籽粒颜色、纹理和边缘特征,并采用PCA(Principal component analysis)降维后进行训练;而对于单流卷积神经网络模型、双流卷积神经网络模型(FV-CNN)以及本文提出并构建的基于ECA改进的双流卷积神经网络模型(EA-FV-CNN),则使用预处理后的图像进行训练。将上述多种模型进行对比分析,发现基于ECA改进的双流卷积神经网络模型性能最好,其在单粒质量三分级、四分级和五分级准确率分别达94.0%、92.3%和71.0%。实验结果表明,使用基于ECA改进的双流卷积神经网络模型能够提高水稻单粒质量的分级精度,弥补传统方法的不足,规范籽粒筛选分级标准。 展开更多
关键词 水稻 质量分级 机器学习 ECA 双流卷积神经网络
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部