期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
基于时空信息融合的母猪哺乳行为识别 被引量:11
1
作者 甘海明 薛月菊 +3 位作者 李诗梅 杨晓帆 陈畅新 区铭强 《农业机械学报》 EI CAS CSCD 北大核心 2020年第S01期357-363,共7页
及时获取准确的母猪哺乳行为信息对提高猪只集中养殖效益至关重要。本文旨在建立深度学习网络,融合时空信息,实现自动识别母猪哺乳行为。识别过程主要分2个阶段:母猪哺乳区域时空定位和哺乳区域时空信息特征提取、融合及识别。首先将俯... 及时获取准确的母猪哺乳行为信息对提高猪只集中养殖效益至关重要。本文旨在建立深度学习网络,融合时空信息,实现自动识别母猪哺乳行为。识别过程主要分2个阶段:母猪哺乳区域时空定位和哺乳区域时空信息特征提取、融合及识别。首先将俯拍视频图像序列输入Mask RCNN,ResNet101+FPN作为基础网络输出特征图输入区域生成网络,生成母猪检测候选框并分别输入母猪姿态识别分支和关键点检测分支,若母猪姿态被识别为侧卧则利用关键点检测分支输出关键点坐标,确定母猪哺乳区域,实现哺乳行为感兴趣时空区域定位。然后,在感兴趣时空区域中,利用双流卷积网络,进行时间流和空间流特征提取。最后利用串接卷积融合方式,识别序列图像中母猪是否进行哺乳。试验结果显示,用于哺乳区域空间定位的关键点的综合召回率Rk和精准率Pk分别为94.37%和94.53%,母猪哺乳行为识别正确率为97.85%,灵敏度为94.92%,特异度为98.51%。 展开更多
关键词 母猪 哺乳行为 关键点检测 时空信息 双流卷积网络
下载PDF
基于改进双流卷积网络的火灾图像特征提取方法 被引量:7
2
作者 徐登 黄晓东 《计算机科学》 CSCD 北大核心 2019年第11期291-296,共6页
基于图像处理技术的火灾监测,是近年来火灾监控领域的重要分支。对于开阔场景的火灾监测,利用火灾发生时产生的烟雾和火焰的动、静特性,以双流(Two-Stream)卷积神经网络作为理论基础对火灾进行检测识别。双流卷积神经网络采用空间流与... 基于图像处理技术的火灾监测,是近年来火灾监控领域的重要分支。对于开阔场景的火灾监测,利用火灾发生时产生的烟雾和火焰的动、静特性,以双流(Two-Stream)卷积神经网络作为理论基础对火灾进行检测识别。双流卷积神经网络采用空间流与时序流分别提取视频中的空间信息与时序信息,然而火灾初期的信息较为微弱,特征不够明显。为进一步提高初期的识别率,提出一种空间增强网络作为双流卷积神经网络的空间流来提取并增强视频的空间信息。空间增强网络同时对当前帧图片V t和上一帧图片V t-1做卷积,用V t的卷积特征与V t-1的卷积特征做减法,保留卷积特征差异性,再将卷积特征差与当前帧V t的卷积特征相加,从而增强对V t的空间特征卷积;双流卷积网络的时间卷积流对当前帧的光流图片V t′进行时序特征卷积;最后将增强后的空间特征与时序特征融合进行分类。实验结果表明,改进后的双流卷积网络的识别率比原始的双流卷积网络提高了6.2%,且在公开数据集上的测试准确率达到了92.15%,从而证明了该方法的有效性和优越性。此外,与其他方法相比,该网络具有低深度、高识别率的特征,不仅能提高火灾和烟雾的识别率,而且实现了火灾的早期发现,缩短了检测时间。 展开更多
关键词 开阔空间火灾监测 空间特征增强网络 双流卷积神经网络 时空特征融合 光流法
下载PDF
面向视频中人体行为识别的复合型深度神经网络 被引量:6
3
作者 黄敏 尚瑞欣 钱惠敏 《模式识别与人工智能》 EI CSCD 北大核心 2022年第6期562-570,共9页
在视频人体行为识别研究中三维卷积神经网络和双流卷积神经网络均存在不足.针对此种情况,文中提出结合双流网络架构和三维网络架构的复合型深度神经网络.在双流架构的时间流子网络和空间流子网络部分均采用改进的R(2+1)D卷积神经网络,... 在视频人体行为识别研究中三维卷积神经网络和双流卷积神经网络均存在不足.针对此种情况,文中提出结合双流网络架构和三维网络架构的复合型深度神经网络.在双流架构的时间流子网络和空间流子网络部分均采用改进的R(2+1)D卷积神经网络,分别从视频的RGB图像序列和光流图像序列中学习行为表示和分类方法,并融合时间流子网络、空间流子网络的分类结果.进一步地,在网络训练过程中,提出基于梯度中心化算法改进的带动量的随机梯度下降算法,在不改变网络结构的情况下提高网络的泛化性能.实验表明,文中网络在UCF101、HMDB51数据集上均获得较高的识别精度. 展开更多
关键词 人体行为识别 双流卷积网络 三维卷积神经网络 梯度中心化
下载PDF
结合时序动态图和双流卷积网络的人体行为识别 被引量:3
4
作者 张文强 王增强 张良 《激光与光电子学进展》 CSCD 北大核心 2021年第2期96-104,共9页
为了更好地对人体动作的长时时域信息进行建模,提出了一种结合时序动态图和双流卷积网络的人体行为识别算法。首先,利用双向顺序池化算法来构建时序动态图,实现视频从三维空间到二维空间的映射,用来提取动作的表观和长时时序信息;然后... 为了更好地对人体动作的长时时域信息进行建模,提出了一种结合时序动态图和双流卷积网络的人体行为识别算法。首先,利用双向顺序池化算法来构建时序动态图,实现视频从三维空间到二维空间的映射,用来提取动作的表观和长时时序信息;然后提出了基于inceptionV3的双流卷积网络,包含表观及长时运动流和短时运动流,分别以时序动态图和堆叠的光流帧序列作为输入,且结合数据增强、模态预训练、稀疏采样等方式;最后将各支流输出的类别判定分数通过平均池化的方式进行分数融合。在UCF101和HMDB51数据集的实验结果表明:与传统双流卷积网络相比,该方法可以有效利用动作的时空信息,识别率得到较大的提升,具有有效性和鲁棒性。 展开更多
关键词 图像处理 双流卷积网络 人体行为识别 时序动态图 数据增强
原文传递
基于多流3D融合网络的人体行为识别 被引量:1
5
作者 戎炜 张天雨 《智能计算机与应用》 2020年第10期86-91,94,共7页
人体行为识别是当前计算机视觉领域的一个重要研究分支。针对视频人体行为识别任务需要大型数据集预训练以及无法有效利用跨时间信息的问题,本文提出了基于双流卷积网络与膨胀3D卷积网络的深度神经网络模型,并重新设计网络结构,命名为多... 人体行为识别是当前计算机视觉领域的一个重要研究分支。针对视频人体行为识别任务需要大型数据集预训练以及无法有效利用跨时间信息的问题,本文提出了基于双流卷积网络与膨胀3D卷积网络的深度神经网络模型,并重新设计网络结构,命名为多流3D融合网络。首先,利用改进的双流网络与膨胀3D网络提取人物动作特征;其次,利用分段长短期记忆网络提取时间特征;最后,利用残差连接方法融合特征,得到最终的个体识别结果,实现了精确的个体行为识别。在volleyball数据集上的实验结果表明,本文提出的方法优于当前的一些先进方法。 展开更多
关键词 行为识别 膨胀3D卷积网络 双流卷积网络
下载PDF
基于双线性特征融合方法的畸变失真图像质量评价
6
作者 陆绮荣 丁昕 梁雅雯 《中国科技论文》 CAS 北大核心 2023年第3期259-264,291,共7页
针对畸变失真图像影响后续图像信息获取的问题,提出了一种基于双线性特征融合方法的畸变失真图像质量评价算法。首先基于人类视觉对图像结构特征敏感的特点提取结构图像,然后将原始图像和结构图像作为双流卷积网络的输入,将两支路网络... 针对畸变失真图像影响后续图像信息获取的问题,提出了一种基于双线性特征融合方法的畸变失真图像质量评价算法。首先基于人类视觉对图像结构特征敏感的特点提取结构图像,然后将原始图像和结构图像作为双流卷积网络的输入,将两支路网络输出的低层结构特征和高层语义特征通过双线性池化层进行特征融合,最后通过全连接层输出图像质量预测分数。为了验证算法的有效性,在4个公开的图像数据集LIVE、CSIQ、MLIVE与TID2013上进行实验。结果表明,所提算法与当前的失真图像质量评价算法相比,在LIVE、CSIQ和MLIVE数据集上斯皮尔曼等级相关系数(Spearman rank-order correlation coefficient,SROCC)和皮尔逊线性相关系数(Pearson linear correlation coefficient,PLCC)指标至少提升0.2%左右,在TID2013数据集上SROCC值至少提升0.5%左右。所提算法评价结果与人类视觉主观感知有较好的一致性,对多种失真图像质量评价可以取得不错的效果。 展开更多
关键词 畸变失真图像 双流卷积网络 双线性池化 特征融合
下载PDF
基于暗通道及双流卷积网络的监控视频质量评估算法
7
作者 王江 王寒凝 韩哲 《自动化应用》 2023年第18期231-234,共4页
受光照、气象、污损、视频压缩以及网络传输的影响,视频监控的质量可能会大幅降低,给后继的信息获取造成困难。为实现对监控视频质量的精确评估,本文提出了基于暗通道及双流卷积网络的监控视频质量评估算法,首先计算监控视频关键帧的暗... 受光照、气象、污损、视频压缩以及网络传输的影响,视频监控的质量可能会大幅降低,给后继的信息获取造成困难。为实现对监控视频质量的精确评估,本文提出了基于暗通道及双流卷积网络的监控视频质量评估算法,首先计算监控视频关键帧的暗通道图像,然后与原始图像合并,并利用双流卷积网络进行监控视频质量评估。该算法可准确评估监控视频中出现的模糊、块效应、噪声等质量缺陷。 展开更多
关键词 监控视频 质量评估 暗通道图像 双流卷积网络
下载PDF
基于双路时空网络的驾驶员行为识别
8
作者 席治远 唐超 +1 位作者 童安炀 王文剑 《计算机应用》 CSCD 北大核心 2024年第5期1511-1519,共9页
驾驶员危险驾驶行为是恶性交通事故发生的主要原因之一,因此识别驾驶员行为具有工程应用上的重要意义。目前,主流基于视觉的检测方法是对驾驶员行为的局部时空特征进行研究,针对全局空间特征及长时序相关性特征研究较少,这在一定程度上... 驾驶员危险驾驶行为是恶性交通事故发生的主要原因之一,因此识别驾驶员行为具有工程应用上的重要意义。目前,主流基于视觉的检测方法是对驾驶员行为的局部时空特征进行研究,针对全局空间特征及长时序相关性特征研究较少,这在一定程度上无法结合场景上下文信息对危险驾驶行为进行识别。为了解决上述问题,提出一种基于双路时空网络的驾驶员行为识别方法,整合不同时空通路的优点以提高行为特征丰富度。首先,使用一种改进的双流卷积神经网络(TSN)对时空信息进行表征学习,同时降低提取特征的稀疏性;其次,构建一种基于Transformer的串行时空网络补充长时序相关性信息;最后,联合双路时空网络进行融合决策,增强模型的鲁棒性。实验结果表明,所提方法在驾驶员疲劳检测数据集YawDD、驾驶员分心检测数据集SF-DDDD和最新驾驶员行为识别数据集SynDD1这3个公开数据集上分别取得99.85%、99.94%和98.77%的识别准确率,特别是在SynDD1上,与使用动作识别的网络MoviNet-A0相比识别准确率提升了1.64个百分点;消融实验结果也验证了该方法对驾驶员行为有较高的识别精度。 展开更多
关键词 驾驶员行为识别 双路时空网络 双流卷积神经网络 TRANSFORMER
下载PDF
一种基于双流卷积神经网络跌倒识别方法 被引量:13
9
作者 袁智 胡辉 《河南师范大学学报(自然科学版)》 CAS 北大核心 2017年第3期96-101,共6页
针对跌倒行为的视觉特征难以提取的问题,提出一种由两路卷积神经网络和模型融合部分组成的双流卷积神经网络(Two-Stream CNN)的跌倒识别方法.该方法的一路对视频帧的运动人加框标记后,送三维卷积神经网络(3D-CNN)处理来消除视频背景的干... 针对跌倒行为的视觉特征难以提取的问题,提出一种由两路卷积神经网络和模型融合部分组成的双流卷积神经网络(Two-Stream CNN)的跌倒识别方法.该方法的一路对视频帧的运动人加框标记后,送三维卷积神经网络(3D-CNN)处理来消除视频背景的干扰;另一路从相邻视频帧获取光流图后,送VGGNet-16卷积神经网络处理;最后将3D-CNN和VGGNet-16的Softmax输出识别概率加权融合作为Two-Stream CNN输出结果.实验结果表明:标记运动人并经3D-CNN处理有效地消除了视频背景的干扰;Two-Stream CNN跌倒识别率为96%,比3D-CNN提高了4%,比VGGNet-16网络提高了3%. 展开更多
关键词 跌倒识别 双流卷积神经网络 视频帧 光流图
下载PDF
基于多阶信息融合的行为识别方法研究 被引量:9
10
作者 张冰冰 葛疏雨 +1 位作者 王旗龙 李培华 《自动化学报》 EI CAS CSCD 北大核心 2021年第3期609-619,共11页
双流卷积神经网络能够获取视频局部空间和时间特征的一阶统计信息,测试阶段将多个视频局部特征的分类器分数平均作为最终的预测.但是,一阶统计信息不能充分建模空间和时间特征分布,测试阶段也未考虑使用多个视频局部特征之间的更高阶统... 双流卷积神经网络能够获取视频局部空间和时间特征的一阶统计信息,测试阶段将多个视频局部特征的分类器分数平均作为最终的预测.但是,一阶统计信息不能充分建模空间和时间特征分布,测试阶段也未考虑使用多个视频局部特征之间的更高阶统计信息.针对这两个问题,本文提出一种基于二阶聚合的视频多阶信息融合方法.首先,通过建立二阶双流模型得到视频局部特征的二阶统计信息,与一阶统计信息形成多阶信息.其次,将基于多阶信息的视频局部特征分别进行二阶聚合,形成高阶视频全局表达.最后,采用两种策略融合该表达.实验表明,本文方法能够有效提高行为识别精度,在HMDB51和UCF101数据集上的识别准确率比双流卷积神经网络分别提升了8%和2:1%,融合改进的密集点轨迹(Improved dense trajectory,IDT)特征之后,其性能进一步提升. 展开更多
关键词 行为识别 双流卷积神经网络 多阶信息融合 二阶聚合
下载PDF
基于双流图卷积网络的人体行为识别算法 被引量:4
11
作者 王宪伦 王广宇 孙宇轩 《传感器与微系统》 CSCD 北大核心 2023年第7期140-143,147,共5页
针对传统的卷积网络对人体行为识别速度不高或识别精度偏低的问题,提出了基于图卷积网络(GCN)的人体行为识别算法。首先,介绍了时空图卷积网络(ST-GCN)算法,该算法将人体骨架信息归类于图信息,并在时域和空间域上对人体信息进行图卷积运... 针对传统的卷积网络对人体行为识别速度不高或识别精度偏低的问题,提出了基于图卷积网络(GCN)的人体行为识别算法。首先,介绍了时空图卷积网络(ST-GCN)算法,该算法将人体骨架信息归类于图信息,并在时域和空间域上对人体信息进行图卷积运算;其次,使用双流GCN进行模型的搭建,双流GCN是对ST-GCN的一种改进,为某些相距很远但某些动作中关系密切的点创建“不可能连接”,并提出骨骼的长度和方向对人体行为识别也起到重要作用的观点。实验结果表明:对于选取的4个行为的平均识别率达到了92.2%,因此,基于双流GCN算法的人体行为识别方法具有可行性。 展开更多
关键词 图卷积网络 人体行为识别 时空图卷积网络 双流图卷积网络
下载PDF
基于scSE非局部双流ResNet网络的行为识别
12
作者 李占利 王佳莹 +1 位作者 靳红梅 李洪安 《计算机应用与软件》 北大核心 2024年第8期319-325,共7页
针对双流网络对包含冗余信息的视频帧存在识别率低的问题,在双流网络的基础上引入scSE(Spatial and Channel Squeeze&Excitation Block)和非局部操作,构建SC_NLResNet行为识别框架。该框架将视频划分为等分不重叠的时序段并在每段... 针对双流网络对包含冗余信息的视频帧存在识别率低的问题,在双流网络的基础上引入scSE(Spatial and Channel Squeeze&Excitation Block)和非局部操作,构建SC_NLResNet行为识别框架。该框架将视频划分为等分不重叠的时序段并在每段上稀疏采样,提取RGB帧以及光流图作为scSE模块的输入;将经过scSE处理的特征输入非局部双流ResNet网络中,融合各分段得到最终的预测结果。在UCF101以及Hmdb51数据集上实验准确率分别达到96.9%和76.2%,结果表明,非局部操作与scSE模块结合可以增强特征时空上以及通道间的信息提高准确率,验证了SC_NLResNet网络的有效性。 展开更多
关键词 双流卷积神经网络 scSE模块 残差网络 非局部操作 行为识别
下载PDF
基于双流卷积神经网络的智能小车避障算法研究 被引量:2
13
作者 张亚初 刘明 +1 位作者 赵跃进 董立泉 《新技术新工艺》 2017年第12期18-23,共6页
目前,智能小车由于其应用广泛,是研究的热点之一,而基于神经网络与摄像头的智能车由于其在价格以及可靠性等方面的优越性更是受到了广大研究人员的青睐。然而,在端对端的卷积神经网络智能小车避障系统中,有时无论对网络结构和参数进行... 目前,智能小车由于其应用广泛,是研究的热点之一,而基于神经网络与摄像头的智能车由于其在价格以及可靠性等方面的优越性更是受到了广大研究人员的青睐。然而,在端对端的卷积神经网络智能小车避障系统中,有时无论对网络结构和参数进行何种微调,总有一些图像是难以正确分类的,或者说要对某些图像进行正确分类,需要进行相当繁复的参数调整以及结构改变。针对上述问题,考虑采用双流卷积神经网络,利用原始图片与光流图片分别通过预训练的网络后,再将评分结果进行融合,得到最终的分类结果。事实证明,采用该方法可以有效改善传统卷积神经网络一些分类错误的问题。 展开更多
关键词 双流卷积神经网络 避障 图像分类
下载PDF
基于残差融合双流图卷积网络的手势识别方法 被引量:2
14
作者 程换新 成凯 +1 位作者 程力 蒋泽芹 《电子测量技术》 北大核心 2022年第9期20-24,共5页
针对传统图卷积网络易忽略空间特征与时间特征之间关联的问题,设计了一种基于残差结构和图卷积网络相融合的双流网络模型。首先网络包括空间流和时间流两个通道,将手势骨骼数据构建成空间图和时序图作为两通道的输入,通过分离时间维度... 针对传统图卷积网络易忽略空间特征与时间特征之间关联的问题,设计了一种基于残差结构和图卷积网络相融合的双流网络模型。首先网络包括空间流和时间流两个通道,将手势骨骼数据构建成空间图和时序图作为两通道的输入,通过分离时间维度和空间维度极大地提高了训练速度。然后为了增加网络深度,避免梯度消失等问题,嵌入残差结构并对其进行改进,更加有效利用时间特征,保证了特征的多样性。最后将两通道输出的空间点集序列和时间边集序列串联转化,输入Softmax分类器进行分类,得到识别结果。将新提出的方法在CSL和DEVISIGN-L手势数据集上进行实验,结果表明在两个数据集上识别精度分别达到了96.2%和69.3%,证明该方法具有一定的先进性。 展开更多
关键词 手势识别 残差结构 双流图卷积网络
下载PDF
基于自适应融合权重的人体行为识别方法 被引量:1
15
作者 乔迤 曲毅 《计算机工程与设计》 北大核心 2023年第3期845-851,共7页
为解决人体行为识别中关节特征不显著、噪声干扰严重等问题,提出一种基于自适应融合权重的人体行为识别方法。为充分利用长时时序信息,需要对长视频进行时域分割,而后设计基于BN-Inception的双流网络结构,分别以RGB图像和骨骼关节点构... 为解决人体行为识别中关节特征不显著、噪声干扰严重等问题,提出一种基于自适应融合权重的人体行为识别方法。为充分利用长时时序信息,需要对长视频进行时域分割,而后设计基于BN-Inception的双流网络结构,分别以RGB图像和骨骼关节点构成的运动特征向量作为空间流和时间流网络的输入,基于熵值法对各片段内单支流网络融合后,根据关节点显著程度赋予各支流以惩罚值,使双流网络自适应调节权重进行融合,输出行为类别。实验结果表明,该方法在人体行为识别中具有可行性和有效性。 展开更多
关键词 行为识别 双流卷积神经网络 骨骼关节点 运动特征向量 自适应融合 熵值法 时域分割
下载PDF
基于融合逆透射率图的水下图像增强算法
16
作者 张剑钊 郭继昌 汪昱东 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第5期921-929,共9页
针对水下图像质量退化严重的问题,提出一种端到端的基于融合逆透射率图的水下图像增强算法.将原始RGB图像和基于传统方法得到的逆透射率图分别输入到双流卷积神经网络的2个编码器中;通过跨模态特征融合模块使得2种图像信息充分融合互补... 针对水下图像质量退化严重的问题,提出一种端到端的基于融合逆透射率图的水下图像增强算法.将原始RGB图像和基于传统方法得到的逆透射率图分别输入到双流卷积神经网络的2个编码器中;通过跨模态特征融合模块使得2种图像信息充分融合互补,让网络更好地学习到水下光学成像的特点;通过特征增强模块,增强特征的表达能力;通过残差解码模块连接解码器和编码器,以补充和丰富RGB特征.通过逆透射率图的水下图像增强算法以及跨模态跨尺度的信息融合,由粗到细地进行逐级处理,最终输出增强后的RGB图像.实验结果表明,所提算法能够有效地提升水下图像视觉质量.综合主观评价和客观评价,所提算法优于所对比的白平衡WB、直方图均衡化HE、Water-Net、UGAN、UWCNN、Ucolor 6种算法. 展开更多
关键词 逆透射率图 水下图像增强 水下光学成像 双流卷积神经网络 特征融合
下载PDF
基于双谱与双流卷积神经网络的断路器故障诊断 被引量:1
17
作者 林穿 徐启峰 《电子测量技术》 北大核心 2021年第23期165-172,共8页
高压断路器操动机构的振动信号包含了断路器运行状态的重要信息,对操动机构工作状态的诊断辨识十分重要。针对振动信号随机、非平稳的复杂特性,提出了一种基于双谱分析和双通道流浅层卷积神经网络的断路器故障诊断方法。对振动信号进行... 高压断路器操动机构的振动信号包含了断路器运行状态的重要信息,对操动机构工作状态的诊断辨识十分重要。针对振动信号随机、非平稳的复杂特性,提出了一种基于双谱分析和双通道流浅层卷积神经网络的断路器故障诊断方法。对振动信号进行双谱分析和小波分析,分别提取2D双谱矩阵以及1D小波频带能量作为双流卷积神经网络的双通道特征;对断路器模拟实验采集到的5种工况下的振动信号进行有监督训练。结果表明,双谱分析能够抑制高斯噪声、保留操动机构不同工况下主要峰值形态特征并融合小波频带能量特征,所提模型训练迭代5次即可达到98.33%的高识别精度,实现断路器操动机构的故障诊断辨识。 展开更多
关键词 振动信号 双谱分析 双流卷积神经网络 故障诊断 断路器
下载PDF
基于双流卷积神经网络的人体实例分割
18
作者 马子彤 王国栋 《激光与光电子学进展》 CSCD 北大核心 2022年第16期110-116,共7页
人体实例分割是以人为中心的场景理解和识别的核心问题。然而人体实例体型的差异性、人们之间的互动等导致了空间关系的复杂性,给分割任务带来了极大的挑战。目前主流的实例分割方法大都严重依赖物体的边界框检测,因此通常无法很好地将... 人体实例分割是以人为中心的场景理解和识别的核心问题。然而人体实例体型的差异性、人们之间的互动等导致了空间关系的复杂性,给分割任务带来了极大的挑战。目前主流的实例分割方法大都严重依赖物体的边界框检测,因此通常无法很好地将两个高度重合的对象分开。利用已经具有完备数据标注的人体骨骼特征为人体实例分割任务提供先验知识,提出了一种双流的网络结构,用来分别提取骨骼特征和图片上下文特征。接着,特征融合模块(FFB)自适应地融合来自不同流的特征并将其送入分割模块,得到最终的分割结果。实验结果表明,所提算法在COCOPersons、OCHuman数据集上的平均精确度分别为59.5%、56.7%,相比其他算法均有一定的提升。 展开更多
关键词 图像处理 卷积神经网络 双流卷积神经网络 注意力机制
原文传递
面向时空特征融合的GSTIN动作识别网络
19
作者 李克文 张震涛 +1 位作者 李素杰 雷永秀 《计算机应用研究》 CSCD 北大核心 2021年第8期2479-2484,共6页
视频动作识别是计算机视觉领域一个十分具有挑战性的课题,主要任务是利用深度学习等视频智能分析技术识别的深层信息推导出视频人体行为动作。通过结合双流卷积神经网络和三维卷积神经网络的结构特点,提出了一种面向时空特征融合的GSTIN... 视频动作识别是计算机视觉领域一个十分具有挑战性的课题,主要任务是利用深度学习等视频智能分析技术识别的深层信息推导出视频人体行为动作。通过结合双流卷积神经网络和三维卷积神经网络的结构特点,提出了一种面向时空特征融合的GSTIN(GoogLeNet based on spatio-temporal intergration network)。GSTIN中设计了时空特征融合模块InBST(inception blend spatio-temporal feature),提升网络对空间特征与时间特征的利用能力;在时空特征融合模块InBST基础上,构建了适合动作识别的多流网络结构。GSTIN在动作识别数据集UCF101、HMDB51上识别精度分别达到了93.8%和70.6%,这表明GSTIN与其他动作识别网络相比具有较好的识别性能。 展开更多
关键词 深度学习 动作识别 双流卷积神经网络 三维卷积神经网络 时空特征融合
下载PDF
基于视频分段的空时双通道卷积神经网络的行为识别 被引量:8
20
作者 王萍 庞文浩 《计算机应用》 CSCD 北大核心 2019年第7期2081-2086,共6页
针对原始空时双通道卷积神经网络(CNN)模型对长时段复杂视频中行为识别率低的问题,提出了一种基于视频分段的空时双通道卷积神经网络的行为识别方法。首先将视频分成多个等长不重叠的分段,对每个分段随机采样得到代表视频静态特征的帧... 针对原始空时双通道卷积神经网络(CNN)模型对长时段复杂视频中行为识别率低的问题,提出了一种基于视频分段的空时双通道卷积神经网络的行为识别方法。首先将视频分成多个等长不重叠的分段,对每个分段随机采样得到代表视频静态特征的帧图像和代表运动特征的堆叠光流图像;然后将这两种图像分别输入到空域和时域卷积神经网络进行特征提取,再在两个通道分别融合各视频分段特征得到空域和时域的类别预测特征;最后集成双通道的预测特征得到视频行为识别结果。通过实验讨论了多种数据增强方法和迁移学习方案以解决训练样本不足导致的过拟合问题,分析了不同分段数、预训练网络、分段特征融合方案和双通道集成策略对行为识别性能的影响。实验结果显示所提模型在UCF101数据集上的行为识别准确率达到91.80%,比原始的双通道模型提高了3.8个百分点;同时在HMDB51数据集上的行为识别准确率也比原模型提高,达到61.39%,这表明所提模型能够更好地学习和表达长时段复杂视频中人体行为特征。 展开更多
关键词 双通道卷积神经网络 行为识别 视频分段 迁移学习 特征融合
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部