期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
利用卷积块注意力机制识别人体动作的方法 被引量:5
1
作者 高德勇 康自兵 +1 位作者 王松 王阳萍 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2022年第4期144-155,200,共13页
针对动作识别任务中注意力模型在关注图像序列中的感兴趣区域时,更多侧重于通道间的相关性而忽视了特征的空间位置信息,因而缺乏对视频中动态区域的精准辨识能力,提出基于注意力机制和卷积长短时记忆网络的动作识别方法。首先,使用ResNe... 针对动作识别任务中注意力模型在关注图像序列中的感兴趣区域时,更多侧重于通道间的相关性而忽视了特征的空间位置信息,因而缺乏对视频中动态区域的精准辨识能力,提出基于注意力机制和卷积长短时记忆网络的动作识别方法。首先,使用ResNet-50网络获取视频帧的特征表示,并利用卷积块注意力模块,先通过通道注意力分配特征图在不同卷积通道上的资源,再以空间注意力去分析不同特征图中显著元素的空间位置关系。从而实现对卷积特征图权值的优化调整,抑制或降低与动作无关区域带来的影响。同时,考虑到长短时记忆网络(LSTM)在处理时空数据时丢失了图像帧的空间结构信息,而卷积长短时记忆网络(ConvLSTM)借助卷积操作挖掘了图像中的空间相关性,对视频属性的完整性表示做了进一步的补充。因而,使用卷积长短时记忆网络对特征的序列信息进行建模并获得帧级别的预测,最终综合所有帧的预测共同确定视频的类别。在三个公开数据集上的实验结果表明,所提方法能够有效地突出视频中关键性区域,在一定程度上提升了动作识别的准确率。 展开更多
关键词 机器视觉 动作识别 注意力机制 感兴趣区域 卷积长短时记忆网络
下载PDF
基于混合模型的短期园区需水预测
2
作者 梁现斌 刘真 +2 位作者 苑佳 李磊 刘心 《水利水电快报》 2023年第6期64-70,共7页
为进一步提高短期园区需水预测精度,解决因短期园区人工供水误差较大导致的水、电资源浪费问题,提出一种由麻雀搜索算法(SSA)、卷积长短时记忆神经网络(ConvLSTM)、长短时记忆神经网络(LSTM)组合的SSA-ConvLSTM-LSTM混合模型短期园区需... 为进一步提高短期园区需水预测精度,解决因短期园区人工供水误差较大导致的水、电资源浪费问题,提出一种由麻雀搜索算法(SSA)、卷积长短时记忆神经网络(ConvLSTM)、长短时记忆神经网络(LSTM)组合的SSA-ConvLSTM-LSTM混合模型短期园区需水预测方法,并以河北工程大学为例进行了分析。针对园区用水数据在时间维度上具备的多峰值和多周期特征,采用ConvLSTM挖掘数据中的时空特征;为使预测峰值更接近实际峰值,加入LSTM提升预测性能;为优化混合模型的隐层神经元数和卷积核数,采用SSA优化算法实现自动调参。通过预测河北工程大学1 d和3 d需水量进行模型性能验证,并与其他模型进行对比。结果表明:相比向量自回归(VAR)模型、深度神经网络(DNN)模型和LSTM,该需水预测模型具有更高的预测精度。该方法在短期需水预测上表现出良好的适应性和鲁棒性,具有一定应用价值。 展开更多
关键词 需水预测 SSA Convlstm lstm 混合模型 园区
下载PDF
基于注意力时空解耦3D卷积LSTM的视频预测
3
作者 黄金贵 黄一举 《微电子学与计算机》 2022年第9期63-72,共10页
为高效提取视频时空特征以提高视频预测准确性,提出了注意力时空解耦3D卷积LSTM算法.首先,将卷积LSTM内部单元的传统2D卷积运算改为3D卷积,额外提取视频帧间短期空间运动信息;并借助注意力机制自动捕捉视频帧间长期动态信息的相关性.其... 为高效提取视频时空特征以提高视频预测准确性,提出了注意力时空解耦3D卷积LSTM算法.首先,将卷积LSTM内部单元的传统2D卷积运算改为3D卷积,额外提取视频帧间短期空间运动信息;并借助注意力机制自动捕捉视频帧间长期动态信息的相关性.其次,由于卷积LSTM网络中特征信息在所有层的Z型传递方式会导致梯度消失,为此在网络结构中加入层间高速通道优化不同层间LSTM单元视频信息流的传递过程.同时,时间特征和空间特征在网络中会彼此干扰学习冗余功能,造成特征信息的低效获取以及网络预测质量的降低,为此在损失函数中加入时空解耦运算分离时间特征和空间特征的学习.最后,针对训练编码阶段和预测解码阶段的数据输入过程,提出数据输入重采样,在模型训练和预测阶段使用相近相反的数据输入策略减少编码器和解码器的差异.在合成数据集以及人体动作数据库上的实验结果表明,该算法模型在时空特征提取上有更好的性能. 展开更多
关键词 视频预测 卷积lstm 注意力机制 时空解耦 重采样
下载PDF
基于多种小波变换的一维卷积循环神经网络的风电机组轴承故障诊断 被引量:21
4
作者 陈维兴 崔朝臣 +1 位作者 李小菁 赵卉 《计量学报》 CSCD 北大核心 2021年第5期615-622,共8页
为解决在复杂工况下风力发电机组轴承故障诊断虚警率高的问题,提出一种端到端的混合深度学习框架——基于多种小波变换的一维卷积循环神经网络。首先,通过多种小波变换得到多个时-频矩阵,以充分提取信号特征;再通过一种扩展的LSTM,对多... 为解决在复杂工况下风力发电机组轴承故障诊断虚警率高的问题,提出一种端到端的混合深度学习框架——基于多种小波变换的一维卷积循环神经网络。首先,通过多种小波变换得到多个时-频矩阵,以充分提取信号特征;再通过一种扩展的LSTM,对多通道时-频矩阵不同时间步信息进行提取,捕获时-频数据时空特征;最后,通过全局池化层和分类层对故障状态进行分类。实验结果表明:在复杂工况下,多种小波变换的一维卷积循环神经网络对风力发电机组轴承故障识别率能够达到95%以上。 展开更多
关键词 计量学 滚动轴承 风力发电机组 故障诊断 多种小波变换 一维卷积循环神经网络
下载PDF
基于循环卷积神经网络的单目视觉里程计 被引量:14
5
作者 陈宗海 洪洋 +1 位作者 王纪凯 葛振华 《机器人》 EI CSCD 北大核心 2019年第2期147-155,共9页
提出了一种基于卷积长短期记忆(LSTM)网络和卷积神经网络(CNN)的单目视觉里程计方法,命名为LSTMVO(LSTM visual odometry).LSTMVO采用无监督的端到端深度学习框架,对单目相机的6-DoF位姿以及场景深度进行同步估计.整个网络框架包含位姿... 提出了一种基于卷积长短期记忆(LSTM)网络和卷积神经网络(CNN)的单目视觉里程计方法,命名为LSTMVO(LSTM visual odometry).LSTMVO采用无监督的端到端深度学习框架,对单目相机的6-DoF位姿以及场景深度进行同步估计.整个网络框架包含位姿估计网络以及深度估计网络,其中位姿估计网络是以端到端方式实现单目位姿估计的深度循环卷积神经网络(RCNN),由基于卷积神经网络的特征提取和基于循环神经网络(RNN)的时序建模组成,深度估计网络主要基于编码器和解码器架构生成稠密的深度图.同时本文还提出了一种新的损失函数进行网络训练,该损失函数由图像序列之间的时序损失、深度平滑度损失和前后一致性损失组成.基于KITTI数据集的实验结果表明,通过在原始单目RGB图像上进行训练,LSTMVO在位姿估计精度以及深度估计精度方面优于现有的主流单目视觉里程计方法,验证了本文提出的深度学习框架的有效性. 展开更多
关键词 卷积lstm 循环卷积神经网络 单目视觉里程计 无监督学习
原文传递
治安监控视频中暴力行为的识别与检测 被引量:4
6
作者 谭等泰 王炜 王轶群 《中国人民公安大学学报(自然科学版)》 2021年第2期94-100,共7页
为了充分提取治安监控视频中的时空特征和时序特征,并对暴力行为进行准确的识别与检测,提出一种基于三维卷积神经网络(3DCNN)和卷积长短期记忆网络(ConvLSTM)的暴力行为识别算法。首先,采用一种通用视频描述符—3DCNN结构,提取视频的短... 为了充分提取治安监控视频中的时空特征和时序特征,并对暴力行为进行准确的识别与检测,提出一种基于三维卷积神经网络(3DCNN)和卷积长短期记忆网络(ConvLSTM)的暴力行为识别算法。首先,采用一种通用视频描述符—3DCNN结构,提取视频的短时特征,这些特征封装了视频中与目标和场景相关的背景信息,然后,构建ConvLSTM网络对3DCNN提取的短时特征在时间轴上进行建模,进而充分提取视频的高层时序特征。最后,利用Sigmoid函数分类行为动作。为了验证该算法的高效性,对所提出的方法在暴力行为数据集Hockey上进行验证,达到了98.96%的识别精度。测试结果表明,该融合模型在检测效果上优于目前人工提取特征的方法和深度学习的方法。 展开更多
关键词 暴力行为检测 暴力行为识别 三维卷积神经网络 卷积长短期记忆网络
下载PDF
基于LSTM-SAFCN模型的生物质锅炉NO_(x)排放浓度预测
7
作者 何德峰 刘明裕 +2 位作者 孙芷菲 王秀丽 李廉明 《高技术通讯》 CAS 北大核心 2024年第1期92-100,共9页
针对生物质锅炉燃烧过程的动态特性,提出一种改进的长短期记忆-自注意力机制全卷积神经网络(LSTM-SAFCN)模型用于预测NO_(x)排放浓度。首先利用完全自适应噪声集合经验模态分解法(CEEMDAN)对数据进行预处理,消除数据噪声对NO_(x)排放浓... 针对生物质锅炉燃烧过程的动态特性,提出一种改进的长短期记忆-自注意力机制全卷积神经网络(LSTM-SAFCN)模型用于预测NO_(x)排放浓度。首先利用完全自适应噪声集合经验模态分解法(CEEMDAN)对数据进行预处理,消除数据噪声对NO_(x)排放浓度预测的影响;其次融合自注意力机制与长短时记忆-全卷积神经网络(LSTM-FCN)进行特征提取与预测建模,该拓展方法能够同时兼顾时间序列数据的局部细节与长期趋势特征;最后,利用生物质热电联产系统的实际运行数据验证了所提算法的有效性。 展开更多
关键词 生物质锅炉 NO_(x)排放浓度预测 经验模态分解 长短时记忆-全卷积神经网络(lstm-FCN) 自注意力机制
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部