期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于深度卷积长短时神经网络的视频帧预测
被引量:
7
1
作者
张德正
翁理国
+1 位作者
夏旻
曹辉
《计算机应用》
CSCD
北大核心
2019年第6期1657-1662,共6页
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学...
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。
展开更多
关键词
视频
帧
预测
卷积神经网络
长短时记忆神经网络
编码
预测
卷积门控循环单元
下载PDF
职称材料
基于深度值前向投影的视频帧插值模型
2
作者
陈祖儿
郑明魁
+1 位作者
张承琰
易天儒
《信息技术与信息化》
2024年第4期5-8,共4页
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对...
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对前向投影过程进行线性加权,并具有深度平移不变性,对重叠像素区域的前景物体边界和背景像素的像素重建有一定的效果提升。实验结果表明,所提出的算法在公开的视频帧内插数据集Vimeo-90k上测试结果良好,与其他算法相比,在PSNR、SSIM和LPIPS性能评价指标上均能达到较为优秀的性能指标,验证了算法的优越性。
展开更多
关键词
视频
帧
插值
视频
帧
预测
前向投影
深度估计
图像合成
下载PDF
职称材料
基于门控时空注意力的视频帧预测模型
3
作者
李卫军
张新勇
+2 位作者
高庾潇
顾建来
刘锦彤
《郑州大学学报(工学版)》
北大核心
2024年第1期70-77,121,共9页
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采...
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采用多尺度深度条形卷积和通道注意力来学习帧内及帧间的时空特征,并利用门控融合机制平衡时空注意力的特征学习能力;最后,由空间解码器将高级特征解码为预测的真实图像,并补充背景语义以完善细节。在Moving MNIST、TaxiBJ、WeatherBench、KITTI数据集上的实验结果显示,同多进多出模型SimVP相比,MSE分别降低了14.7%、6.7%、10.5%、18.5%,在消融扩展实验中,所提模型达到了较好的综合性能,具有预测精度高、计算量低和推理效率高等优势。
展开更多
关键词
视频
帧
预测
卷积神经网络
注意力机制
门控卷积
编解码网络
下载PDF
职称材料
动态卷积生成对抗网络的视频帧预测方法研究
被引量:
2
4
作者
安利智
何平
+2 位作者
张薇
石钰阳
田宇
《小型微型计算机系统》
CSCD
北大核心
2022年第2期278-284,共7页
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征...
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值.
展开更多
关键词
视频
帧
预测
卷积动态神经平流单元
生成对抗网络
变分生成对抗网络
下载PDF
职称材料
生成式对抗网络研究综述
被引量:
1
5
作者
张倩宇
宋彩芳
《电子技术与软件工程》
2019年第4期13-14,共2页
近年来,随着生成式对抗网络的迅速发展,尤其图像处理领域表现突出,本文主要介绍了生成对抗网络的基本模型和衍生模型,以及在图像处理领域的应用,包括图像风格迁移、人机交互领域、视频帧预测,文本与图像的相互生成等应用。
关键词
生成式对抗网络
图像风格迁移
人机交互领域
视频
帧
预测
文本与图像相互生成
下载PDF
职称材料
视频帧预测算法探究
6
作者
刘志超
《电脑知识与技术》
2021年第10期249-251,265,共4页
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来...
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来介绍了该领域常用的数据集并给予评价,最后从视频预测算法的运行流程和最新的论文角度上,总结该领域算法的发展方向。
展开更多
关键词
视频
帧
预测
长短时记忆网络
自编码器
生成对抗网络
注意力机制
强化学习
下载PDF
职称材料
应用残差生成对抗网络的路况视频帧预测模型
被引量:
4
7
作者
袁帅
秦贵和
晏婕
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018年第10期146-152,166,共8页
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧...
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧路况图像,应用多个级联的残差模块初步提取输入视频流的图像特征;利用感知网络强化对视频流中物体运动特征的提取;通过使用双重判别器提高生成对抗网络生成的图像的质量;用Adam方法来优化网络权值的深度学习过程。基于生成对抗网络这种半监督的学习框架,训练后的模型可以预测出一段路况视频流下一时刻的同输入视频流具有时空一致性的帧图像。应用车辆检测领域常用的KITTI数据集对生成对抗网络模型进行训练和测试,实验结果表明:与主要依赖于像素均值的方法相比,RB-GAN模型预测图像的分辨率提高了2~4倍,达到256像素×512像素,在图像锐度标准上提高了1~2个数量级,同时图像也更加符合人眼视觉的主观感受,所预测得到的路况视频帧图像质量更高,更具有实用性价值,可以更好地为诸如检测算法等其他下游算法提供有效的特征信息。
展开更多
关键词
生成对抗网络
深度学习
自动驾驶
路况
视频
帧
预测
下载PDF
职称材料
题名
基于深度卷积长短时神经网络的视频帧预测
被引量:
7
1
作者
张德正
翁理国
夏旻
曹辉
机构
江苏省大气环境与装备技术协同创新中心(南京信息工程大学)
出处
《计算机应用》
CSCD
北大核心
2019年第6期1657-1662,共6页
基金
国家自然科学基金资助项目(61503192,61773219)
江苏省自然科学基金资助项目(BK20161533)
江苏省青蓝工程~~
文摘
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。
关键词
视频
帧
预测
卷积神经网络
长短时记忆神经网络
编码
预测
卷积门控循环单元
Keywords
video frame prediction
Convolutional Neural Network(CNN)
Long and Short-Term Memory(LSTM) neural network
encoding prediction
convolutional Gated Recurrent Unit(GRU)
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于深度值前向投影的视频帧插值模型
2
作者
陈祖儿
郑明魁
张承琰
易天儒
机构
福州大学
出处
《信息技术与信息化》
2024年第4期5-8,共4页
基金
国家自然科学基金项目(61902071)
福建省自然科学基金计划资助项目(2020J01466)
2020年福建省高等学校科技创新团队(产业化专项)。
文摘
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对前向投影过程进行线性加权,并具有深度平移不变性,对重叠像素区域的前景物体边界和背景像素的像素重建有一定的效果提升。实验结果表明,所提出的算法在公开的视频帧内插数据集Vimeo-90k上测试结果良好,与其他算法相比,在PSNR、SSIM和LPIPS性能评价指标上均能达到较为优秀的性能指标,验证了算法的优越性。
关键词
视频
帧
插值
视频
帧
预测
前向投影
深度估计
图像合成
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于门控时空注意力的视频帧预测模型
3
作者
李卫军
张新勇
高庾潇
顾建来
刘锦彤
机构
北方民族大学计算机科学与工程学院
北方民族大学图像图形智能处理国家民委重点实验室
出处
《郑州大学学报(工学版)》
北大核心
2024年第1期70-77,121,共9页
基金
中央高校基本科研业务费专项资金(2021JCYJ12)
国家自然科学基金资助项目(61962001)
+1 种基金
宁夏自然科学基金资助项目(2021AAC03215)
北方民族大学研究生创新项目(YCX23147)。
文摘
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采用多尺度深度条形卷积和通道注意力来学习帧内及帧间的时空特征,并利用门控融合机制平衡时空注意力的特征学习能力;最后,由空间解码器将高级特征解码为预测的真实图像,并补充背景语义以完善细节。在Moving MNIST、TaxiBJ、WeatherBench、KITTI数据集上的实验结果显示,同多进多出模型SimVP相比,MSE分别降低了14.7%、6.7%、10.5%、18.5%,在消融扩展实验中,所提模型达到了较好的综合性能,具有预测精度高、计算量低和推理效率高等优势。
关键词
视频
帧
预测
卷积神经网络
注意力机制
门控卷积
编解码网络
Keywords
video frame prediction
convolutional neural network
attention mechanism
gated convolution
codec network
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
TP183 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
动态卷积生成对抗网络的视频帧预测方法研究
被引量:
2
4
作者
安利智
何平
张薇
石钰阳
田宇
机构
河北工业大学人工智能与数据科学学院
河北工业大学电子信息工程学院
出处
《小型微型计算机系统》
CSCD
北大核心
2022年第2期278-284,共7页
基金
国家自然科学基金青年基金项目(NSFC61704046)资助
河北省自然科学基金项目(A2019202190)资助
河北省自然科学基金项目(F2020202067)资助。
文摘
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值.
关键词
视频
帧
预测
卷积动态神经平流单元
生成对抗网络
变分生成对抗网络
Keywords
future frame prediction
convolutional dynamic neural advection
generative adversarial networks
VAE-GAN
分类号
TP183 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
生成式对抗网络研究综述
被引量:
1
5
作者
张倩宇
宋彩芳
机构
山西师范大学数学与计算机科学学院
出处
《电子技术与软件工程》
2019年第4期13-14,共2页
文摘
近年来,随着生成式对抗网络的迅速发展,尤其图像处理领域表现突出,本文主要介绍了生成对抗网络的基本模型和衍生模型,以及在图像处理领域的应用,包括图像风格迁移、人机交互领域、视频帧预测,文本与图像的相互生成等应用。
关键词
生成式对抗网络
图像风格迁移
人机交互领域
视频
帧
预测
文本与图像相互生成
分类号
TP391.41 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
视频帧预测算法探究
6
作者
刘志超
机构
湖北大学计算机与信息工程学院
出处
《电脑知识与技术》
2021年第10期249-251,265,共4页
文摘
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来介绍了该领域常用的数据集并给予评价,最后从视频预测算法的运行流程和最新的论文角度上,总结该领域算法的发展方向。
关键词
视频
帧
预测
长短时记忆网络
自编码器
生成对抗网络
注意力机制
强化学习
Keywords
video prediction
long short-term memory network
autoencoder
generative adversarial net
attention mechanism
rein⁃forcement learning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
应用残差生成对抗网络的路况视频帧预测模型
被引量:
4
7
作者
袁帅
秦贵和
晏婕
机构
吉林大学计算机科学与技术学院
出处
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018年第10期146-152,166,共8页
基金
吉林省重点科技攻关资助项目(20150204034GX)
文摘
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧路况图像,应用多个级联的残差模块初步提取输入视频流的图像特征;利用感知网络强化对视频流中物体运动特征的提取;通过使用双重判别器提高生成对抗网络生成的图像的质量;用Adam方法来优化网络权值的深度学习过程。基于生成对抗网络这种半监督的学习框架,训练后的模型可以预测出一段路况视频流下一时刻的同输入视频流具有时空一致性的帧图像。应用车辆检测领域常用的KITTI数据集对生成对抗网络模型进行训练和测试,实验结果表明:与主要依赖于像素均值的方法相比,RB-GAN模型预测图像的分辨率提高了2~4倍,达到256像素×512像素,在图像锐度标准上提高了1~2个数量级,同时图像也更加符合人眼视觉的主观感受,所预测得到的路况视频帧图像质量更高,更具有实用性价值,可以更好地为诸如检测算法等其他下游算法提供有效的特征信息。
关键词
生成对抗网络
深度学习
自动驾驶
路况
视频
帧
预测
Keywords
generative adversarial networks
deep learning
auto driving
road condition frames prediction
分类号
TP38 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于深度卷积长短时神经网络的视频帧预测
张德正
翁理国
夏旻
曹辉
《计算机应用》
CSCD
北大核心
2019
7
下载PDF
职称材料
2
基于深度值前向投影的视频帧插值模型
陈祖儿
郑明魁
张承琰
易天儒
《信息技术与信息化》
2024
0
下载PDF
职称材料
3
基于门控时空注意力的视频帧预测模型
李卫军
张新勇
高庾潇
顾建来
刘锦彤
《郑州大学学报(工学版)》
北大核心
2024
0
下载PDF
职称材料
4
动态卷积生成对抗网络的视频帧预测方法研究
安利智
何平
张薇
石钰阳
田宇
《小型微型计算机系统》
CSCD
北大核心
2022
2
下载PDF
职称材料
5
生成式对抗网络研究综述
张倩宇
宋彩芳
《电子技术与软件工程》
2019
1
下载PDF
职称材料
6
视频帧预测算法探究
刘志超
《电脑知识与技术》
2021
0
下载PDF
职称材料
7
应用残差生成对抗网络的路况视频帧预测模型
袁帅
秦贵和
晏婕
《西安交通大学学报》
EI
CAS
CSCD
北大核心
2018
4
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部