期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于深度卷积长短时神经网络的视频帧预测 被引量:7
1
作者 张德正 翁理国 +1 位作者 夏旻 曹辉 《计算机应用》 CSCD 北大核心 2019年第6期1657-1662,共6页
针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学... 针对视频帧预测中难以准确预测空间结构信息细节的问题,通过对卷积长短时记忆(LSTM)神经网络的改进,提出了一种深度卷积长短时神经网络的方法。首先,将输入序列图像输入到两个不同通道的深度卷积LSTM网络组成的编码网络中,由编码网络学习输入序列图像的位置信息变化特征和空间结构信息变化特征;然后,将学习到的变化特征输入到与编码网络通道数对应的解码网络中,由解码网络输出预测的下一张图;最后,将这张图输入回解码网络中,预测接下来的一张图,循环预先设定的次后输出全部的预测图。与卷积LSTM神经网络相比,在Moving-MNIST数据集上的实验中,相同训练步数下所提方法不仅保留了位置信息预测准确的特点,而且空间结构信息细节表征能力更强。同时,将卷积门控循环单元(GRU)神经网络的卷积层加深后,该方法在空间结构信息细节表征上也取得了提升,检验了该方法思想的通用性。 展开更多
关键词 视频预测 卷积神经网络 长短时记忆神经网络 编码预测 卷积门控循环单元
下载PDF
基于深度值前向投影的视频帧插值模型
2
作者 陈祖儿 郑明魁 +1 位作者 张承琰 易天儒 《信息技术与信息化》 2024年第4期5-8,共4页
视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对... 视频帧插值技术应用广泛,其目的是在给定两个连续的视频帧条件下,生成中间帧。针对向投影过程中经常出现的多个像素投影到同一个位置的像素重叠问题,提出了一种基于深度值前向投影的视频帧插值模型。根据提出的深度估计模块的深度值对前向投影过程进行线性加权,并具有深度平移不变性,对重叠像素区域的前景物体边界和背景像素的像素重建有一定的效果提升。实验结果表明,所提出的算法在公开的视频帧内插数据集Vimeo-90k上测试结果良好,与其他算法相比,在PSNR、SSIM和LPIPS性能评价指标上均能达到较为优秀的性能指标,验证了算法的优越性。 展开更多
关键词 视频插值 视频预测 前向投影 深度估计 图像合成
下载PDF
基于门控时空注意力的视频帧预测模型
3
作者 李卫军 张新勇 +2 位作者 高庾潇 顾建来 刘锦彤 《郑州大学学报(工学版)》 北大核心 2024年第1期70-77,121,共9页
针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采... 针对循环式视频帧预测架构存在精度低、训练缓慢,以及结构复杂和误差累积等问题,提出了一种基于门控时空注意力的视频帧预测模型。首先,通过空间编码器提取视频帧序列的高级语义信息,同时保留背景特征;其次,建立门控时空注意力机制,采用多尺度深度条形卷积和通道注意力来学习帧内及帧间的时空特征,并利用门控融合机制平衡时空注意力的特征学习能力;最后,由空间解码器将高级特征解码为预测的真实图像,并补充背景语义以完善细节。在Moving MNIST、TaxiBJ、WeatherBench、KITTI数据集上的实验结果显示,同多进多出模型SimVP相比,MSE分别降低了14.7%、6.7%、10.5%、18.5%,在消融扩展实验中,所提模型达到了较好的综合性能,具有预测精度高、计算量低和推理效率高等优势。 展开更多
关键词 视频预测 卷积神经网络 注意力机制 门控卷积 编解码网络
下载PDF
动态卷积生成对抗网络的视频帧预测方法研究 被引量:2
4
作者 安利智 何平 +2 位作者 张薇 石钰阳 田宇 《小型微型计算机系统》 CSCD 北大核心 2022年第2期278-284,共7页
针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征... 针对当前视频帧预测模型中存在的预测准确度较差和物体结构信息丢失等问题,提出了一种动态卷积生成对抗网络.在生成网络中,首先使用卷积长短时记忆网络初步提取输入视频流的图像特征,然后利用卷积神经动态平流单元对视频流中的运动特征进行提取,最后将上述两种特征组合后输出一组预测视频帧;在判别网络中,采用一个3D卷积网络一次性接收全部视频帧.在实验中,使用Adam方法优化模型的参数,采用KTH和BAIR Robot Pushing数据集作为训练数据集.实验结果表明:无论是在长时间视频帧预测准确度和物体结构信息保留方面,还是人眼的主观感受上,动态卷积生成对抗网络均优于变分生成对抗网络,其在结构相似性度量指标下提高了14.5%,在学习感知图像块相似性指标下提高了7.69%,并且生成的预测视频更加流畅,具有更高的实用价值. 展开更多
关键词 视频预测 卷积动态神经平流单元 生成对抗网络 变分生成对抗网络
下载PDF
生成式对抗网络研究综述 被引量:1
5
作者 张倩宇 宋彩芳 《电子技术与软件工程》 2019年第4期13-14,共2页
近年来,随着生成式对抗网络的迅速发展,尤其图像处理领域表现突出,本文主要介绍了生成对抗网络的基本模型和衍生模型,以及在图像处理领域的应用,包括图像风格迁移、人机交互领域、视频帧预测,文本与图像的相互生成等应用。
关键词 生成式对抗网络 图像风格迁移 人机交互领域 视频预测 文本与图像相互生成
下载PDF
视频帧预测算法探究
6
作者 刘志超 《电脑知识与技术》 2021年第10期249-251,265,共4页
视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来... 视频预测一直以来都是计算机视觉领域的热点问题,由于其广泛的实用价值和理论价值,引起了研究人员的广泛关注。该文对主流的视频帧预测算法进行了研究,首先介绍了视频预测领域的常见问题,并由基本架构对视频预测算法进行了分类,接下来介绍了该领域常用的数据集并给予评价,最后从视频预测算法的运行流程和最新的论文角度上,总结该领域算法的发展方向。 展开更多
关键词 视频预测 长短时记忆网络 自编码器 生成对抗网络 注意力机制 强化学习
下载PDF
应用残差生成对抗网络的路况视频帧预测模型 被引量:4
7
作者 袁帅 秦贵和 晏婕 《西安交通大学学报》 EI CAS CSCD 北大核心 2018年第10期146-152,166,共8页
在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧... 在路况视频帧的预测领域中,针对当前大部分模型所存在的预测图像分辨率低、图像模糊和局部细节缺失等问题,提出了一种应用残差生成对抗网络的路况视频帧预测模型(RB-GAN)。该模型用于在给定一段路况视频流的情况下更好地预测未来的一帧路况图像,应用多个级联的残差模块初步提取输入视频流的图像特征;利用感知网络强化对视频流中物体运动特征的提取;通过使用双重判别器提高生成对抗网络生成的图像的质量;用Adam方法来优化网络权值的深度学习过程。基于生成对抗网络这种半监督的学习框架,训练后的模型可以预测出一段路况视频流下一时刻的同输入视频流具有时空一致性的帧图像。应用车辆检测领域常用的KITTI数据集对生成对抗网络模型进行训练和测试,实验结果表明:与主要依赖于像素均值的方法相比,RB-GAN模型预测图像的分辨率提高了2~4倍,达到256像素×512像素,在图像锐度标准上提高了1~2个数量级,同时图像也更加符合人眼视觉的主观感受,所预测得到的路况视频帧图像质量更高,更具有实用性价值,可以更好地为诸如检测算法等其他下游算法提供有效的特征信息。 展开更多
关键词 生成对抗网络 深度学习 自动驾驶 路况视频预测
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部