一种多尺度光流预测与融合的实时视频插帧方法被引量：5

Real-time Video Frame Interpolation Based on Multi-scale Optical Prediction and Fusion

下载PDF

导出

摘要普通摄像设备拍摄的视频帧速率有限,从而影响观众的特殊观感体验,提高视频帧速率的后处理过程是必不可少的,视频插帧就是其中关键技术之一.视频插帧是指根据两个连续视频帧合成中间帧数据,在影视作品、体育比赛精彩视频片段慢动作回放等方面有广泛的应用.基于光流的视频插帧方法能有效解决视频中场景、目标的移动估计问题,但是其受制于光流估计的速度,无法很好地应用于实时视频任务.本文提出一种新的光流预测模型,并将其用于视频插帧任务中.首先对于输入的两张连续视频帧数据进行多次信息无损的下采样,获得不同尺度的输入数据;之后通过卷积神经网络进行特征提取,并对提取的特征建立注意力掩码,增强特征表达能力,根据该特征生成对应尺度的光流;最后使用融合网络,将多尺度的光流信息聚合为统一的尺度作为最终输出.本文方法能够被端到端的优化训练,并在大规模视频插帧基准数据集上进行了训练和验证测试.结果表明该方法能够获得高质量的插帧效果并能够达到实时的插帧速率,而且比其它先进方法更具优越性. Due to the limited video frame rate,the common cameras often provide low QoE for special video play. It is necessary to do video post-processing,in which video frame interpolation is a key technology. Video frame interpolation refers to the synthesis of intermediate frame from two consecutive video frames,and it has many applications such as low-motion play of film and television shot,sports video highlight. The optical flow-based video interpolation methods can effectively solve the movement estimation of scene and target in video,but it is limited by the speed of optical flow estimation and cannot be well applied to real-time video tasks. This paper proposes a novel optical flow prediction model used in the video interpolation task. Firstly,it performs an information lossless downsampling with multiple scales for the two consecutive video frames to obtain the input data for the optical flow prediction network.Then it performs feature extraction by a convolutional neural network and produces attention masks to enhance the features,and generate optical flow at different scales according to the features. Finally,fusion network is used to aggregate the multi-scale optical flows into a unified scale as the final output. The proposed method can be optimized by end-to-end training,and is conducted training and validation on a large-scale video interpolation benchmark dataset. The results show that the method is able to obtain high quality interpolation results and achieve real-time interpolation rates. In addition,the proposed method outperforms other state-of-the-art methods.

作者马境远王川铭 MA Jing-yuan;WANG Chuan-ming(BUPT Sensing Technology Research Institute(Jiangsu)Co.,LTD,Wuxi 214115,China;Beijing Key Lab of Intelligent Telecommunication Software and Multimedia,Beijing University of Posts and Telecomm,Beijing 100876,China)

机构地区北邮感知技术研究院(江苏)有限公司北京邮电大学智能通信软件与多媒体北京市实验室

出处《小型微型计算机系统》 CSCD 北大核心 2021年第12期2567-2571,共5页 Journal of Chinese Computer Systems

基金国家自然科学基金项目(61872047)资助北邮-传音“视觉感知与计算”联合实验室项目资助。

关键词视频插帧光流估计端到端训练特征融合注意力机制 video frame interpolation optical flow estimation end-to-end training feature fusion attention mechanism

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

同被引文献55

1梁恩泽,李宏刚,杜双.复杂机场全景视频拼缝优化方法研究[J].电视技术,2021,45(9):119-123. 被引量：3
2李翠芳,聂生东.基于模糊数学的医学图像处理与分析方法[J].中国医学物理学杂志,2011,28(4):2750-2753. 被引量：5
3李航,路羊,崔慧娟,唐昆.基于频域的结构相似度的图像质量评价方法[J].清华大学学报（自然科学版）,2009(4):559-562. 被引量：36
4朱梦宇,杨裕亮,贾晓岚.基于小波变换和模糊数学的图像融合算法研究[J].系统仿真学报,2008,20(S1):375-377. 被引量：2
5ZHANG Deng-yin,WU Yuan-yuan,WAN Ming-xiang.Improved side information generation algorithm for Wyner-Ziv video coding[J].The Journal of China Universities of Posts and Telecommunications,2014,21(1):109-115. 被引量：3
6杨雪松,蔡碧野,张建明,李峰.基于HSV颜色特征和轮廓面积的救生衣检测算法[J].计算机工程与应用,2016,52(3):184-188. 被引量：9
7郑伯伟,杨春玲,刘璇.Wyner-Ziv视频编码中外推内插混合边信息生成算法[J].计算机工程,2016,42(10):289-295. 被引量：2
8王艳营,冯进玫,张洪全.基于混合运动模型的边信息生成算法[J].计算机工程与设计,2016,37(10):2764-2768. 被引量：2
9党红恩.藏文字形轮廓特征优化识别提取仿真研究[J].计算机仿真,2016,33(11):341-344. 被引量：6
10福禄克红外热像仪“让你看见温度”[J].设备管理与维修,2017(2):8-8. 被引量：1

引证文献5

1蔺毓敏,周俊伟.基于深度学习的光流插帧边信息生成算法[J].计算机应用研究,2022,39(6):1901-1904.
2张大禹,吴诗帆.基于互信息熵的全景视频关键帧数据实时提取系统设计[J].计算机测量与控制,2023,31(1):252-256. 被引量：1
3阮旺,郝国生,王霞,胡晓婷,杨子豪.面向目标识别的特征融合模糊模型及其应用[J].计算机科学,2023,50(S01):495-501.
4黄晨.基于多尺度卷积网络的视频压缩算法设计[J].信息技术,2023,47(10):56-60.
5李文波,王玉,王明泉,商奥雪,丰晓钰.瞬态场景下基于光流法的红外视频插帧算法研究[J].机械与电子,2024,42(4):15-21.

二级引证文献1

1冒鸿宇,孙刘杰,张明西,周飞,刘洲,胡高斌.基于三帧间差分的电厂监控异常检测方法[J].软件工程与应用,2023,12(5):663-675.

1付佳.光流法在集卡防吊起上的应用[J].港口科技,2021(6):39-43.
2龚捷,罗聪,罗琴.基于注意力机制和残差网络的动作识别模型[J].电子测量技术,2021,44(14):111-116. 被引量：7
3方骞,张战成.通道关注的轻量级光流网络[J].信息技术与信息化,2021(10):194-197.
4宁斯佳.视频监控系统在船舶上的运用分析[J].数字通信世界,2021(12):47-48. 被引量：3
5周杰.探究事业单位绩效工资改革的难点与对策[J].商业2.0（经济管理）,2022(1):0139-0141.
6白华.2021企业服务、科技互联网案例TOP100[J].互联网周刊,2022(2):30-46. 被引量：1
7李娜,樊宽刚,刘亚辉,欧阳清华.基于ASRPCA和五帧差分融合的无人机检测研究[J].激光与光电子学进展,2021,58(20):407-415. 被引量：1
8李定明,张永申,刘联伟,张丽华,李辉波.吸收光谱法直接测定乏燃料溶解液及1AF料液中Pu(Ⅵ)的含量[J].核化学与放射化学,2021,43(6):509-516. 被引量：2
9孙维亚,陈恺鑫,吴铭,王丹,杜立轩,马占宇.融合运动特征的高效视频火焰检测算法[J].数据采集与处理,2021,36(6):1276-1285. 被引量：2
10袁春兴,李冈,苏东初.反低慢小无人机系统发展现状[J].电子世界,2021(23):138-140. 被引量：4

小型微型计算机系统

2021年第12期

浏览历史

内容加载中请稍等...

一种多尺度光流预测与融合的实时视频插帧方法被引量：5

同被引文献55

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种多尺度光流预测与融合的实时视频插帧方法 被引量：5

同被引文献55

引证文献5

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

一种多尺度光流预测与融合的实时视频插帧方法被引量：5