反馈学习高斯表观网络的视频目标分割被引量：1

Feedback Learning Gaussian Appearance Network for Video Object Segmentation

下载PDF

导出

摘要大量基于深度学习的视频目标分割方法存在两方面局限性:1)单帧编码特征直接输入网络解码器,未能充分利用多帧特征,导致解码器输出的目标表观特征难以自适应复杂场景变化;2)常采用前馈网络结构,阻止了后层特征反馈前层进行补充学习,导致学习到的表观特征判别力受限.为此,本文提出了反馈高斯表观网络,通过建立在线高斯模型并反馈后层特征到前层来充分利用多帧、多尺度特征,学习鲁棒的视频目标分割表观模型.网络结构包括引导、查询与分割三个分支.其中,引导与查询分支通过共享权重来提取引导与查询帧的特征,而分割分支则由多尺度高斯表观特征提取模块与反馈多核融合模块构成.前一个模块通过建立在线高斯模型融合多帧、多尺度特征来增强对外观的表征力,后一个模块则通过引入反馈机制进一步增强模型的判别力.最后,本文在三个标准数据集上进行了大量评测,充分证明了本方法的优越性能. There are two limitations in existing deep learning based video object segmentation methods:1)the single frame encoding features are directly input into the network decoder,which fails to make full use of the multiframe features,resulting in the difficulty in adapting complex scene changes of the target appearance features of the decoded output;2)the feedforward network structure is adopted to prevent the feature feedback of the latter layer from the former layer for complementary learning.Therefore,this paper proposes a feedback Gaussian appearance network.By building an online Gaussian model and feedback the features of the back layer to the front layer,we can make full use of the multi-frame and multi-scale features to learn a robust video object segmentation model.Network structure includes three branches:guidance,query and segmentation branches.The guidance and the query branches extract the features of the guidance frame and the query frame by sharing the weights of the network,while the segmentation branch is composed of the multi-scale Gaussian appearance feature extraction module and the feedback multi-kernel fusion module.The former module enhances the representation of the appearance by building an online Gaussian model to fuse the multi-frame and multi-scale features,and the second module further enhances the discriminative capability of the model by introducing a feedback mechanism.Finally,experiments are carried out on three benchmark datasets,which fully proves the superiority of this method.

作者王龙宋慧慧张开华刘青山 WANG Long;SONG Hui-Hui;ZHANG Kai-Hua;LIU Qing-Shan(Collaborative Innovation Center on Atmospheric Environment and Equipment Technology,Jiangsu Key Laboratory of Big Data Analysis Technology,Nanjing University of Information Science and Technology,Nanjing 210044)

机构地区南京信息工程大学

出处《自动化学报》 EI CAS CSCD 北大核心 2022年第3期834-842,共9页 Acta Automatica Sinica

基金国家新一代人工智能重大项目(2018AAA0100400) 国家自然科学基金(61872189,61876088,61532009) 江苏省自然科学基金(BK20191397,BK20170040)资助。

关键词视频目标分割表观建模反馈机制深度学习 Video object segmentation appearance model feedback mechanism deep learning

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP18 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献3

1薄一航,HAO Jiang.视频中旋转与尺度不变的人体分割方法[J].自动化学报,2017,43(10):1799-1809. 被引量：4
2褚一平,张引,叶修梓,张三元.基于隐条件随机场的自适应视频分割算法[J].自动化学报,2007,33(12):1252-1258. 被引量：11
3钱银中,沈一帆.姿态特征与深度特征在图像动作识别中的混合应用[J].自动化学报,2019,45(3):626-636. 被引量：20

二级参考文献23

1褚一平,叶修梓,张引,张三元.基于分层MRF模型的抗抖动视频分割算法[J].浙江大学学报（工学版）,2007,41(11):1793-1796. 被引量：2
2包红强,张兆扬,陈右铭.基于时空曲线演化的多视频运动对象分割算法[J].电子学报,2005,33(1):181-185. 被引量：2
3陈睿,邓宇,向世明,李华.结合强度和边界信息的非参数前景/背景分割方法[J].计算机辅助设计与图形学学报,2005,17(6):1278-1284. 被引量：13
4Yang T, Li S Z, Pan Q, Li J. Real-time and accurate segmentation of moving objects in dynamic scene. In: Proceedings of the ACM 2nd International Workshop on Video Surveillance and Sensor Networks. New York, USA: IEEE, 2004. 136-143 被引量：1
5Stauffer C, Grimson W. Learning patterns of activity using real-time tracking. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2000, 22(8): 747-757 被引量：1
6Zivkovic Z. Improved adaptive Gaussian mixture model for background subtraction. In: Proceedings of the 17th International Conference on Pattern Recognition. USA: IEEE, 2004. 28-31 被引量：1
7Stenger B, Ramesh V, Paragios N, Coetzee F, Buhmann J M. Topology free hidden Markov models: application to background modeling. In: Proceedings of the 8th International Conference of Computer Vision. USA: IEEE, 2001. 294-301 被引量：1
8Migdal J, Grimson E. Background subtraction using Markov thresholds. In: Proceedings of Workshop on Motion and Video Computing. USA: IEEE, 2005. 58-65 被引量：1
9Zhou Y, Xu W, Tao H, Gong Y H. Background segmentation using spatial-temporal multi-resolution MRF. In: Proceedings of Workshop on Motion and Video Computing. USA: IEEE, 2005. 8-13 被引量：1
10Elgammal A, Duraiswami R, Harwood D, Davis L S. Background and foreground modeling using nonparametric kernel density estimation for visual surveillance. Proceedings of IEEE, 2002, 90(7): 1151-1163 被引量：1

共引文献32

1张堃,刘志诚,刘纪元,华亮,费敏锐.面向人机协作系统的上肢姿态精准识别算法研究[J].仪器仪表学报,2023,44(1):275-282. 被引量：4
2黄天羽,石崇德,李凤霞,程成.一种基于判别随机场模型的联机行为识别方法[J].计算机学报,2009,32(2):275-281. 被引量：6
3李鹏飞,陈朝武,李晓峰.智能视频算法评估综述[J].计算机辅助设计与图形学学报,2010,22(2):352-360. 被引量：33
4王峰,张雪英,李炳男.基于CRFs和MPCP特征的和弦识别研究[J].计算机工程与应用,2011,47(18):198-200. 被引量：1
5裴颂文,王文浩,马超,吴百锋.一种面向流处理器的条件随机场并行计算方法[J].小型微型计算机系统,2011,32(12):2392-2395.
6张微,汪西莉.基于超像素的条件随机场图像分类[J].计算机应用,2012,32(5):1272-1275. 被引量：10
7王克全.安徽盆景的发展与创新[J].花卉,2000(3):23-23.
8李玲玲,金泰松,李翠华.基于局部特征和隐条件随机场的场景分类方法[J].北京理工大学学报,2012,32(7):720-724. 被引量：4
9程强,陈峰,董建武,徐文立.概率图模型中的变分近似推理方法[J].自动化学报,2012,38(11):1721-1734. 被引量：9
10周文俊,郑新波,卿粼波,熊文诗,吴晓红.基于光流的快速人体姿态估计[J].计算机系统应用,2018,27(12):109-115.

同被引文献17

1钟国韵,常艳荣,汪宇玲,杨德明.旋转局部梯度模式特征及其在模糊图像识别中的应用[J].计算机应用与软件,2020,37(10):180-187. 被引量：3
2许高建,张蕴,赖小燚.基于Faster R-CNN深度网络的茶叶嫩芽图像识别方法[J].光电子．激光,2020,31(11):1131-1139. 被引量：32
3李昕,陈泽君,李立君,谭季秋,吴发展.基于偏好免疫网络和SVM算法的油茶果多特征识别[J].农业工程学报,2020,36(22):205-213. 被引量：12
4高春永,柏业超,王琼.基于改进的半监督阶梯网络SAR图像识别[J].南京大学学报（自然科学版）,2021,57(1):160-166. 被引量：2
5宋叶帆,王国书,盛步云.一种混合阈值剪枝的稀疏化训练图像识别算法[J].科学技术与工程,2021,21(2):638-643. 被引量：4
6韦超现.基于视觉传达的多帧图像特征目标跟踪仿真[J].计算机仿真,2021,38(1):404-407. 被引量：4
7毛舒宇,岳凤英.二维变分模态分解在SAR图像特征提取及目标识别中的应用[J].电光与控制,2021,28(3):98-101. 被引量：2
8张亚军.基于改进支持向量机算法的农业害虫图像识别研究[J].中国农机化学报,2021,42(2):146-152. 被引量：10
9刘自强,周铁军,傅冬和,彭华.基于颜色和形状的鲜茶叶图像特征提取及在茶树品种识别中的应用[J].江苏农业科学,2021,49(12):168-172. 被引量：15
10张志林,李玉鑑,刘兆英,张婷.深度学习在细粒度图像识别中的应用综述[J].北京工业大学学报,2021,47(8):942-953. 被引量：14

引证文献1

1李进,岳华峰,程生博,彭一帆,黄备备.供应链质量追溯的烟草叶片图像帧特征动态识别方法[J].计算技术与自动化,2024,43(1):111-116.

1刘洋,杨小军.基于孪生网络特征融合与阈值更新的跟踪算法[J].计算机技术与发展,2022,32(3):65-70. 被引量：3
2汪永奇.工作室制教学模式下的广告学专业“四创”人才培养路径研究[J].采写编,2021(11):74-75.
3郎亚坤,苏超,王国中,李国平.基于Neo4j的C++课程知识图谱的构建和推理[J].智能计算机与应用,2021,11(7):144-150. 被引量：11
4章雪瑞,孙凤铭,袁夏.视频目标分割中帧间相似性传播的研究[J].计算机工程与应用,2022,58(6):227-233. 被引量：2
5殷雨昌,王洪元,陈莉,冯尊登,肖宇.基于单标注样本的多损失学习与联合度量视频行人重识别[J].计算机应用,2022,42(3):764-769.
6王金珠.基于深度学习与步态分析的身份识别算法[J].电子设计工程,2022,30(7):100-104. 被引量：1
7韦强申,宋勇,李红霞,王希栋,叶晓舟,欧阳晔.5G核心网网元多维特征融合故障预警[J].通信技术,2022,55(3):394-403. 被引量：2
8孟纯如.智媒时代企业公关与品牌创新路径研究[J].中国报业,2022(4):24-27. 被引量：2
9付利华,赵宇,姜涵煦,赵茹,吴会贤,闫绍兴.基于前景感知视觉注意的半监督视频目标分割[J].电子学报,2022,50(1):195-206. 被引量：7
10蔡强,李韩玉,李楠,刘新亮.基于时序信息和注意力机制的视频目标检测[J].计算机仿真,2021,38(12):380-385. 被引量：1

自动化学报

2022年第3期

浏览历史

内容加载中请稍等...

反馈学习高斯表观网络的视频目标分割被引量：1

参考文献3

二级参考文献23

共引文献32

同被引文献17

引证文献1

相关作者

相关机构

相关主题

浏览历史

反馈学习高斯表观网络的视频目标分割 被引量：1

参考文献3

二级参考文献23

共引文献32

同被引文献17

引证文献1

相关作者

相关机构

相关主题

浏览历史

反馈学习高斯表观网络的视频目标分割被引量：1