融合边缘语义信息的单目深度估计被引量：1

Integrating Spatial Semantic Information for Monocular Depth Estimation

下载PDF

导出

摘要单目深度估计研究是许多视觉任务的基础,从图像中得到边缘清晰,细节丰富的深度图对于后续任务具有重要的作用。针对当前单目深度估计模型中不能深度融合图像语义信息以及不能较好地利用图像对象的边缘信息问题,首先构建了超像素拓扑关系图,使用图神经网络提取局部边缘信息之间的相互关系,得到以超像素为节点的拓扑关系图,其次构建了基于编解码结构的深度估计与语义分割的联合模型,通过优化联合目标函数,使模型能够融合边缘语义信息,从而提高模型提取局部结构信息的能力。通过在NYU-Depth V2数据集中进行实验验证,结果表明模型能够构建细节丰富边缘清晰的深度图,提高了单目深度视觉估计的质量,与其他模型相比,该模型具有一定的优越性。 Monocular depth estimation is the basis of many vision tasks.Obtaining a depth map with clear edges and rich details of images is significant for subsequent tasks.Aiming at the problem that the current monocular depth estimation model cannot deeply integrate image semantic information and cannot use the edge information of image objects.Firstly,the superpixel topology relationship map was constructed,and the graph neural network was used to extract the relationship between local edge information.The topological relationship graph with superpixels as nodes was obtained.Secondly,a joint model of depth estimation and semantic segmentation based on the encoder-decoder structure was constructed.By optimizing the joint objective function,the model could fuse edge semantic information,thereby improving the model's ability to extract local structural information.Through experimental verification in the NYU-Depth V2 dataset,the results show that the model can construct a depth map with rich details and clear edges,which improves the quality of monocular depth visual estimation.Compared with other models,this model has certain advantages.

作者张玉亮赵智龙付炜平刘洪吉熊永平尹子会 ZHANG Yu-liang;ZHAO Zhi-long;FU Wei-ping;LIU Hong-ji;XIONG Yong-ping;YIN Zi-hui(Chinese Hebei North Electric co., Ltd., Maintenance Branch, Shijiazhuang 050000, China;Institute of Network Technology, Beijing University of Posts and Telecommunications, Beijing 100190, China)

机构地区国网河北省电力有限公司检修分公司运维检修部北京邮电大学网络技术研究院

出处《科学技术与工程》北大核心 2022年第7期2761-2769,共9页 Science Technology and Engineering

基金国家电网公司科技基金(kj2020-027)。

关键词单目深度估计语义分割图神经网络超像素编解码结构 monocular depth estimation semantic segmentation graph neural networks superpixel encoder-decoder structure

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献6

1郑坤,姜文正,卢晓,王胜利.基于双目立体视觉的海浪波面三维重建技术[J].科学技术与工程,2021,21(6):2392-2396. 被引量：12
2吕旭,胡柏青,徐大伟,李开龙,赵涛.一种改进的自适应USQUE组合导航姿态估计方法[J].科学技术与工程,2021,21(15):6494-6500. 被引量：3
3孙柏,郭中华,郑果果.强照度鲁棒的SLAM算法[J].科学技术与工程,2019,19(33):266-271. 被引量：3
4裴嘉欣,孙韶媛,王宇岚,李大威,黄荣.基于改进YOLOv3网络的无人车夜间环境感知[J].应用光学,2019,40(3):380-386. 被引量：11
5郭连朋,陈向宁,刘彬,刘田间.基于Kinect传感器多深度图像融合的物体三维重建[J].应用光学,2014,35(5):811-816. 被引量：20
6程晓悦,赵龙章,胡穹,史家鹏.基于密集层和注意力机制的快速语义分割[J].计算机工程,2020,46(4):247-252. 被引量：9

二级参考文献39

1罗久飞,邱广,张毅,冯松,韩冷.基于自适应双阈值的SURF双目视觉匹配算法研究[J].仪器仪表学报,2020,41(3):240-247. 被引量：41
2谭励,杨明华,曹元大,成保栋.视频传感器网络中基于动态注意力的图像融合[J].计算机工程,2010,36(2):214-216. 被引量：2
3黄承慧,印鉴,侯昉.一种结合词项语义信息和TF-IDF方法的文本相似度量方法[J].计算机学报,2011,34(5):856-864. 被引量：219
4林建华,刘党辉,邵显奎.多特征融合的Camshift算法及其进一步改进[J].计算机应用,2012,32(10):2814-2816. 被引量：15
5仇国庆,冯汉青,蒋天跃,涂乐飞.一种改进的Harris角点图像拼接算法[J].计算机科学,2012,39(11):264-266. 被引量：21
6邹芳喻,孙韶媛,席林,李琳娜.具有深度视觉感的车载红外图像彩色化方法[J].激光与光电子学进展,2013,50(1):103-109. 被引量：8
7梁锋,周卫东,马荟.基于四元数的舰船捷联惯导粗对准方法研究[J].舰船科学技术,2013,35(8):53-56. 被引量：2
8黎万义,王鹏,乔红.引入视觉注意机制的目标跟踪方法综述[J].自动化学报,2014,40(4):561-576. 被引量：70
9吕瑞,陈龙,翁雪,何金城.利用先验点图模型的SLAM后端优化算法[J].武汉大学学报（信息科学版）,2014,39(6):745-749. 被引量：8
10阎羡功.卡尔曼滤波在GPS/SINS船舶组合导航中的应用[J].舰船科学技术,2014,36(12):128-131. 被引量：10

共引文献51

1张春森,严露,于振.一种Kannala模型的鱼眼相机标定方法优化[J].西安科技大学学报,2019,39(6):1026-1032. 被引量：6
2李秦,夏选太.基于Kinect传感器的三维重建算法研究[J].电子设计工程,2015,23(17):30-31. 被引量：3
3邓念晨,杨旭波.多Kinect实时室内动态场景三维重建[J].东华大学学报（自然科学版）,2015,41(4):448-454. 被引量：2
4沈跃,徐慧,刘慧,李宁.基于K-means和近邻回归算法的Kinect植株深度图像修复[J].农业工程学报,2016,32(19):188-194. 被引量：19
5郭云昕,张微,刘咏梅,奚桐.三维人体测量技术的现状和比较[J].国际纺织导报,2016,44(8):38-40. 被引量：13
6尹明,周立前.基于Kinect传感器的红外场景增强算法分析[J].科技风,2017(6):100-100.
7王恒,金立军,龚霄雁,艾建勇.医用植入体的多视立体三维重建[J].中国医疗器械杂志,2017,41(2):84-88. 被引量：1
8李良福,邹彬,周国良,王超,贺峻峰.基于优化估计的深度图像修复与误差补偿方法研究[J].应用光学,2018,39(1):45-50. 被引量：10
9周自顾,曹杰,郝群,高泽东,肖宇晴.保留边界特征的深度图像增强算法研究[J].应用光学,2018,39(2):200-206. 被引量：4
10齐啸,计忠平.基于三维人体模型的尺寸测量和拟合[J].现代计算机,2019,25(7):74-81. 被引量：4

同被引文献1

1江俊君,李震宇,刘贤明.基于深度学习的单目深度估计方法综述[J].计算机学报,2022,45(6):1276-1307. 被引量：18

引证文献1

1宋霄罡,胡浩越,宁靖宇,梁莉,鲁晓锋,黑新宏.联合语义分割的自监督单目深度估计方法[J].计算机研究与发展,2024,61(5):1336-1347.

1梁智滨,赵文义,李灵巧,杨辉华.基于刀具刃口显微图像的附着物去除网络[J].计算机工程,2022,48(4):247-254. 被引量：1
2祝高峰.论数智经济时代重要数据安全的法律保护[J].社会科学家,2021,36(11):111-116. 被引量：3
3闫慧,陈慧彤.国内外图情档领域学术热点比较研究——兼论学术热点与学科发展的协同关系[J].情报资料工作,2022,43(2):5-13. 被引量：9
4王君涛,潘长乐,杨龙飞,詹亮.基于改进的ST-GCN模型的跌倒检测算法[J].信息技术与信息化,2022(2):69-71. 被引量：3
5蒲久亮,高小明.基于NSST变换的超声图像降噪算法[J].西南科技大学学报,2022,37(1):73-79. 被引量：1
6张蕊,胡瑾.网络舆情在新闻传播视域下的传播机制研究[J].环球首映,2022(2):227-229.
7肖栩豪,李晓军,李少臣,姚俊萍,慕晓冬.虚假信息检测技术研究综述[J].火箭军工程大学学报,2021(2):85-93.
8刘海燕.加强企业财务信息真实性的思考研究[J].市场周刊·理论版,2021(81):103-106.
9唐浩,张聪.农村集体经济组织成员权界定主体:理论、现状与制度设计[J].农业现代化研究,2022,43(1):69-79. 被引量：8
10肖志珂.内幕交易罪中利用内幕信息及其认定[J].社会科学家,2021,36(11):98-104. 被引量：3

科学技术与工程

2022年第7期

浏览历史

内容加载中请稍等...

融合边缘语义信息的单目深度估计被引量：1

参考文献6

二级参考文献39

共引文献51

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合边缘语义信息的单目深度估计 被引量：1

参考文献6

二级参考文献39

共引文献51

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

融合边缘语义信息的单目深度估计被引量：1