一种在线更新的单目视觉里程计

Online-updating monocular visual odometry

下载PDF

导出

摘要现有的基于深度学习的视觉里程计(visual odometry,VO)训练样本与应用场景存在差异时,普遍存在难以适应新环境的问题,因此提出了一种在线更新单目视觉里程计算法OUMVO。其特点在于应用阶段利用实时采集到的图像序列在线优化位姿估计网络模型,提高网络的泛化能力和对新环境的适用能力。该方法使用了自监督学习方法,无须额外标注地面真值,并采用了Transformer对图像流进行序列建模,以充分利用局部窗口内的视觉信息,提高位姿估计精度,以避免传统方法只能利用相邻两帧图像来估计位姿的局限,还可以弥补采用RNN进行序列建模无法并行计算的缺点。此外,采用图像空间几何一致性约束,解决了传统单目视觉里程计算法存在的尺度漂移问题。在KITTI数据集上的定量和定性实验结果表明,OUMVO的位姿估计精度和对新环境的适应能力均优于现有的先进单目视觉里程计方法。 When training samples of existing deep learning-based visual odometry(VO)are different from application scena-rios,it is difficult to adapt to the new environment.Therefore,this paper proposed an online updated monocular visual mileage calculation method(OUMVO).In the application stage,it optimized the pose estimation network model online by using the real-time image sequence,which improved the generalization ability of the network and the ability to apply to the new environment.At the same time,it utilized self-supervised learning method without the need to mark the ground truth.Moreover,it adopted Transformer to conduct sequential modeling of image streams to make full use of the visual information within the local window to improve the precision of the pose estimation in order to avoid the limitation that the traditional method could only use two adjacent frames to estimate the pose.It could also compensate for the shortcomings of using RNN for sequence modeling which could not be calculated in parallel.In addition,it used the geometric consistency constraint of the image space to solve the scale drift problem of the traditional monocular visual mileage calculation method.Quantitative and qualitative experimental results on the KITTI dataset show that the proposed method is superior to existing state-of-the-art monocular visual odometry methods in terms of pose estimation accuracy and adaptability to new environments.

作者王铭敏佃松宜钟羽中 Wang Mingmin;Dian Songyi;Zhong Yuzhong(School of Electrical Engineering,Sichuan University,Chengdu 610065,China)

机构地区四川大学电气工程学院

出处《计算机应用研究》 CSCD 北大核心 2024年第7期2209-2214,共6页 Application Research of Computers

基金国家重点研发计划资助项目(2018YFB1307402)。

关键词视觉里程计单目视觉在线更新自监督学习 Transformer神经网络 visual odometry monocular visual online update self-supervised deep learning Transformer neural network

分类号 TP242.6 [自动化与计算机技术—检测技术与自动化装置]

引文网络
相关文献

参考文献5

1赵文恺,李刚.基于双目相机的视觉里程计[J].计算机工程与设计,2020,41(4):1133-1138. 被引量：8
2雷金周,曾令斌,叶南.工业机器人单目视觉对准技术研究[J].光学精密工程,2018,26(3):733-741. 被引量：24
3李鹏,刘琪,何宸宇,满春涛,刘宗明.融合深度学习和几何定姿的光流视觉里程计研究[J].电机与控制学报,2020,24(12):142-151. 被引量：2
4张再腾,张荣芬,刘宇红.一种基于深度学习的视觉里程计算法[J].激光与光电子学进展,2021,58(4):316-323. 被引量：6
5朱凯,刘华峰,夏青元.基于单目视觉的同时定位与建图算法研究综述[J].计算机应用研究,2018,35(1):1-6. 被引量：25

二级参考文献13

1魏振忠,高明,周富强,张广军.基于辅助摄像机的机器人延伸手眼标定方法[J].光电工程,2008,35(9):76-80. 被引量：6
2晁志超,伏思华,姜广文,于起峰.单目摄像机-激光测距传感器位姿测量系统[J].光学学报,2011,31(3):85-91. 被引量：55
3翟光,张景瑞,张尧.基于共面光标提取的空间目标单目测量技术[J].北京理工大学学报,2013,33(10):1015-1020. 被引量：5
4Wei-dong ZHU,Biao MEI,Guo-rui YAN,Ying-lin KE.Development of a monocular vision system for robotic drilling[J].Journal of Zhejiang University-Science C(Computers and Electronics),2014,15(8):593-606. 被引量：7
5杨文辉,林嘉睿,高扬,邾继贵.双护盾硬岩隧道掘进机位姿测量系统[J].光学学报,2015,35(11):139-147. 被引量：19
6刘浩敏,章国锋,鲍虎军.基于单目视觉的同时定位与地图构建方法综述[J].计算机辅助设计与图形学学报,2016,28(6):855-868. 被引量：168
7罗杨宇,刘宏林.基于光束平差法的双目视觉里程计研究[J].控制与决策,2016,31(11):1936-1944. 被引量：10
8林志林,张国良,姚二亮,徐慧.动态场景下基于运动物体检测的立体视觉里程计[J].光学学报,2017,37(11):187-195. 被引量：21
9邹进贵,万荧,孟丽媛.一种基于自适应权重SAD与Census融合的匹配算法[J].测绘通报,2018(11):11-15. 被引量：22
10禹鑫燚,詹益安,朱峰,欧林林.一种基于四叉树的改进的ORB特征提取算法[J].计算机科学,2018,45(B11):222-225. 被引量：16

共引文献60

1陈昀,王理,袁明浩,刘梦成,陈羽佳,熊芊芊,洪瑜莉.基于物联网实现智慧仓储配送与绿色共享快递——以中圆物流为例[J].科技创业月刊,2023,36(S01):102-105. 被引量：1
2赵玉琛,叶海峰,林靖宇.结合DBSCAN与PTAM算法的室内家居无标记增强现实系统[J].计算机应用研究,2020,37(S02):302-304.
3王海玲,何宏,孙磊.基于ROS机器人手眼自标定研究[J].电子测量技术,2018,41(23):6-11. 被引量：3
4张卡,盛业华,付素霞,袁家明,陈辉.基于物方定位一致性约束的光学航空影像多视铅垂线轨迹匹配[J].光学精密工程,2018,26(7):1784-1793. 被引量：7
5燕必希,朱立夫,董明利,孙鹏,王君.卡尔曼滤波单目相机运动目标定位研究[J].仪器仪表学报,2018,39(8):220-229. 被引量：28
6张樱凡,楚红雨,常志远,陈林,倪俊超,邵延华,梅艳莹.基于多传感器融合的飞行器室内自主导航设计[J].工业控制计算机,2018,31(1):71-72. 被引量：2
7李佳芮.基于深度学习的语义地图生成[J].电子制作,2018,26(24):30-32.
8朱嘉琦.基于VR的室外教学系统设计[J].现代商贸工业,2019,40(18):194-196.
9曾世藩,周广兵,李文威,郑楚鑫,郑辉.面向公共安全的救援机器人关键技术综述[J].机器人技术与应用,2019(2):20-25. 被引量：7
10陈友东,刘嘉蕾,胡澜晓.一种基于高斯过程混合模型的机械臂抓取方法[J].机器人,2019,41(3):343-352. 被引量：12

1高学金,牟雨曼,任明荣.基于注意力卷积神经网络的视觉里程计[J].控制工程,2024,31(6):1060-1066.
2李晋,陈威,刘羽鹤,高瑞雪,冯立辉.融合视觉里程计和BP神经网络的自适应行人航迹推算方法[J].中国现代教育装备,2024(7):27-32.
3李志政,聂志喜,王振杰,张远帆.改进视觉前端的视觉/惯导融合定位算法[J].全球定位系统,2024,49(3):20-27.
4李小斌.高考中如何利用空间向量求解空间角[J].中学生数理化（高二数学、高考数学）,2024(14):37-39.
5王海超,王丽丽,郑爱宇,郝静.基于改进犹豫模糊C-均值的图像分割[J].计算机系统应用,2024,33(6):37-47.
6夏译蓝,王秀美,程培涛.基于多注意力机制的纹理感知视频修复方法[J].西安电子科技大学学报,2024,51(3):136-146.

计算机应用研究

2024年第7期

浏览历史

内容加载中请稍等...

一种在线更新的单目视觉里程计

参考文献5

二级参考文献13

共引文献60

相关作者

相关机构

相关主题

浏览历史