-
题名图像语义信息在视觉SLAM中的应用研究进展
- 1
-
-
作者
郭迟
刘阳
罗亚荣
刘经南
张全
-
机构
武汉大学湖北珞珈实验室
武汉大学卫星导航定位技术研究中心
武汉大学人工智能研究院
-
出处
《测绘学报》
EI
CSCD
北大核心
2024年第6期1057-1076,共20页
-
基金
国家重点研发计划(2022YFB3903801)
湖北省重大科技专项(2022AAA009)
+1 种基金
珞珈实验室开放基金
中国博士后科学基金(2023TQ0248)。
-
文摘
视觉同步定位与建图(visual simultaneous localization and mapping,VSLAM)技术以相机为主要传感器采集图像数据,基于多视几何、状态估计等算法原理获取载体的位置和姿态,同时构建一张用于导航定位的地图。视觉SLAM是自动驾驶、AR(augmented reality)、VR(virtual reality)、MR(mix reality)、智能机器人、无人机飞控中的关键技术。近年来,随着各个产业对智能导航定位的需求日渐增多,原本以几何测量为主的视觉SLAM逐渐融入对环境的语义理解。语义信息是指能够被人类直观感受和理解的概念,而图像语义信息是指图像中物体的轮廓、类别、显著性等信息。相比于图像中的几何特征,语义信息更具时空一致性,且更贴近人类感知的结果。将图像语义信息引入视觉SLAM,既能促进系统各个模块的性能,还能够提升视觉SLAM的智能感知能力,形成集几何测量、定位定姿、环境理解等多种功能的视觉语义SLAM。本文根据图像语义信息的应用方式,对视觉语义SLAM经典方案和最新研究进展进行归纳梳理。在此基础上,本文总结了视觉语义SLAM的现存问题与挑战,指出该领域未来的研究方向,以推动其面向智能导航定位进一步发展。
-
关键词
视觉slam
视觉语义slam
深度学习
智能导航定位
-
Keywords
visual slam
visual semantic slam
deep learning
intelligent navigation and localization
-
分类号
P208
[天文地球—地图制图学与地理信息工程]
-