移动机器人导航中的楼道场景语义分割被引量：10

Semantic segmentation of corridor scene for mobile robot navigation

下载PDF

导出

摘要通过深度学习模型对室内楼道环境的视觉信息进行处理,帮助移动机器人在室内楼道环境下自主行走。为达到这个目的,将楼道环境对象分为路、门、窗户、消防栓、门把手和背景六类,通过图像的语义分割实现对象识别。在对楼道环境的六类对象进行分割的实验中发现,由于门把手比起其他对象小很多,影响了对它的识别效果;将六分类模型改为"5+2"分类模型,解决了这个问题。分类模型的基础是全卷积神经(FCN)网络,可以初步实现图像的分割。为了提高FCN网络的分割效果,从三个方面进行了实验研究:a)取出FCN网络的多个中间特征层,进行多层特征融合;b)考虑到移动机器人行走过程中视觉信息的时间序列特点,将递归神经网络(RNN)的结构纳入到FCN网络中,构成时间递归的t-LSTM网络;c)考虑到二维图像相邻像素之间的依赖关系,构成空间递归的s-LSTM网络。这些措施都有效地提高了图像的分割效果,实验结果表明,多层融合加s-LSTM的结构从分割效果和计算时间方面达到综合指标最佳。 This paper processed visual information from corridor scene inside buildings through deep learning models to help mobile robot walk autonomously in this environment. To this end,objects in corridor environments were classified into 6 classes： road,door,window,hydrant,door handle and background,and these objects in images of corridor scene were recognized through semantic segmentation. The recognition for door handle was not satisfied in experiments because of its relatively small size to other objects; instead of 6-classification,it used ＂5 ＋ 2 ＂-classification to solve this problem. The basis of this model was a fully convolution neural networks,which could segment images of corridor scene primitively. In order to improve the performance of the FCN network,this paper conducted experiments in three aspects： a） Combining features from multi-intermediate-layers of FCN network instead of only using features of last layer to form multi-layer-fusion FCN network. b） Introducing recurrent neural network（ RNN） into FCN network to form the temporal recursive t-LSTM network with the consideration of the time series feature of images from mobile robots＇ video cameras. c） Introducing recurrent neural network into FCN network to form the spatial recursive s-LSTM network with the consideration of the dependence among adjacent pixels of the two-dimensional images. The experimental results show that the combining of multi-layer-fusion and s-LSTM achieves good performance in segmentation and computational time consuming.

作者徐风尧王恒升 Xu Fengyao;Wang Hengsheng(College of Mechanical ＆ Electrical Engineering,Central South University,~7~angsha 410083,China;State Key Laboratory for High Per formance Complex Manufacturing,Changsha 410083,China)

机构地区中南大学机电工程学院高性能复杂制造国家重点实验室

出处《计算机应用研究》 CSCD 北大核心 2018年第6期1863-1866,1886,共5页 Application Research of Computers

基金国家"973"计划资助项目(2013CB035504) 中南大学中央高校基本科研业务费专项资金资助项目(2017zzts639)

关键词图像语义分割全卷积神经网络递归神经网络多层特征融合移动机器人导航 image semantic segmentation fully eonvolutional neural （ FCN ） network recurrent neural network （RNN） multi-layer feature fusion mobile robot navigation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1陈鸿翔..基于卷积神经网络的图像语义分割[D].浙江大学,2016:

同被引文献61

1沈蔚,李京,陈云浩,邓磊,彭光雄.基于LIDAR数据的建筑轮廓线提取及规则化算法研究[J].遥感学报,2008,12(5):692-698. 被引量：85
2邵承会,程光明,唐可洪,阚君武,杨志刚.融合分数维特征的水岸彩色图像水岸界线识别[J].光电工程,2005,32(3):78-81. 被引量：3
3黄戟,凌繁荣.数字视频服务器在黄河干渠枢纽视频监控中的应用[J].中国公共安全,2005,0(1):120-121. 被引量：2
4荆浩,陈学佺,顾志伟.一种基于边缘特征的海岸线检测方法[J].计算机仿真,2006,23(8):89-93. 被引量：14
5龙燕,姜威.基于改进的空域相关的多聚焦图像融合[J].光学技术,2008,34(3):431-434. 被引量：5
6崔建军,隋立春,徐花芝,赵旦.基于边缘检测算法的LiDAR数据建筑物提取[J].测绘科学技术学报,2008,25(2):98-100. 被引量：32
7桂阳,李立春,王鲲鹏,孙祥一.基于区域方差和RANSAC的海天线检测新方法[J].激光与红外,2008,38(11):1149-1151. 被引量：14
8王莫.三维激光扫描技术在故宫古建筑测绘中的应用研究[J].故宫博物院院刊,2011(6):143-156. 被引量：54
9汤羽扬,杜博怡,丁延辉.三维激光扫描数据在文物建筑保护中应用的探讨[J].北京建筑工程学院学报,2011,27(4):1-6. 被引量：24
10王倩,王正勇,范艳军,滕奇志,何小海.基于边缘流和区域合并的岩屑颗粒图像分割[J].四川大学学报（自然科学版）,2014,51(1):111-118. 被引量：8

引证文献10

1陈恭礼.英国的“英文诵读教学法”[J].中学语文（教师版）,2000,0(7):64-64. 被引量：2
2沈建军,陶青川,肖卓.结合改进Deeplab v3+网络的水岸线检测算法[J].中国图象图形学报,2019,24(12):2174-2182. 被引量：4
3闫龙,张伟.一种室内建筑点云平面图快速生成方法[J].科技与创新,2020,0(1):159-160.
4陈森,王世峰,孙琪,刘传义,王开鑫.用于室内环境语义分割的全卷积网络[J].长春理工大学学报（自然科学版）,2020,43(4):78-84. 被引量：1
5刘铁燕.升降伸缩式楼道清洁机器人结构及控制系统设计探析[J].数字通信世界,2021(2):64-65. 被引量：1
6李宁,王翌翔,王靖淞.面向文物建筑保护修缮需求的正射图图示化解析技术与方法研究[J].古建园林技术,2021,23(1):79-83.
7杨迪,陈春雨.基于双分支交互的实时语义分割算法[J].应用科技,2024,51(2):48-55.
8董成荣,姚俊萍,李晓军,苏逸,周志杰.面向分布式复杂数据样本的联邦语义分割方法综述[J].计算机应用研究,2024,41(6):1610-1617.
9何丽,姚佳程,廖雨鑫,张文智,卢赵清,袁亮,肖文东.深度强化学习求解移动机器人端到端导航问题的研究综述[J].计算机工程与应用,2024,60(14):1-13.
10王鑫,于重重,马先钦,陈秀新.基于语义分割-对抗的图像语义分割模型[J].计算机仿真,2019,36(2):191-195. 被引量：1

二级引证文献9

1沈庆利,马东瑶.“诵读语文”与中外文化[J].现代中国文化与文学,2007(1):144-148. 被引量：3
2郭薇.英文诵读课与英语阅读课差异分析及启示[J].山西财政税务专科学校学报,2018,20(3):64-66. 被引量：1
3杨鑫,于重重,王鑫,陈秀新.融合ASPP-Attention和上下文的复杂场景语义分割[J].计算机仿真,2020,37(9):204-208. 被引量：2
4高强.结合Lab颜色空间的河道水岸线提取研究[J].电子技术与软件工程,2021(16):154-156.
5孟凡宏,黄丹飞,钟艾琦,陈思阳,赵成龙.基于改进SegNet癌变组织图像语义分割算法[J].长春理工大学学报（自然科学版）,2022,45(4):87-92.
6张航,田宗浩,李泳,彭羽茜.基于语义分割的二阶段舰船目标检测算法研究[J].战术导弹技术,2023(2):137-143.
7张占辉,陈家杰.自爬升式楼梯清洁机的设计[J].冶金设备管理与维修,2023,41(5):50-51.
8龚远瑾,杨淑洁.基于视觉语义和点线融合的无人艇动态水面环境感知SLAM算法[J].南方水产科学,2024,20(3):120-132.
9姚福飞,柏利志,周田.改进U-Net的水岸分割算法[J].计算机科学与应用,2022,12(12):2875-2883.

1物业有权干涉业主楼道摆放物品的行为吗[J].社区,2017,0(27):24-24.
2张兆晨,冀俊忠.基于循环神经网络的时序fMRI数据分类方法研究[J].小型微型计算机系统,2018,39(7):1426-1430. 被引量：8
3果子狸先生.兄弟战争[J].中学生博览,2018,0(23):12-15.
4肖熹,李洋.中国电影中的后人类叙事(1986-1992)[J].电影艺术,2018(1):38-43. 被引量：10
5牛伯浩.循环神经网络实现文本智能预测[J].智能城市,2018,4(10):11-13. 被引量：2
6赵汝鹏,田润澜,王春雨,赵皓.对未知复杂体制雷达信号融合处理算法[J].现代防御技术,2017,45(6):82-88. 被引量：1
7邓金城,彭应林,刘常春,陈子杰,雷国胜,吴江华,张广顺,邓小武.深度卷积神经网络在放射治疗计划图像分割中的应用[J].中国医学物理学杂志,2018,35(6):621-627. 被引量：19
8赵志伟.可自主跨越障碍物弹跳式采摘机器人设计——基于跨栏跑摆腿技术动作分析[J].农机化研究,2018,40(10):86-90. 被引量：2
9胡正平,陈俊岭.多层融合深度局部PCA子空间稀疏优化特征提取模型[J].电子学报,2017,45(10):2383-2389. 被引量：10
10张雁超诗六首[J].诗探索,2018,0(4):82-85.

计算机应用研究

2018年第6期

浏览历史

内容加载中请稍等...

移动机器人导航中的楼道场景语义分割被引量：10

参考文献1

同被引文献61

引证文献10

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

移动机器人导航中的楼道场景语义分割 被引量：10

参考文献1

同被引文献61

引证文献10

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

移动机器人导航中的楼道场景语义分割被引量：10