结合全卷积神经网络的室内场景分割被引量：15

Indoor scene segmentation based on fully convolutional neural networks

导出

摘要目的视觉假体通过向盲人体内植入电极刺激视神经产生光幻视,盲人所能感受到的物体只是大体轮廓,对物体识别率低,针对视觉假体中室内应用场景的特点,提出一种快速卷积神经网络图像分割方法对室内场景图像进行分割,通过图像分割技术把物品大致的位置和轮廓显示出来,辅助盲人识别。方法构建了用于室内场景图像分割的FFCN(fast fully convolutional networks)网络,通过层间融合的方法,避免连续卷积对图像特征信息的损失。为了验证网络的有效性,创建了室内环境中的基本生活物品数据集(以下简称XAUT数据集),在原图上通过灰度标记每个物品的类别,然后附加一张颜色表把灰度图映射成伪彩色图作为语义标签。采用XAUT数据集在Caffe(convolutional architecture for fast feature embedding)框架下对FFCN网络进行训练,得到适应于盲人视觉假体的室内场景分割模型。同时,为了对比模型的有效性,对传统的多尺度融合方法 FCN-8s、FCN-16s、FCN-32s等进行结构微调,并采用该数据集进行训练得到适用于室内场景分割的相应算法模型。结果各类网络的像素识别精度都达到了85%以上,均交并比(MIU)均达到60%以上,其中FCN-8s at-once网络的均交并比最高,达到70. 4%,但其分割速度仅为FFCN的1/5。在其他各类指标相差不大的前提下,FFCN快速分割卷积神经网络上平均分割速度达到40帧/s。结论本文提出的FFCN卷积神经网络可以有效利用多层卷积提取图像信息,避免亮度、颜色、纹理等底层信息的影响,通过尺度融合技术可以很好地避免图像特征信息在网络卷积和池化中的损失,相比于其他FCN网络具有更快的速度,有利于提高图像预处理的实时性。 Objective Vision is one of the most important ways by which humans obtain information. Visual prosthesis refers to the process where electrodes are implanted into a blind body to stimulate the optic nerve, such that the blind can see hallucinations. Therefore, the objects felt by the blind are only the general features, such as low resolution and poor linearity. In some cases, the blind can hardly distinguish optical illusions. Before the electrodes were stimulated, image segmentation was adopted to display the general position and outline of objects to help blind people clearly recognize every familiar object. The image fast segmentation of the convolution neural network was proposed to segment the indoor scene of visual prosthesis in terms of its application features. Method According to the demand of visual prosthesis for real-time image processing, the fast fully convolutional network (FFCN) network structure proposed in this paper was improved on the AlexNet classification network structure. The network reduced the error rate of top five in the ImageNet dataset to 16.4%, which was better than the 26.2% of the second. The AlexNet uses the convolution layer to extract deep feature information, adds the structure of the overlapping pool layer to reduce the parameters that must be learned, and defines the Relu activation function to solve the gradient diffusion of the Sigmod function in deeper networks. In contrast to other networks, it presents characteristics such as light weight and fast training speed. First, the FFCN for image segmentation in the indoor scene was constructed. It was composed of five convolution layers and one deconvolution layer. The loss produced by the continuous convolution in the picture feature information was avoided by scale fusion. To verify the effectiveness of the network, a dataset of basic items that can be touched by the blind in an indoor environment was created. The dataset was divided into nine categories and included 664 items, such as beds, seats, lamps, televisions, cupbo

作者黄龙杨媛王庆军郭飞高勇 Huang Long;Yang Yuan;Wang Qingjun;Guo Fei;Gao Yong(Xi'an University of Technology,Xi'an 710048,China;CRCC Corporation Limited Xi'an Yonge Electric Co.Ltd.,Xi'an 710018,China)

机构地区西安理工大学自动化与信息工程学院西安中车永电电气有限公司

出处《中国图象图形学报》 CSCD 北大核心 2019年第1期64-72,共9页 Journal of Image and Graphics

基金国家自然科学基金项目(61102017)~~

关键词室内场景视觉假体语义分割卷积神经网络深度学习 indoor environment visual prosthesis semantic segmentation convolution neural network deep learning

分类号 TP391.7 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献1

1姜枫,顾庆,郝慧珍,李娜,郭延文,陈道蓄.基于内容的图像分割方法综述[J].软件学报,2017,28(1):160-183. 被引量：132

二级参考文献9

1叶伟,王远军.基于Mumford-Shah理论的最小生成树图像分割方法[J].计算机辅助设计与图形学学报,2009,21(8):1127-1133. 被引量：15
2孟庆涛,龚声蓉,刘纯平,王朝晖.一种基于图的颜色纹理区域分割方法[J].中国图象图形学报,2009,14(10):2092-2096. 被引量：6
3徐海霞,田铮,丁明涛.基于谱聚类与混合模型的SAR图像多尺度分割[J].中国图象图形学报,2010,15(3):450-454. 被引量：9
4刘松涛,殷福亮.基于图割的图像分割方法及其新进展[J].自动化学报,2012,38(6):911-922. 被引量：142
5汪粼波,郭延文,夏天辰,金国平.样本驱动的半自动图像集前背景分割[J].计算机辅助设计与图形学学报,2013,25(6):794-801. 被引量：6
6刘磊,石志国,宿浩茹,李红.基于高阶马尔可夫随机场的图像分割[J].计算机研究与发展,2013,50(9):1933-1942. 被引量：13
7李宏益,吴素萍.Mean Shift图像分割算法的并行化[J].中国图象图形学报,2013,18(12):1610-1619. 被引量：9
8宋熙煜,周利莉,李中国,陈健,曾磊,闫镔.图像分割中的超像素方法研究综述[J].中国图象图形学报,2015,20(5):599-608. 被引量：97
9孙巍,郭敏.基于SLIC与条件随机场的图像分割算法[J].计算机应用研究,2015,32(12):3817-3820. 被引量：14

共引文献131

1王威,唐权.一种基于多特征及BP神经网络的高分辨率遥感影像道路提取方法[J].现代测绘,2020(2):8-10. 被引量：6
2王文昌,顾永兴.涉及微分多项式的亚纯函数的增长性[J].数学学报（中文版）,2000,43(2):261-268.
3张细莲.例谈线性规划问题的最优解[J].中学数学研究（华南师范大学）（上半月）,2000(4):28-29.
4能昌信,王玉玲,张波,闫岩,王蒙.基于OTSU的ERT图像中污染区域识别方法研究[J].环境科学与技术,2018,41(12):138-143. 被引量：3
5王召东,郭晨.一种动态场景下语义分割优化的ORB＿SLAM2[J].大连海事大学学报,2018,44(4):121-126. 被引量：8
6王庆敏,赵亮.基于最小生成树的图像分割方法[J].电脑编程技巧与维护,2017(15):74-76. 被引量：1
7程述立,汪烈军,秦继伟,杜安钰.群智能算法优化的结合熵的最大类间方差法与脉冲耦合神经网络融合的图像分割算法[J].计算机应用,2017,37(12):3528-3535. 被引量：18
8吴俊辉,汪烈军,秦继伟.基于改进的FA优化二维Otsu图像分割算法[J].新疆大学学报（自然科学版）,2018,35(1):60-65. 被引量：9
9杨志尧,彭召意,文志强.一种基于区域建议网络的图像语义分割方法[J].计算机与现代化,2018(2):122-126. 被引量：1
10卓辉,韩跃平,郭静.基于X射线的气缸套缺陷检测研究[J].自动化技术与应用,2018,37(2):93-96. 被引量：3

同被引文献83

1王森,伍星,张印辉,柳小勤.基于全卷积神经网络和结构化森林的结构体裂纹分割方法[J].仪器仪表学报,2020(8):170-179. 被引量：7
2罗久飞,邱广,张毅,冯松,韩冷.基于自适应双阈值的SURF双目视觉匹配算法研究[J].仪器仪表学报,2020,41(3):240-247. 被引量：41
3Anqi LI,Dongxu YE,Clarence W.DE SILVA,Max Q.-H.MENG.Convolutional Neural Network-based Leakage Detection of Crude Oil Transmission Pipes[J].Instrumentation,2019,6(4):85-94. 被引量：2
4任高宏,裴国献.周围神经三维重建与可视化研究进展[J].中国修复重建外科杂志,2009,23(2):239-244. 被引量：14
5徐毅琼,葛临东,王波,叶健.基于非监督学习神经网络的自动调制识别研究与实现[J].计算机应用与软件,2011,28(1):79-81. 被引量：1
6郝爱民,赵永涛,吴伟和,朱诗武.任意姿态虚拟人网格模型骨骼提取算法[J].中国图象图形学报,2011,16(6):1008-1014. 被引量：3
7钟映春,戚剑,刘小林,张淼.从图像中提取离散点状神经功能束边缘的研究[J].系统仿真学报,2011,23(7):1414-1418. 被引量：4
8钟映春,罗鹏.从神经切片图像中识别功能束类型的研究[J].中国图象图形学报,2012,17(1):82-89. 被引量：3
9霍东海,杨丹,张小洪,洪明坚.一种基于主成分分析的Codebook背景建模算法[J].自动化学报,2012,38(4):591-600. 被引量：18
10王科俊,阎涛,吕卓纹,唐墨.核稀疏保留投影及在步态识别中的应用[J].中国图象图形学报,2013,18(3):257-263. 被引量：8

引证文献15

1钟映春,祝玉杰,李芳,朱爽,戚剑.周围神经MicroCT图像中神经束轮廓获取[J].中国图象图形学报,2020,25(2):354-365. 被引量：4
2罗巍,陈曙东,龚立晨,李伟炜.基于深度学习的无人机遥感影像船只检测方法[J].船舶物资与市场,2019,27(4):25-28. 被引量：4
3杨兴明,周亚辉,张顺然,吴克伟,孙永宣.跨阶段结构下的人体姿态估计[J].中国图象图形学报,2019,24(10):1692-1702. 被引量：5
4汪检兵,李俊.基于OpenPose-slim模型的人体骨骼关键点检测方法[J].计算机应用,2019,39(12):3503-3509. 被引量：7
5章琳,袁非牛,张文睿,曾夏玲.全卷积神经网络研究综述[J].计算机工程与应用,2020,56(1):25-37. 被引量：43
6王维,陶青川,沈建军.改进FCN的水陆分割线提取方法[J].计算机工程与设计,2020,41(7):1975-1980. 被引量：2
7罗巍,王东亮,夏列钢,陈曙东.基于深度学习的林业资源调查方法[J].林业科技通讯,2020(8):17-22. 被引量：3
8朱楚雄,徐金明,钟传江.基于全卷积神经网络的花岗岩中不同组分分布特征分析[J].中国地质灾害与防治学报,2021,32(1):127-134. 被引量：2
9陈雪.基于卷积神经网络的室内虚拟控制系统设计[J].现代电子技术,2021,44(22):135-138. 被引量：1
10黄立峰,庄文梓,廖泳贤,刘宁.一种基于进化策略和注意力机制的黑盒对抗攻击算法[J].软件学报,2021,32(11):3512-3529. 被引量：7

二级引证文献89

1鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：12
2刘若雯,杨建喜,赵海博.基于对偶学习的图像翻译技术研究[J].北京电子科技学院学报,2020(2):12-18. 被引量：1
3李会宾,史云,刘怀洋,王文昊,刘万福,杨鹏.基于Openpose改进的苹果生长方向检测[J].中国农业信息,2022,34(6):34-48. 被引量：1
4王燕,朱婷茹,何立恒.森林资源遥感调查研究进展[J].现代测绘,2022,45(6):1-6. 被引量：1
5欧群雍,谭同德,冯学晓.基于机器学习的软件定义网络数据流子序列匹配算法[J].国外电子测量技术,2022,41(4):70-76. 被引量：2
6赵亮,马旺叶,杨雯彦,曹媛媛.基于Mask R-CNN的卫星影像船舶检测研究[J].科技视界,2019,0(30):24-25. 被引量：1
7罗文劼,倪鹏,张涵.多层次深度特征交换的人体解析方法[J].小型微型计算机系统,2020,41(1):149-154.
8徐婷宜,朱家明,李祥健.基于全卷积网络的肝脏CT语义分割[J].软件工程,2020,23(6):20-22. 被引量：1
9洪耀球.基于卷积神经网络图像识别的智能电子秤系统[J].景德镇学院学报,2020,35(3):1-4. 被引量：7
10段俊臣,梁美祥,王瑞.基于人体骨骼点检测与多层感知机的人体姿态识别[J].电子测量技术,2020,43(12):168-172. 被引量：8

1陈天殷.车载驾驶辅助系统及其深度学习与视觉技术[J].汽车电器,2018(12):14-20. 被引量：4
2房迪时.显示器校色[J].数码影像时代,2018,0(7):79-85.
32018十大最新科技发明科技时代将颠覆人类生活[J].绿洲农业科学与工程,2018,4(2):61-61.
4论文撰写规范[J].中国病毒病杂志,2018,8(6):462-462.
5赵瑛,耿秀琳,李琦,蒋广琪,谷宇.视觉假体中动态图像识别研究[J].计算机工程与应用,2018,54(23):162-169. 被引量：3
6熊鲁霞.传统手工绘制总图时代的纪念与计算机绘图时代的开启——记2001版上海市城市总体规划的总图绘制[J].上海城市规划,2018(6):11-12.
7胡圣大,曹明强,李晓波,钱璐,周亚峰.伊伐布雷定治疗急性心肌梗死合并心力衰竭的疗效[J].江苏医药,2018,44(12):1428-1431. 被引量：11
8程雅慧,蔡烜,冯瑞.面向车辆检测的扩张全卷积神经网络[J].计算机系统应用,2019,28(1):107-112. 被引量：2
9田晓杰,程耀瑜,常国立.基于深度学习优化SSD算法的硅片隐裂检测识别[J].机床与液压,2019,47(1):36-40. 被引量：11
10Yue Wang,Jinlai Liu,Xiaojie Wang.Video Description with Integrated Visual and Textual Information[J].China Communications,2019,16(1):119-128. 被引量：1

中国图象图形学报

2019年第1期

浏览历史

内容加载中请稍等...

结合全卷积神经网络的室内场景分割被引量：15

参考文献1

二级参考文献9

共引文献131

同被引文献83

引证文献15

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

结合全卷积神经网络的室内场景分割 被引量：15

参考文献1

二级参考文献9

共引文献131

同被引文献83

引证文献15

二级引证文献89

相关作者

相关机构

相关主题

浏览历史

结合全卷积神经网络的室内场景分割被引量：15