-
题名基于改进ExfuseNet模型的街景语义分割
被引量:2
- 1
-
-
作者
陈劲宏
陈玮
尹钟
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《电子科技》
2022年第6期28-34,共7页
-
基金
国家自然科学基金(61703277)。
-
文摘
使用ExfuseNet模型进行街景语义分割时,由于街景图像背景复杂度较高,造成感兴趣类之间的面积占比与分布不均衡,特别是图像中面积占比低且密度低的感兴趣目标,越到网络深层越容易被错误分类,最终导致模型分割性能下降。为解决该问题,文中对ExfuseNet模型进行了改进。为了获取不同尺度的语义信息,在不增加模型参数量的条件下,多监督模块采用不同空洞率的带孔卷积。在下采样特征融合后,立刻采用随机丢弃层来减少模型参数量,提高泛化力。在主输出前采用CBAM注意力机制模块以便更高效地对感兴趣目标类的深度语义信息进行采样,并在多监督模块之后采用类平衡函数来改善数据集Camvid的类不平衡问题。实验结果表明,改进的ExfuseNet模型语义分割效果有明显提升,其均交并比提升到了68.32%,Pole类分类准确率提升到38.14%。
-
关键词
街景图像
多监督
空洞率
带孔卷积
随机丢弃层
泛化力
注意力机制
类平衡
均交并比
-
Keywords
street view image
multiple supervision
dilated rate
dilated convolution
random drop layer
generalization
attention mechanism
class balance
mean intersection over union
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
TN99
[自动化与计算机技术—计算机科学与技术]
-
-
题名单块嵌入式GPU下对街景图像的实时分割研究
被引量:2
- 2
-
-
作者
陈劲宏
陈玮
陈舒曼
-
机构
上海理工大学光电信息与计算机工程学院
-
出处
《控制工程》
CSCD
北大核心
2021年第11期2165-2173,共9页
-
基金
国家自然科学基金资助项目(61703277)。
-
文摘
在有限的计算资源下,现有的语义分割网络无法兼顾实时性和准确性,导致在自动驾驶等实时应用领域上仍无法落地应用。为此,本研究采用先将感兴趣目标定位正确后再做进一步分类的策略,其在不同深度下部署了轻量级注意力机制模块以快速地捕捉到有效的空间特征信息,紧接着特征融合模块能够融合这些兼容性低下的空间特征信息,最后经过边界与内部优化模块以提高分割目标边界的平滑性以及内部的准确性和连续性。实验证明单块Tesla-P100显卡搭载所提出的网络能够胜任大部分实时任务。对于352×480分辨率的Camvid图像输入,网络在76.69帧下仍能达到69.12%的均交并比;对于1 024×2 048分辨率的Cityscapes图像输入,网络在49.90帧下均交并比达到了79.75%;对于720×1 280分辨率的Aeroscapes图像输入,网络在59.53帧下均交并比达到了80.43%。
-
关键词
语义分割
自动驾驶
轻量级注意力机制
特征融合
边界与内部优化
帧
均交并比
-
Keywords
Semantic segmentation
automatic drive
lightweight attention mechanism
feature fusion
Boundary and internal refinement
frame
mean intersection over union(mIoU)
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-