-
题名面向驾驶场景的多尺度特征融合目标检测方法
被引量:4
- 1
-
-
作者
黄仝宇
胡斌杰
朱婷婷
黄哲文
-
机构
华南理工大学电子与信息学院
广东白云学院大数据与计算机学院
广州市生发科技服务有限公司技术部
-
出处
《计算机工程与应用》
CSCD
北大核心
2021年第14期134-141,共8页
-
基金
国家自然科学基金(61871193)
广东省自然科学基金重点项目(2018B030311049)
广东省重点科技领域研发计划(2019B090912001)。
-
文摘
针对驾驶场景中目标检测卷积神经网络模型检测精度较低的问题,提出一种基于改进RefineDet网络结构的多尺度特征融合目标检测方法。在RefineDet网络结构中嵌入LFIP(Light-weightFeaturizedImagePyramid,轻量级特征化的图像金字塔)网络,将LFIP网络生成的多尺度特征图与RefineDet中的ARM(AnchorRefinement Module,锚点框修正模块)输出的主特征图相融合,提升特征层中锚点框初步分类和回归的输出效果,为ODM(ObjectDetectionModule,目标检测模块)模块提供修正的锚点框以便于进一步回归和多类别预测;在RefineDet网络结构中的ODM之后嵌入多分支结构RFB(ReceptiveFieldBlock,感受野模块),在检测任务中获得不同尺度的感受野以改善主干网络中提取的特征。将模型中的激活函数替换为带有可学习参数的非线性激活函数PReLU(Parametric RectifiedLinearUnit,参数化修正线性单元),加快网络模型的收敛速度;将RefineDet的边界框回归损失函数替换为排斥力损失函数RepulsionLoss,使目标检测中的某预测框更靠近其对应的目标框,并使该预测框远离附近的目标框及预测框,可以提升遮挡情况下目标检测的精度;构建驾驶视觉下的目标检测数据集,共计48260张,其中38608张作为训练集,9652张作为测试集,并在主流的GPU硬件平台进行验证。该方法的mAP为85.59%,优于RefineDet及其他改进算法;FPS为41.7 frame/s,满足驾驶场景目标检测的应用要求。实验结果表明,该方法在检测速度略微下降的情况,能够较好地提升驾驶视觉下的目标检测的精确度,并能够一定程度上解决驾驶视觉下的遮挡目标检测和小目标检测的问题。
-
关键词
深度学习
卷积神经网络
目标检测
refinedet算法
感受野模块(RFB)
轻量级特征化的图像金字塔(LFIP)
参数化修正线性单元(PReLU)
损失函数
遮挡目标
-
Keywords
deep learning
convolutional neural network
object detection
refinedet algorithm
Receptive Field Block(RFB)
Light-weight Featured Image Pyramid(LFIP)
Parametric Rectified Linear Unit(PReLU)
loss function
occlusion object
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-