-
题名基于双分支特征融合的场景文本检测方法
被引量:5
- 1
-
-
作者
赵鹏
徐本朋
闫石
刘政怡
-
机构
安徽大学计算智能与信号处理教育部重点实验室
安徽大学计算机科学与技术学院
-
出处
《控制与决策》
EI
CSCD
北大核心
2021年第9期2179-2186,共8页
-
基金
国家自然科学基金项目(61602004)
安徽省高校自然科学研究重点项目(KJ2018A0013,KJ2017A011)
+1 种基金
安徽省自然科学基金项目(1908085MF188,1908085MF182)
安徽省重点研究与开发计划项目(1804d08020309)。
-
文摘
现有的基于深度学习的自然场景文本检测方法一般采用大型深度神经网络作为主干网络进行特征提取,虽然效果显著但检测模型十分庞大,检测效率较低,若直接将主干网络换成轻量型网络则不能提取出足够的特征信息,直接导致检测效果大幅降低.为了降低文本检测模型的规模以及更为高效地检测文本,提出基于双分支特征融合的场景文本检测方法,在采用相对轻量级的主干网络EfficientNet-b3的基础上,使用双路分支进行特征融合进而检测场景文本.一路分支使用特征金字塔网络,融合不同层级的特征;另一路分支使用空洞卷积空间金字塔池化结构,扩大感受野,然后融合两个分支的特征,在小幅增加计算量的同时获取更多的特征,弥补小型网络提取特征不足的问题.在3个公开数据集上的实验结果显示,所提出方法在保持较高检测水平的情况下,可以大幅度降低模型的参数量,大幅度提升检测速度.
-
关键词
场景文本检测
深度学习
特征金字塔
特征融合
轻量级网络
注意力机制
-
Keywords
scene text detection
deep learning
feature pyramid network
feature fusion
lightweight neural
attention mechanism
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-