针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核...针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图。同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练。仿真结果表明,该算法模型在不同数据集上具有良好的检测性能。展开更多
文摘针对深度学习中对任意形状文本检测准确率不高的问题,提出了一种结合特征金字塔网络(feature pyramid network,FPN)和内核尺度扩展算法的文本检测网络模型。特征金字塔网络能够提取卷积层中更加鲁棒的特征,融合后生成不同尺度的特征内核;内核尺度扩展算法将生成的最小特征内核逐渐扩展为包围完整文本实例的特征图。同时为了针对自然场景中难以检测的文本实例,在训练阶段加入了在线难例挖掘(online hard example mining,OHEM)的方法,并以迁移学习的方式采用2种不同训练策略进行训练。仿真结果表明,该算法模型在不同数据集上具有良好的检测性能。