期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进YOLOv8表格行列单元格结构检测
1
作者 任强 玛依热·依布拉音 艾斯卡尔·艾木都拉 《中国科技论文》 CAS 2024年第5期607-614,共8页
当前数字办公文档中涵盖了大量的表格数据,因此智能化表格结构识别需求日益剧增,但表格结构紧密相连且表格结构类型复杂多变,从而导致表格结构检测难度极大。针对该问题,在YOLOv8的基础上,以ICDAR19-cTDaR表格单元格结构和TabStructDB... 当前数字办公文档中涵盖了大量的表格数据,因此智能化表格结构识别需求日益剧增,但表格结构紧密相连且表格结构类型复杂多变,从而导致表格结构检测难度极大。针对该问题,在YOLOv8的基础上,以ICDAR19-cTDaR表格单元格结构和TabStructDB表格行列结构为实验对象,提出了一种新型表格行列单元格结构检测方法。首先,为了增强表格单元格及行列特征提取能力,引入了可变形卷积网络(deformable convolution network,DCN)。其次,引入了空间通道重构卷积(spatial and channel reconstruction convolution,SCConv),该卷积不仅特征提取能力强而且能够减少冗余特征从而降低复杂性和计算成本。根据以上引入的卷积设计了一个新的模块——DSC模块以替代C2f中的Bottlenck模块,并命名为C2fDSC模块。此外,为了进一步加强表格结构的角落局部特征提取,在YOLOv8的骨干网络上加入了显示中心特征调节(explicit visual center feature adjustment,EVC)模块。最后,将原模型的损失函数替换为MPDIoU,在解决密集目标回归精度问题时,相较于原始模型损失函数,MPDIoU损失函数边界框回归的准确性和效率更高。实验结果表明,该表格结构检测算法在数据集ICDAR19-cTDaR上取得了目前最佳的实验效果(SOTA),单元格查准率、查全率和F1值分别为91.7%、82.3%和86.7%,在数据集TabStructDB表格行列检测中也取得了非常实用的性能结果。 展开更多
关键词 YOLOv8 EVc模块 c2fdsc模块 MPDIoU损失函数 最佳性能
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部