-
题名改进YOLOv8表格行列单元格结构检测
- 1
-
-
作者
任强
玛依热·依布拉音
艾斯卡尔·艾木都拉
-
机构
新疆大学计算机科学与技术学院
信号检测与处理重点实验室(新疆大学)
新疆大学未来技术学院
-
出处
《中国科技论文》
CAS
2024年第5期607-614,共8页
-
基金
国家自然科学基金资助项目(62166043,U2003207)。
-
文摘
当前数字办公文档中涵盖了大量的表格数据,因此智能化表格结构识别需求日益剧增,但表格结构紧密相连且表格结构类型复杂多变,从而导致表格结构检测难度极大。针对该问题,在YOLOv8的基础上,以ICDAR19-cTDaR表格单元格结构和TabStructDB表格行列结构为实验对象,提出了一种新型表格行列单元格结构检测方法。首先,为了增强表格单元格及行列特征提取能力,引入了可变形卷积网络(deformable convolution network,DCN)。其次,引入了空间通道重构卷积(spatial and channel reconstruction convolution,SCConv),该卷积不仅特征提取能力强而且能够减少冗余特征从而降低复杂性和计算成本。根据以上引入的卷积设计了一个新的模块——DSC模块以替代C2f中的Bottlenck模块,并命名为C2fDSC模块。此外,为了进一步加强表格结构的角落局部特征提取,在YOLOv8的骨干网络上加入了显示中心特征调节(explicit visual center feature adjustment,EVC)模块。最后,将原模型的损失函数替换为MPDIoU,在解决密集目标回归精度问题时,相较于原始模型损失函数,MPDIoU损失函数边界框回归的准确性和效率更高。实验结果表明,该表格结构检测算法在数据集ICDAR19-cTDaR上取得了目前最佳的实验效果(SOTA),单元格查准率、查全率和F1值分别为91.7%、82.3%和86.7%,在数据集TabStructDB表格行列检测中也取得了非常实用的性能结果。
-
关键词
YOLOv8
EVc模块
c2fdsc模块
MPDIoU损失函数
最佳性能
-
Keywords
YOLOv8
EVc module
c2fdsc module
MPDIoU loss function
best performance
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-