期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于融合特征与语法规则的流式文档理解方法 被引量:1
1
作者 郝海利 李宁 +1 位作者 田英爱 耿思 《北京信息科技大学学报(自然科学版)》 2019年第1期49-54,共6页
针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计... 针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计算,得出候选的构件标签;结合自顶向下和自底向上的结构识别方法,得到文档的逻辑结构。通过实验验证了该方法能有效提高文档构件识别的准确率,同时提高了文档结构识别的准确率。 展开更多
关键词 文档结构理解 文档识别 流式文档
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部