期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于融合特征与语法规则的流式文档理解方法
被引量:
1
1
作者
郝海利
李宁
+1 位作者
田英爱
耿思
《北京信息科技大学学报(自然科学版)》
2019年第1期49-54,共6页
针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计...
针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计算,得出候选的构件标签;结合自顶向下和自底向上的结构识别方法,得到文档的逻辑结构。通过实验验证了该方法能有效提高文档构件识别的准确率,同时提高了文档结构识别的准确率。
展开更多
关键词
文档结构理解
文档识别
流式文档
下载PDF
职称材料
题名
基于融合特征与语法规则的流式文档理解方法
被引量:
1
1
作者
郝海利
李宁
田英爱
耿思
机构
北京信息科技大学计算机学院
出处
《北京信息科技大学学报(自然科学版)》
2019年第1期49-54,共6页
基金
国家重点研发计划项目(2018YFB1004100)
国家自然科学基金资助项目(61672105)
文摘
针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法。首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计算,得出候选的构件标签;结合自顶向下和自底向上的结构识别方法,得到文档的逻辑结构。通过实验验证了该方法能有效提高文档构件识别的准确率,同时提高了文档结构识别的准确率。
关键词
文档结构理解
文档识别
流式文档
Keywords
document
structure
comprehension
document
identification
reflowable
document
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于融合特征与语法规则的流式文档理解方法
郝海利
李宁
田英爱
耿思
《北京信息科技大学学报(自然科学版)》
2019
1
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部