期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
连体段特征聚类的维吾尔文文档图像单词切分 被引量:6
1
作者 阿丽亚.巴吐尔 木特力铺.马木提 +2 位作者 努尔毕亚.亚地卡尔 阿力木江.艾沙 库尔班.吾布力 《计算机工程与设计》 北大核心 2018年第3期774-779,共6页
为有效解决文档图像中单词漏切分和过切分问题,分析维吾尔文文档图像的无嵌入式双栏版面特性和文字特点。综合考虑连体段位置信息、密度及高宽特征和相邻连体段重叠性,提出一种文档图像中精确切分完整单词块的方法。将图文混排的版面分... 为有效解决文档图像中单词漏切分和过切分问题,分析维吾尔文文档图像的无嵌入式双栏版面特性和文字特点。综合考虑连体段位置信息、密度及高宽特征和相邻连体段重叠性,提出一种文档图像中精确切分完整单词块的方法。将图文混排的版面分析与重叠域合并相结合,采用两级K-means分类策略,有效避免标点符号的影响,增强完整单词块的被切分能力。实验结果表明,该算法比连通域搜索算法和投影算法具有更高的切分精度,在多文种图像单词切分中具有更高的有效性。 展开更多
关键词 复杂文档图像 版面分析 连体段特征 单词切分 重叠率
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部