期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于自适应游程平滑算法的藏文文档图像版面分割与描述 被引量:2
1
作者 陈园园 王维兰 +2 位作者 刘华明 蔡正琦 赵鹏海 《激光与光电子学进展》 CSCD 北大核心 2021年第14期164-171,共8页
版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平... 版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平滑,寻找连通区域,实现版面分割;根据各版面元素的外轮廓特征,简单区分文本区域与非文本区域;利用藏文文本识别器识别文本区域,再用可扩展标记语言记录版面信息,实现版面描述。在藏文中小学教材文档和铅印版藏文文档图像上的实验表明,该方法能够取得较好的版面分析结果。 展开更多
关键词 图像处理 藏文文档图像 版面分割 版面描述 自适应游程平滑
原文传递
结合文字核心区域和扩展生长的藏文古籍文本行切分 被引量:4
2
作者 李金成 王筱娟 +2 位作者 王维兰 林强 胡鹏飞 《激光与光电子学进展》 CSCD 北大核心 2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆... 藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。 展开更多
关键词 图像处理 藏文古籍文档图像 文本行切分 文字核心区域 扩展生长
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部