期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于自适应游程平滑算法的藏文文档图像版面分割与描述
被引量:
2
1
作者
陈园园
王维兰
+2 位作者
刘华明
蔡正琦
赵鹏海
《激光与光电子学进展》
CSCD
北大核心
2021年第14期164-171,共8页
版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平...
版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平滑,寻找连通区域,实现版面分割;根据各版面元素的外轮廓特征,简单区分文本区域与非文本区域;利用藏文文本识别器识别文本区域,再用可扩展标记语言记录版面信息,实现版面描述。在藏文中小学教材文档和铅印版藏文文档图像上的实验表明,该方法能够取得较好的版面分析结果。
展开更多
关键词
图像
处理
藏文
文档
图像
版面分割
版面描述
自适应游程平滑
原文传递
结合文字核心区域和扩展生长的藏文古籍文本行切分
被引量:
4
2
作者
李金成
王筱娟
+2 位作者
王维兰
林强
胡鹏飞
《激光与光电子学进展》
CSCD
北大核心
2021年第2期105-115,共11页
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆...
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
展开更多
关键词
图像
处理
藏文
古籍
文档
图像
文本行切分
文字核心区域
扩展生长
原文传递
题名
基于自适应游程平滑算法的藏文文档图像版面分割与描述
被引量:
2
1
作者
陈园园
王维兰
刘华明
蔡正琦
赵鹏海
机构
西北民族大学数学与计算机科学学院
西北民族大学中国民族语言文字处理教育部重点实验室
阜阳师范大学计算机与信息工程学院
出处
《激光与光电子学进展》
CSCD
北大核心
2021年第14期164-171,共8页
基金
国家自然科学基金(61772430)
国家民委创新团队计划(〔2018〕98号)
+1 种基金
甘肃省双一流学科建设项目-西北民族大学(11080304)
甘肃省高等学校创新基金项目(2020B-069)。
文摘
版面分割是文档图像分析与识别过程中的重要基础步骤,为了探索适用于藏文文档图像版面分割与描述的方法,提出一种基于自适应游程平滑算法的研究方法。根据藏文文档图像的版面结构,利用K均值聚类分析得到适用于版面的游程阈值,进行游程平滑,寻找连通区域,实现版面分割;根据各版面元素的外轮廓特征,简单区分文本区域与非文本区域;利用藏文文本识别器识别文本区域,再用可扩展标记语言记录版面信息,实现版面描述。在藏文中小学教材文档和铅印版藏文文档图像上的实验表明,该方法能够取得较好的版面分析结果。
关键词
图像
处理
藏文
文档
图像
版面分割
版面描述
自适应游程平滑
Keywords
image processing
Tibetan document image
layout segmentation
layout description
adaptive run length smoothing
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
结合文字核心区域和扩展生长的藏文古籍文本行切分
被引量:
4
2
作者
李金成
王筱娟
王维兰
林强
胡鹏飞
机构
西北民族大学中国民族语言文字信息技术教育部重点实验室
西北民族大学数学与计算机科学学院
出处
《激光与光电子学进展》
CSCD
北大核心
2021年第2期105-115,共11页
基金
国家自然科学基金(61772430)
国家民委创新团队计划(〔2018〕98号)
+2 种基金
甘肃省双一流学科建设项目(11080304)
甘肃省高等学校创新能力提升项目(2019B-024)
西北民族大学中央高校基本科研业务费项目(31920180050)。
文摘
藏文古籍文档图像中相邻文本行之间通常存在黏连和重叠的情况,这使得文本行切分成为一项艰巨的任务。因此,提出了一种结合文字核心区域和扩展生长的藏文古籍文档图像的行切分方法。首先,根据二值藏文古籍文档图像中连通域的面积和真圆度去除非音节点,获得音节点图像。其次,通过水平投影音节点图像和垂直投影二值原图,得到文本行基线所处的范围和文本行数,生成文字核心区域;通过像素值的或运算将文字核心区域和二值原图结合,得到伪文本连通区域。最后,基于广度优先搜索算法将文字核心区域扩展为伪文本连通区域,获得伪文本行连通区域,通过去掉其中的非文字区域来获得伪文本行,利用有效的断裂笔画行归属方法获得最终的文本行。实验结果表明,所提方法取得了较好的文本行切分结果,有效解决了文本行之间的重叠、部分行黏连以及笔画断裂等藏文古籍文本行切分的问题。
关键词
图像
处理
藏文
古籍
文档
图像
文本行切分
文字核心区域
扩展生长
Keywords
image processing
Tibetan historical document image
text line segmentation
text core region
expansion growth
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于自适应游程平滑算法的藏文文档图像版面分割与描述
陈园园
王维兰
刘华明
蔡正琦
赵鹏海
《激光与光电子学进展》
CSCD
北大核心
2021
2
原文传递
2
结合文字核心区域和扩展生长的藏文古籍文本行切分
李金成
王筱娟
王维兰
林强
胡鹏飞
《激光与光电子学进展》
CSCD
北大核心
2021
4
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部