-
题名基于笔划间距分类的自适应提取单字方法
被引量:2
- 1
-
-
作者
张世龙
张习文
-
机构
湛江海洋大学
中国科学院软件研究所人机交互技术与智能信息处理实验室
-
出处
《信息技术》
2005年第8期80-82,87,共4页
-
文摘
单字提取是连续手写中文识别的前提。给出了一种基于笔划间距分类的自适应提取单字方法。该方法计算时间上相邻笔划的水平间距,利用直方图对笔划间距进行分类,先得到属于同一行的笔划集合,然后再对同一行的笔划进行间距分类,从而得到属于同一个字的笔划,实现单字提取。利用直方图对笔划间距进行二分类,对字的大小具有较好的适应性。以单字宽高比为分类终止条件。测试结果表明该方法对连续手写中文具有较好的分割效果。
-
关键词
连续手写中文
单字提取
直方图分析
-
Keywords
continuous handwriting Chinese text
character extraction
histogram analysis
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名一种连续手写中文的演化分割方法
被引量:2
- 2
-
-
作者
付永刚
张习文
戴国忠
-
机构
北京语言大学信息科学学院数字媒体实验室
中国科学院软件研究所人机交互与智能信息处理实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2009年第7期1-3,9,共4页
-
基金
国家自然科学基金No.60605018
国家重点基础研究发展规划(973) No.106028
+2 种基金
教育部科学技术研究重点项目(No.106028)
北京语言大学青年基金项目(No.06QN11)
北京语言大学一般项目(No.08YB12)~~
-
文摘
在连续手写中文中,有偏旁部首离得较远的单字,单字之间可能会存在粘连、重叠。针对这种情况给出了一种基于识别得分提取单字的演化方法。对行笔划序列进行二进制编码,采用改进的遗传算法实现演化过程。染色体中连续0或1对应的笔划组成候选单字。用汉王手写单字识别器获取它们的识别得分,以单字个数较少和总的识别得分较大为优化目标。遗传算法中的变异概率和交叉概率自适应生成。测试结果表明该方法对连续手写中文具有较好的分割效果。
-
关键词
连续手写中文
单字提取
遗传算法
识别得分
-
Keywords
continuous handwriting Chinese
character extraction
genetic algorithm
character recognition score
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名数字墨水中单字提取结果的自适应可视化方法
- 3
-
-
作者
白浩
张习文
付永刚
安维华
-
机构
北京语言大学汉语进修学院
北京语言大学信息科学学院数字媒体实验室
-
出处
《计算机工程与应用》
CSCD
2012年第15期153-158,共6页
-
基金
国家自然科学基金(No.60970158)
北京语言大学青年自主科研支持计划资助项目(No.09JBT014)
北京语言大学青年自主科研支持计划资助项目(中央高校基本科研业务费专项资金资助)(No.10JBT02)
-
文摘
中文数字墨水文本的分割结果包含单字、文本行和段落三个层次对象,单字在其中占有较大比例,情况复杂。使用自动的分割方法难以提供完全正确的单字提取结果,这时就需要进行人机交互校正单字提取结果。优化的可视化方法可以在人机交互时大大提高校正效率。面向交互校正错误的单字提取结果,针对单字结果间的邻近和重叠等情况,给出了一种自适应的可视化方法。该方法先生成单字的正放最小外接矩形,如果相邻矩形重叠,则改用凸包,仍然重叠,则给单字结果加上颜色。对多种数字墨水文本的单字提取结果进行可视化表示,取得了较好的效果。
-
关键词
数字墨水
可视化方法
单字提取
-
Keywords
digital ink
visualization
character extraction
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-