连通域结合重叠度的维吾尔文档图像文字切分被引量：6

Combination of connected regions and overlapping degree based Uyghur document image text segmentation

下载PDF

导出

摘要为提高文档图像字符的可读性和切分与识别的准确率,对印刷体维吾尔文文档图像进行研究,尤其是对连通段切分和字符切分等难点问题提出分割方法。使用跑长码的连通区域算法,结合重叠度计算方法,进行连通段切分;基于维吾尔文字符在基线上相接的特点,在基线位置估计的基础上,找出字符的切点。切分结果表明,该算法比其它算法切分结果效果更好。 To improve the accuracy of Uighur character recognition,a study was carried out on the Uighur printed document image,especially for the connected component segmentation and character segmentation which have now become the most difficult problems,an efficient segmentation method was proposed.Long run code connected regions algorithm and overlapping calculation methods were combined to segment the words on the document image.Uighur characters were connected in the base-line.Based on this characteristic,the baseline of the each word was estimated,and the segmentation positions of characters were found out.The results indicate better segmentation results than the algorithm proposed earlier.

作者姑丽祖热.吐尔逊尤努斯.艾沙吐尔根.依布拉音库尔班.吾布力

机构地区新疆大学信息科学工程学院

出处《计算机工程与设计》北大核心 2016年第7期1892-1897,共6页 Computer Engineering and Design

基金新疆维吾尔自治区少数民族科技人才特殊培养计划科研基金项目(201323121) 新疆维吾尔自治区高校科研计划重点基金项目(XJEDU2013I11) 模式识别国家重点实验室2014年度开放课题基金项目(201306321)

关键词文档图像处理跑长码连通区域算法重叠度算法单词切分字符切分 document image processing running long code connected regions algorithm overlapping algorithm word segmenta-tion character segmentation

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献11

1努尔艾力·喀迪尔,彭良瑞,哈力木拉提.一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法[J].计算机应用与软件,2015,32(1):171-174. 被引量：6
2李晓,袁保社,陈卿,任宏宇,张建华.基于像素积分投影的印刷体维文字母切分方法[J].计算机技术与发展,2012,22(4):41-44. 被引量：9
3唐群群..基于连体段的印刷维吾尔文切分标注[D].新疆大学,2013:
4陈卿,袁保社,李晓,任宏宇,张建华.基于模板匹配的印刷维吾尔文字符识别研究[J].计算机技术与发展,2012,22(4):119-122. 被引量：10
5易晓芳,卡米力.木依丁,艾斯卡尔.艾木都拉.基于连通域特征的维吾尔手写文本行分割[J].计算机工程与应用,2014,50(18):142-146. 被引量：6
6张振东,哈力旦.阿布都热依木,赵永霄.印刷体维吾尔文字符切分自适应算法[J].计算机工程与设计,2014,35(10):3685-3690. 被引量：3
7艾斯卡尔.艾木都拉,易晓芳,卡米力.木依丁.基于着色处理的维吾尔文手写文本行分割[J].清华大学学报（自然科学版）,2013,53(2):259-264. 被引量：4
8万金娥,袁保社,李晓,谷朝,米尔沙力江.沙吾提.一种改进的印刷体维吾尔文投影切分方法[J].计算机工程,2013,39(4):263-266. 被引量：10
9许亚美,卢朝阳,李静,姚超.手写维文字符分割中的多信息融合路径寻优方法[J].西安交通大学学报,2013,47(8):68-73. 被引量：2
10李亚男,陈兴文,张丹.印刷体维文切分算法的改进——基于像素积分投影法和连通域搜索法[J].大连民族学院学报,2014,16(3):315-318. 被引量：5

二级参考文献68

1王华,丁晓青,哈力木拉提.多字体多字号印刷维吾尔文字符识别[J].清华大学学报（自然科学版）,2004,44(7):946-949. 被引量：18
2哈力木拉提,阿孜古丽.多字体印刷维吾尔文字符识别系统的研究与开发[J].计算机学报,2004,27(11):1480-1484. 被引量：36
3靳简明,丁晓青,彭良瑞,王华.印刷维吾尔文本切割[J].中文信息学报,2005,19(5):76-83. 被引量：17
4崔政,李壮.两种改进的模板匹配识别算法[J].计算机工程与设计,2006,27(6):1083-1085. 被引量：26
5靳简明,王华,丁晓青.维汉英混排文档识别[J].电子与信息学报,2006,28(7):1188-1191. 被引量：3
6哈力旦.A,伊力哈木.亚尔买买提,库尔班.买提木沙.复杂背景下维吾尔文字符的分割算法[J].计算机工程与应用,2007,43(20):163-165. 被引量：13
7哈力克·尼亚孜.基础维吾尔语[M].乌鲁木齐:新疆大学出版社,1997.86-88. 被引量：6
8董国君.印刷体俄文文字识别研究[D].乌鲁木齐:新疆大学,2009. 被引量：1
9哈力木拉提.基于轮廓的维吾尔文切分[C]//第十一届全国民族语言文字信息学术研讨会论文集.西双版纳:[出版者不详],2007. 被引量：1
10Amin A, Marl J F. Machine Recognition and Correction of Printed Arabic Text[J]. IEEE Trans. on Systems, Man and Cybernetics, 1989, 19(5): 1300-1306. 被引量：1

共引文献27

1沙尔旦尔·帕尔哈提,阿布都热合曼·卡的尔,阿力木江·亚森.多字体印刷体维-哈-柯文关键词图像识别[J].计算机科学,2022,49(S02):615-620. 被引量：1
2万金娥,袁保社,谷朝,米尔沙力江.沙吾提.基于字符归一化双投影互相关性匹配识别算法[J].计算机应用,2013,33(3):645-647. 被引量：8
3万金娥,袁保社,李晓,谷朝,米尔沙力江.沙吾提.一种改进的印刷体维吾尔文投影切分方法[J].计算机工程,2013,39(4):263-266. 被引量：10
4李亚男,陈兴文,张丹.印刷体维文切分算法的改进——基于像素积分投影法和连通域搜索法[J].大连民族学院学报,2014,16(3):315-318. 被引量：5
5罗佳.一种对粘连英文字符串的快速切分算法研究[J].计算机技术与发展,2014,24(8):59-62. 被引量：3
6贾建忠,龚声蓉,衣马木艾山.阿布都力克木.基于弹性网格混合特征的脱机手写维文识别[J].计算机应用与软件,2014,31(9):172-176. 被引量：1
7赵飞,哈力木拉提.买买提,艾尔肯.赛甫丁.维吾尔新文字大小写同形字母的识别[J].计算机工程与设计,2014,35(10):3674-3678.
8张振东,哈力旦.阿布都热依木,赵永霄.印刷体维吾尔文字符切分自适应算法[J].计算机工程与设计,2014,35(10):3685-3690. 被引量：3
9张鑫,艾斯卡尔.艾木都拉,卡米力.木依丁.脱机手写维吾尔文本行字符粘连区定位及分割[J].激光杂志,2014,35(11):4-10. 被引量：1
10马杰,张小美,苑焕朝.基于并行分离增广拉格朗日乘子法的字符矫正[J].光电子．激光,2015,26(6):1170-1178. 被引量：1

同被引文献38

1张敏,于剑.基于划分的模糊聚类算法[J].软件学报,2004,15(6):858-868. 被引量：176
2靳简明,丁晓青,彭良瑞,王华.印刷维吾尔文本切割[J].中文信息学报,2005,19(5):76-83. 被引量：17
3袁树雄,孙星明.英文文本多重数字水印算法设计与实现[J].计算机工程,2006,32(15):146-148. 被引量：6
4戈国华,肖海波,张敏.基于FCM的数据聚类分析及Matlab实现[J].福建电脑,2007,23(4):89-89. 被引量：8
5刘旻昊,孙堡垒,郭云彪,周琳娜,张茹,钮心忻.文本数字水印技术研究综述[J].东南大学学报（自然科学版）,2007,37(A01):225-230. 被引量：23
6桑红石,赵慧,尚社.多值图像连通域标记ASIC结构设计[J].小型微型计算机系统,2008,29(1):180-184. 被引量：4
7阿地力.依米提,卢朝阳,李静,刘吉超.一种脱机手写维吾尔文切分的方法[J].新疆师范大学学报（自然科学版）,2010,29(4):72-76. 被引量：3
8周爱武,于亚飞.K-Means聚类算法的研究[J].计算机技术与发展,2011,21(2):62-65. 被引量：134
9蒋建洪,赵嵩正,罗玫.词典与统计方法结合的中文分词模型研究及应用[J].计算机工程与设计,2012,33(1):387-391. 被引量：18
10热娜古丽.达古提,地里木拉提.吐尔逊,艾斯卡尔.艾木都拉.基于笔划组合的维吾尔文联机手写单词连体段分割算法[J].计算机应用与软件,2012,29(3):26-27. 被引量：2

引证文献6

1阿丽亚.巴吐尔,木特力铺.马木提,努尔毕亚.亚地卡尔,阿力木江.艾沙,库尔班.吾布力.连体段特征聚类的维吾尔文文档图像单词切分[J].计算机工程与设计,2018,39(3):774-779. 被引量：6
2阿依萨代提.阿卜力孜,加合买提.司马义,卡米力.木依丁,艾斯卡尔.艾木都拉.脱机手写维吾尔文本图像单词切分[J].计算机工程与应用,2018,54(9):133-138. 被引量：2
3周文杰,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于形态学梯度算法的维文文档图像单词切分[J].计算机工程与设计,2019,40(9):2552-2557. 被引量：2
4刘静,沙吾提江·亚森.基于文档结构的维吾尔文文本水印算法[J].陕西理工大学学报（自然科学版）,2019,35(5):33-38.
5霍留磊,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.脱机手写维吾尔单词提取[J].电视技术,2019,43(7):18-25.
6谢智烜,姚红兵,范宁,陈枫.面向多目标透镜的连通域标记检测算法[J].电子科技,2020,33(4):50-54. 被引量：2

二级引证文献9

1周文杰,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于形态学梯度算法的维文文档图像单词切分[J].计算机工程与设计,2019,40(9):2552-2557. 被引量：2
2霍留磊,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.脱机手写维吾尔单词提取[J].电视技术,2019,43(7):18-25.
3李静静,木特力甫·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于层级匹配的维吾尔文关键词文档图像检索[J].计算机工程与设计,2020,41(4):1062-1069. 被引量：4
4徐学斌,吾尔尼沙·买买提,阿力木江·艾沙,朱亚俐,库尔班·吾布力.聚类+连体段判别的维吾尔文档图像单词切分[J].计算机工程与应用,2020,56(14):148-155. 被引量：1
5田瑶琳,陈善雄,赵富佳,林小渝,熊海灵.手写体版面分析和多风格古籍背景融合[J].计算机辅助设计与图形学学报,2020,32(7):1111-1120. 被引量：1
6徐学斌,阿里木江·阿布迪日依木,朱亚俐,阿力木江·艾沙,库尔班·吾布力.基于空间关系的维吾尔文图像关键词检索[J].计算机工程与设计,2021,42(2):497-503.
7费焕强,龚征绛,陈武,查杨,喻擎苍.一种基于机器视觉的高密度穴盘苗寻苗方法[J].热带农业工程,2021,45(5):14-22.
8宋志平,朱亚俐,徐学斌,吾尔尼沙·买买提,库尔班·吾布力.基于灰度直方图与改进Hu不变矩的维吾尔文关键词图像二次检索[J].新疆大学学报（自然科学版）（中英文）,2022,39(3):323-330. 被引量：3
9梁丽华,赵凯,唐琳,王冰,孙玉冰,房家琦.基于模板匹配的身份证号码识别方法研究[J].电脑与电信,2022(4):78-81.

1田峥,徐成,杨志邦,冯堃.智能监控系统中的运动目标检测算法[J].计算机工程,2011,37(4):1-3. 被引量：9
2程浩,王龙海.三维视频中深度信息估计算法[J].武汉工程大学学报,2011,33(9):105-110. 被引量：1
3刘作鹏,张颖超,杨炳儒.快速求正区域的渐增式方法研究[J].微计算机信息,2006(09Z):266-268. 被引量：2
4胡士斌,杨卫平.指纹图像复合分割算法研究[J].计算机工程与应用,2006,42(12):71-73. 被引量：4
5田明浩,冯永新,刘芳.一种长码快速搜索策略研究[J].计算机工程,2009,35(1):266-268. 被引量：3
6王恺,史广顺,王庆人.欧洲文字识别方法研究[J].模式识别与人工智能,2006,19(4):491-496.
7李玉刚.基于遗传算法的PID控制系统[J].电脑知识与技术,2009,5(3X):2190-2192. 被引量：2
8吴守用.基于SVM的哈萨克语文本分类初探[J].现代计算机,2010,16(4):16-19.
9顾李晶,赵霁.基于MODI的文档图像处理的研究[J].自动化技术与应用,2013,32(11):45-47.
10张振东,哈力旦.阿布都热依木,赵永霄.印刷体维吾尔文字符切分自适应算法[J].计算机工程与设计,2014,35(10):3685-3690. 被引量：3

计算机工程与设计

2016年第7期

浏览历史

内容加载中请稍等...

连通域结合重叠度的维吾尔文档图像文字切分被引量：6

参考文献11

二级参考文献68

共引文献27

同被引文献38

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

连通域结合重叠度的维吾尔文档图像文字切分 被引量：6

参考文献11

二级参考文献68

共引文献27

同被引文献38

引证文献6

二级引证文献9

相关作者

相关机构

相关主题

浏览历史

连通域结合重叠度的维吾尔文档图像文字切分被引量：6