改进的K-means算法在维文连体段聚类中的应用被引量：1

Application of improved K-means algorithm in Uyghur word-part clustering

下载PDF

导出

摘要在维吾尔文文字识别中,能否有效地聚类将直接影响识别结果的好坏。为改善聚类效果,针对维吾尔文连体段聚类,提出了一种改进的K-means聚类算法。该算法首先采用等间距法多次选择类中心,然后选择最佳码本和利用有效相似比来动态调整聚类个数K,最后完成了连体段聚类。实验结果表明:与传统K-means算法相比,改进的K-means算法得到了较好聚类效果,聚类正确率达90%以上。 In Uyghur character recognition, the effect of the cluster will affect the recognition rate directly. To improve the clustering result, an improved K-means clustering algorithm based on Uyghur word-part is presented. The first step of the method is to select the center of the clustering by using the equal interval method repeatedly in order to select the best codebook, then adjust the number of clustering classes（noted as K）by using an effective similarity ratio dynamically. Finally, the word-part clustering is completed. The experimental results show that：compared with the traditional K-means algorithm, the improved K-means algorithm gets a better result and the clustering accuracy is more than 90%.

作者张建周哈力木拉提.买买提陈晓娇

机构地区新疆大学信息科学与工程学院多语种信息技术重点实验室

出处《计算机工程与应用》 CSCD 2014年第14期135-138,254,共5页 Computer Engineering and Applications

基金国家自然科学基金(No.61032008 No.61163031 No.60863009)

关键词维吾尔文文字识别连体段聚类算法等间距法有效相似比正确率 Uyghur character recognition word-part clustering algorithm equal interval method effective similarity ratio accuracy

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1哈力木拉提,阿孜古丽.多字体印刷维吾尔文字符识别系统的研究与开发[J].计算机学报,2004,27(11):1480-1484. 被引量：35
2Ying Sun,Qiuming Zhu,Zhengxin Chen.An iterative initial-points refinement algorithm for categorical data clustering[J].Pattern Recognition Letters.2002(7) 被引量：1
3范明,戴冠中,覃森.基于有效性函数的聚类算法[J].计算机科学,2007,34(5):197-199. 被引量：3
4Weiling Cai,Songcan Chen,Daoqiang Zhang.Fast and robust fuzzy c -means clustering algorithms incorporating local information for image segmentation[J].Pattern Recognition.2006(3) 被引量：1
5王华,丁晓青,哈力木拉提.多字体多字号印刷维吾尔文字符识别[J].清华大学学报（自然科学版）,2004,44(7):946-949. 被引量：18
6孙吉贵,刘杰,赵连宇.聚类算法研究[J].软件学报,2008(1):48-61. 被引量：1069
7雷小锋,谢昆青,林帆,夏征义.一种基于K-Means局部最优性的高效聚类算法[J].软件学报,2008,19(7):1683-1692. 被引量：113

二级参考文献32

1李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
2Al-Badr B, Mahmoud A. Survey and bibliography of Arabic optical text recognition [J]. Signal Processing, 1995, 41(1): 49-77. 被引量：1
3Al-Yousefi H, Udpa S. Recognition of Arabic characters [J]. IEEE Trans on PAMI, 1992, 14(8): 853-858. 被引量：1
4Hou H, Andrews H. Cubic splines for image interpolation and digital filtering [J]. IEEE Trans on Acoustics, Speech, and Signal Processing, 1978, 26(6): 508-517. 被引量：1
5Fukunaga K. Introduction to Statistical Pattern Recognition (2nd Edition) [M]. New York: Academic Press, 1990. 被引量：1
6Kimura F, Takashina K, Tsuruoka S. Modified quadratic discriminant functions and the application to Chinese character recognition [J]. IEEE Trans on PAMI, 1987, 9(1): 149-153. 被引量：1
7LIN Xiaofan, DING Xiaoqing, CHEN Ming, et al. Adaptive confidence transform based classifier combination for Chinese character recognition [J]. Pattern Recognition Letters, 1998, 19(10): 975-988. 被引量：1
8Kato N, Suzuki M, Omachi S, et al. A handwritten character recognition system using directional element feature and asymmetric Mahalanobis distance [J]. IEEE Trans on PAMI, 1999, 21(3): 258-262. 被引量：1
9马少平,夏莹,朱小燕.基于模糊方向线素特征的手写体汉字识别[J].清华大学学报（自然科学版）,1997,37(3):42-45. 被引量：37
10.[EB/OL].http://www.ics.uci.edu/～mlearn/MLRepository.html,. 被引量：2

共引文献1212

1吕政阳,邓涛,张丽艳.一种基于机器视觉的飞机钣金件跨粒度识别方法[J].仪器仪表学报,2020,41(2):195-204. 被引量：10
2丁小军,陈杰,李霖,徐碧通,朱晓姝.一种基于聚类结果稳定性来确定聚类数的方法[J].玉林师范学院学报,2020(3):43-47. 被引量：1
3王玥,李文权,梁爽,余静财.基于改进聚类算法的共享汽车网点选址研究[J].武汉理工大学学报,2021,43(2):79-85.
4林耿堃,盛积良.乡村振兴时代背景下农民消费结构变迁研究[J].农业农村部管理干部学院学报,2021(2):76-81. 被引量：3
5高显义,林欣晖.基于文本聚类的变电工程变更特征识别研究[J].建筑经济,2020,41(S02):200-203. 被引量：2
6毛颖颖,杨新凯.融合拓扑势的自适应层次聚类算法研究[J].计算机应用研究,2020,37(S01):37-39.
7张睿恺,吴克河.基于优化特征集的LeNet-5攻击检测模型的态势感知技术[J].计算机应用研究,2020,37(S01):287-289. 被引量：3
8李对红,王裴岩 ,张桂平,张少阳.基于字簇的多模型中文分词方法研究[J].计算机应用研究,2020,37(2):355-359. 被引量：2
9尧少波,蒋励剑,赵文文,卢铮,吴昌聚,陈伟芳.耦合聚类的数据驱动稀薄流非线性本构计算方法[J].航空学报,2022,43(S02):43-56.
10段桂芹.基于改进密度的簇内均值最小距离聚类算法[J].智能计算机与应用,2021,11(12):82-86. 被引量：1

同被引文献8

1蒋建洪,赵嵩正,罗玫.词典与统计方法结合的中文分词模型研究及应用[J].计算机工程与设计,2012,33(1):387-391. 被引量：18
2热娜古丽.达古提,地里木拉提.吐尔逊,艾斯卡尔.艾木都拉.基于笔划组合的维吾尔文联机手写单词连体段分割算法[J].计算机应用与软件,2012,29(3):26-27. 被引量：2
3万金娥,袁保社,李晓,谷朝,米尔沙力江.沙吾提.一种改进的印刷体维吾尔文投影切分方法[J].计算机工程,2013,39(4):263-266. 被引量：10
4李亚男,陈兴文,张丹.印刷体维文切分算法的改进——基于像素积分投影法和连通域搜索法[J].大连民族学院学报,2014,16(3):315-318. 被引量：5
5张振东,哈力旦.阿布都热依木,赵永霄.印刷体维吾尔文字符切分自适应算法[J].计算机工程与设计,2014,35(10):3685-3690. 被引量：3
6尹芳,李全通,周昕,金飞虎.一种基于连通域搜索的英文单词切分方法[J].哈尔滨理工大学学报,2014,19(5):109-112. 被引量：1
7朱兰,袁保社,余伟.基于滴水算法的印刷体维吾尔文切分方法[J].计算机技术与发展,2015,25(7):107-110. 被引量：5
8姑丽祖热.吐尔逊,尤努斯.艾沙,吐尔根.依布拉音,库尔班.吾布力.连通域结合重叠度的维吾尔文档图像文字切分[J].计算机工程与设计,2016,37(7):1892-1897. 被引量：6

引证文献1

1阿丽亚.巴吐尔,木特力铺.马木提,努尔毕亚.亚地卡尔,阿力木江.艾沙,库尔班.吾布力.连体段特征聚类的维吾尔文文档图像单词切分[J].计算机工程与设计,2018,39(3):774-779. 被引量：6

二级引证文献6

1周文杰,木特力铺·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于形态学梯度算法的维文文档图像单词切分[J].计算机工程与设计,2019,40(9):2552-2557. 被引量：2
2霍留磊,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.脱机手写维吾尔单词提取[J].电视技术,2019,43(7):18-25.
3李静静,木特力甫·马木提,吾尔尼沙·买买提,阿力木江·艾沙,库尔班·吾布力.基于层级匹配的维吾尔文关键词文档图像检索[J].计算机工程与设计,2020,41(4):1062-1069. 被引量：4
4徐学斌,吾尔尼沙·买买提,阿力木江·艾沙,朱亚俐,库尔班·吾布力.聚类+连体段判别的维吾尔文档图像单词切分[J].计算机工程与应用,2020,56(14):148-155. 被引量：1
5田瑶琳,陈善雄,赵富佳,林小渝,熊海灵.手写体版面分析和多风格古籍背景融合[J].计算机辅助设计与图形学学报,2020,32(7):1111-1120. 被引量：1
6徐学斌,阿里木江·阿布迪日依木,朱亚俐,阿力木江·艾沙,库尔班·吾布力.基于空间关系的维吾尔文图像关键词检索[J].计算机工程与设计,2021,42(2):497-503.

1韩晓红,胡彧.K-means聚类算法的研究[J].太原理工大学学报,2009,40(3):236-239. 被引量：45
2占明锋,邢昌风,石章松,王成飞.一种基于相似比的最近邻协同定位算法[J].舰船科学技术,2010,32(1):115-119. 被引量：1
3王恒厂,闫方,陈春阳,葛旺.基于MATLAB的复杂型面数控加工编程[J].机械制造与自动化,2016,45(1):111-114. 被引量：2
4谢涛,袁江波.基于MATLAB数控编程数值预处理[J].机械工程师,2007(5):113-114. 被引量：1
5张爱华,盛飞,杨培,常康康.基于相似比的快速分形编码算法[J].计算机技术与发展,2012,22(11):176-178. 被引量：7
6Katia Stankov,Dong-Chen He.Using the Spectral Similarity Ratio and Morphological Operators for the Detection of Building Locations in Very High Spatial Resolution Images[J].通讯和计算机（中英文版）,2013,10(3):309-324. 被引量：1
7汪明华,李高平.基于相似比的变邻域搜索的快速分形编码算法[J].西南民族大学学报（自然科学版）,2016,42(6):682-687. 被引量：2
8孙祥国,王春,张良栋.基于宏程序的抛物线形零件的数控加工[J].煤矿机械,2012,33(6):128-130. 被引量：3
9焦光伟,侯建红.覆土油罐护体振动台模型试验相似比的设计研究[J].中国储运,2012(3):117-119.
10沈妮娜.《位似图形》教学设计[J].中国信息技术教育,2015(3):46-48.

计算机工程与应用

2014年第14期

浏览历史

内容加载中请稍等...

改进的K-means算法在维文连体段聚类中的应用被引量：1

参考文献7

二级参考文献32

共引文献1212

同被引文献8

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

改进的K-means算法在维文连体段聚类中的应用 被引量：1

参考文献7

二级参考文献32

共引文献1212

同被引文献8

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

改进的K-means算法在维文连体段聚类中的应用被引量：1