-
题名基于网格分解的东巴象形文字分类算法研究
被引量:3
- 1
-
-
作者
杨玉婷
康厚良
-
机构
苏州市职业大学计算机工程学院
苏州市职业大学体育部
-
出处
《软件导刊》
2019年第9期196-198,共3页
-
基金
云南省科学研究基金项目(2018JS748)
-
文摘
东巴文字作为人类早期的一种向象形文字、标音文字过渡的图画文字形式,既具有图画文字以图表意特点,又具有现代文字使用简单线条表达含义的特点。东巴文字本身的复杂性使其相关研究一直较少且连贯性不强。从东巴文字的构字要素入手,通过分析东巴文字的组成要素、结构特征及造字习惯,给出适用于东巴象形文字的预处理及基于网格分解的分类识别算法。该算法思路简单、复杂度低、易于实现,能够快速实现不同类型东巴文字的检索和识别,具有较好的缩放和平移不变性,从而为东巴文字的造字研究提供强有力的技术支持,也为研究其它象形文字的检索和识别技术提供重要参考。
-
关键词
网格分解
分类识别算法
东巴象形文字
-
Keywords
grid resolution
classification algorithm
dongba hieroglyph
-
分类号
TP317.4
[自动化与计算机技术—计算机软件与理论]
-
-
题名东巴象形文字文档图像的文本行自动分割算法研究
- 2
-
-
作者
康厚良
杨玉婷
-
机构
苏州市职业大学体育部
苏州市职业大学计算机工程学院
-
出处
《图学学报》
CSCD
北大核心
2022年第5期865-874,共10页
-
基金
苏州市职业大学引进人才科研启动金项目(201905000034)。
-
文摘
以卷积神经网络(CNN)为代表的深度学习技术在图像分类和识别领域表现出了非常优异的性能。但东巴象形文字未有标准、公开的数据集,无法借鉴或使用已有的深度学习算法。为了快速建立权威、有效的东巴文字库,分析已出版东巴文档的版面结构,从文档中提取文本行、东巴字成为了当前的首要任务。因此,结合东巴象形文字文档图像的结构特点,给出了东巴文档图像的文本行自动分割算法。首先利用基于密度和距离的k-均值聚类算法确定了文本行的分类数量和分类标准;然后,通过文字块的二次处理矫正了分割中的错误结果,提高了算法的准确率。在充分利用东巴字文档结构特征的同时,保留了机器学习模型客观、无主观经验影响的优势。通过实验表明,该算法可用于东巴文档图像、脱机手写汉字、东巴经的文本行分割,以及文本行中东巴字和汉字的分割,具有实现简单、准确性高、适应性强的特点,从而为东巴文字库的建立奠定基础。
-
关键词
东巴象形文字
东巴文档分析
文本行分割
投影分割
d-K-means
-
Keywords
dongba hieroglyph
dongba documents analysis
text line segmentation
projection segmentation
d-K-means
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名东巴象形文字特征部件的自动计算与提取算法
- 3
-
-
作者
康厚良
杨玉婷
-
机构
苏州市职业大学体育部
苏州市职业大学计算机工程学院
-
出处
《湖北民族大学学报(自然科学版)》
CAS
2020年第2期158-164,共7页
-
基金
国家社会科学基金项目(15BTY038)
云南省科学研究基金项目(2019J1152,2018JS748)
苏州市职业大学引进人才科研启动金项目(201905000034).
-
文摘
在形状匹配领域中,部件表示法是一种应用十分广泛的方法,它能够有效提高形状识别算法的健壮性,并且在形状分类理论中也发挥着重要作用.因此,深入分析东巴象形文字的图画特征,结合形状匹配领域中的部件表示法,给出了适用于东巴象形文字特征部件的自动计算及提取算法.该算法通过双分辨率采样使得到的特征部件既具有完整性且相互独立,又保留了文字较多的局部细节特征,并且只需少量样本就能准确计算同类字符的特征部件数量.该算法具有良好的尺度、平移和旋转不变性,并且在输入字符存在局部几何扭曲或较多噪音点时也具有较好的鲁棒性.与传统的形状局部特征曲线提取算法相比,该算法对特征部件的提取,以及字符所包含的部件数量计算都是自动完成的,不需要过多的人为干预,从而为东巴文字的相似性比较、检索和识别研究奠定基础,同时也为其他象形文字的研究提供技术参考.
-
关键词
东巴字
象形文字
特征部件
部件表示法
部件的自动提取
-
Keywords
dongba hieroglyph
hieroglyph
feature parts
part-based representation
automatic calculation of parts
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于CDPM的东巴象形文字预处理算法
被引量:1
- 4
-
-
作者
杨玉婷
康厚良
-
机构
昆明理工大学津桥学院电气与信息工程学院
云南经济管理学院人文艺术学院
-
出处
《计算机与数字工程》
2019年第2期417-422,共6页
-
基金
云南省教育厅科学研究基金项目(编号:2018JS748)
国家社会科学基金项目(编号:15BTY038)资助
-
文摘
东巴文是一种十分原始的图画象形文字,为了表达丰富的含义,纳西先民往往在基本构字元素的基础上采用加缀或变形的方式来扩充文字,但是其中增加的额外元素给文字的特征提取及识别带来了巨大的干扰。因此,通过分析东巴象形文字的文字结构和特征,给出了基于CDPM的东巴象形文字预处理算法,该算法能够快速去除东巴字中的部分形变、离散的和具有粘连性的缀加元素,使得到的轮廓曲线能准确反映文字的本质特征。通过差异性、可扩展性、准确性和一致性等实验表明,基于CDPM的预处理算法使同类型的东巴字能够得到几乎一致的特征曲线,而不同类型的东巴字的特征曲线又能具有明显的差异性,从而为东巴文字的快速分类、检索和识别提供保证,也为其他象形文字的预处理研究提供有益参考。
-
关键词
东巴文字
预处理
CDPM
变形字
加缀字
-
Keywords
dongba hieroglyph
preprocessing
CDPM
variant word
affix word
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名基于离散曲线演化的东巴象形文字特征曲线简化算法
- 5
-
-
作者
杨玉婷
康厚良
-
机构
云南开放大学文化旅游学院
云南经济管理学院人文艺术学院
-
出处
《计算机与现代化》
2019年第9期12-16,共5页
-
基金
国家社会科学基金资助项目(15BTY038)
云南省科学研究基金资助项目(2018JS748)
-
文摘
东巴文是一种十分原始的图画象形文字,作为人类早期图画文字向象形文字、标音文字过渡的文字形式,它既具有图画文字以图表意,又具有现代文字使用简单线条表意的特点。因此,从文字的结构要素入手,通过分析东巴象形文字的构字特点,结合计算机视觉中形状简化的相关研究成果,给出基于离散曲线演化的东巴象形文字特征曲线简化算法。通过大量实验表明,该算法能够有效去除特征曲线中的冗余点及噪音点,突出字符的本质特征,降低相似性度量的计算量,从而为东巴象形文字的检测和识别奠定坚实的基础。
-
关键词
特征曲线简化
离散曲线演化
东巴象形文字特征
文字特征提取
-
Keywords
simplification of feature curve
discrete curve evolution
feature of dongba hieroglyph
feature extraction of glyphic
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-