-
题名基于模糊分类的印刷体数学公式抽取方法
被引量:2
- 1
-
-
作者
田学东
郝楠
-
机构
河北大学数学与计算机学院
-
出处
《计算机应用》
CSCD
北大核心
2007年第8期2036-2037,2065,共3页
-
基金
河北省科学技术研究与发展计划资助项目(06213598)
-
文摘
公式抽取是印刷体数学公式识别的基础性环节,现有的识别方法多以公式区域已知为前提,相关的研究还很欠缺。通过引入模糊分类理论,提出了一种孤立数学公式的抽取算法,通过对大量训练样张的数据统计与分析,选取了非规则度、宽高比、密度等6维特征,由此构建出对孤立公式行、文本行、标题行的模糊分类规则,实现了孤立公式行的抽取。实验结果表明,该方法有较高的准确性和鲁棒性。
-
关键词
印刷体数学公式识别
公式抽取
模糊分类
-
Keywords
printed mathematical formula recognition
formula extraction
fuzzy classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-