期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
中文科技文档中的数学表达式定位 被引量:4
1
作者 张志伟 孔凡让 +2 位作者 刘维来 龙潜 刘永斌 《中文信息学报》 CSCD 北大核心 2007年第4期86-91,共6页
数学表达式定位是印刷体数学表达式识别的前提。针对中文科技文档,分别对独立表达式和内嵌表达式的定位问题提出了新的方法。采用自适应神经模糊推理系统(ANFIS)对行特征进行分类,提取出独立表达式;采用模糊聚类和动态规划方法,从文档... 数学表达式定位是印刷体数学表达式识别的前提。针对中文科技文档,分别对独立表达式和内嵌表达式的定位问题提出了新的方法。采用自适应神经模糊推理系统(ANFIS)对行特征进行分类,提取出独立表达式;采用模糊聚类和动态规划方法,从文档中依次提取出汉字、中文标点和英文字符,利用启发式规则合并剩余的数学符号而提取出内嵌表达式。实验表明,提出的表达式定位方法有很高的正确率。 展开更多
关键词 人工智能 模式识别 数学表达式定位 自适应神经模糊推理系统 模糊聚类 中英文分离
下载PDF
从Postscript格式文献中提取数学公式的方法
2
作者 张志伟 孔凡让 柴华 《数据采集与处理》 CSCD 北大核心 2008年第4期454-458,共5页
从Postscript格式文献中提取识别数学公式,是数学公式识别领域的一个新的研究方向。主要针对以Word和Latex为生成源的Postscript文档,提出了基于内容的数学公式提取方法。首先重载了Postscript语言中的一些相关命令,先后提取出Postscrip... 从Postscript格式文献中提取识别数学公式,是数学公式识别领域的一个新的研究方向。主要针对以Word和Latex为生成源的Postscript文档,提出了基于内容的数学公式提取方法。首先重载了Postscript语言中的一些相关命令,先后提取出Postscript文档中的字符及由线段连接得到的图形。然后根据字符名称、字体信息、位置信息对字符进行判断分析,提取出其中的数学符号;对提取出的图形,进行编码以识别出其对应的数学符号。最后,根据得到的数学符号之间的空间位置关系,借助启发式规则,将数学符号合并,提取出完整的数学公式。实验结果表明,该方法数学符号识别的正确率达到99.3%。 展开更多
关键词 数学公式提取 POSTSCRIPT 启发式规则
下载PDF
Postscript格式科技文献中数学表达式的提取方法 被引量:4
3
作者 张志伟 孔凡让 吴欣 《计算机应用与软件》 CSCD 北大核心 2008年第11期157-159,162,共4页
从Postscript格式的科技文献中提取识别数学表达式,是数学表达式识别领域的一个新的研究方向。主要针对以Word和Latex为生成源的PS文档,提出了基于内容的数学表达式提取方法。首先重载了PS语言中的一些相关命令,以提取PS文档中的字符与... 从Postscript格式的科技文献中提取识别数学表达式,是数学表达式识别领域的一个新的研究方向。主要针对以Word和Latex为生成源的PS文档,提出了基于内容的数学表达式提取方法。首先重载了PS语言中的一些相关命令,以提取PS文档中的字符与线段信息;之后根据字符名称、字体、位置等信息对字符进行分析,同时连接线段并加以识别,从而提取出数学符号;最后,根据符号问的空间位置关系和启发式规则,将数学符号归并,提取出最终的表达式。实验结果表明该方法正确率达到98.56%。 展开更多
关键词 数学表达式提取 POSTSCRIPT 文本抽取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部