-
题名农业文献知识获取中斜体字符识别技术的应用研究
被引量:2
- 1
-
-
作者
金花
朱亚涛
靳志强
-
机构
河北农业大学
-
出处
《河北农业大学学报》
CAS
CSCD
北大核心
2015年第6期124-128,共5页
-
基金
河北省高等学校科学技术研究青年基金(Z2012142)
保定市科学技术研究与发展指导计划项目(13ZN025
+2 种基金
13ZF098)
保定市科学技术协会自然科学课题(KX2013A20)
河北农业大学理工基金项目(LG20120604)资助
-
文摘
传统的光学字符识别(OCR)系统中,由于训练的样本中并没有包括斜体字符,导致系统无法正确识别出斜体字符,这对农业文献的知识获取造成了一定的影响。针对这个问题,提出了一种斜体字符检测和纠正的方法。首先将文本行分割成单词,并进一步细分为单个字符,然后分别检测各个字符的形态特征,并依此判断出单词的形态,最后收集检测为斜体结果的所有单词,并利用这些单词计算出斜体字符的准确角度并加以纠正。经农业文献知识获取的实践结果证明,该方法能取得很好的检测和纠正效果。
-
关键词
OCR
斜体检测
斜体校正
农业知识获取
-
Keywords
OCR
italic detection
italic correction
agricultural knowledge acquisition
-
分类号
TP39
[自动化与计算机技术—计算机应用技术]
-