-
题名基于数字结构特征的发票号码识别算法
被引量:8
- 1
-
-
作者
崔文成
任磊
刘阳
邵虹
-
机构
沈阳工业大学信息科学与工程学院
-
出处
《数据采集与处理》
CSCD
北大核心
2017年第1期119-125,共7页
-
基金
辽宁省自然科学基金(201202162)资助项目
辽宁省高等学校优秀人才支持计划(LJQ2013013)资助项目
-
文摘
由于印章覆盖、发票折痕等干扰因素的存在,一些发票号码区域会出现噪声粘连区域,这些区域会导致发票号码无法正常分割。针对这一问题,提出了噪声粘连区域修复算法,有效地避免了该情况对数字分割的影响。针对普通发票号码的字体结构和特点,提出了基于数字结构特征的发票号码识别算法。首先定义数字结构特征,包括4种填充区域、2种字符穿越数和4种镂空区域,构成待识别数字的10维特征向量;进而与标准模板库中数字进行模板特征匹配,求得距离最小值所对应的数字作为识别结果。将所提出的方法和基于改进的左右轮廓特征的印刷体数字识别方法进行对比,实验结果表明,本文所提出的识别算法拥有更高的准确率和更快的识别速度,以及对噪声有更强的鲁棒性。
-
关键词
发票号码识别
噪声粘连区域
数字结构特征
-
Keywords
invoice number recognition
noise adhesion area
numerical structure characteristics
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-