摘要
主要介绍了一种借助于OpenCV (开源计算机视觉库)、Tesseract-OCR (Google的开源光学字符识别引擎),以及用Python语言对Tesseract-OCR引擎的相关接口封装的Pytesseract模块,实现图像上的字符识别。使用OpenCV对图像进行一系列预处理,如读取、色彩空间转换、图像的降噪以及图像阈值化处理等操作后,使用Pytesseract模块将处理后的图像传入Tesseract-OCR中,实现了较准确的英文字符识别。
出处
《电脑编程技巧与维护》
2019年第6期45-49,共5页
Computer Programming Skills & Maintenance
基金
大学生创新创业项目,省级创新训练项,项目编号:201810172213