基于最大梯度差的叠加文本定位被引量：1

Graphics text detection with max gradient difference

下载PDF

导出

摘要通过分析文本特征和背景,提出一种基于最大梯度差的叠加文本定位算法。首先获得横向和竖向两个方向的梯度图像,然后设定一个窗口扫描整个图像,分别计算窗口内的最大梯度差,得到两个方向的最大梯度差矩阵,然后分别通过自适应阈值算法找出疑似文本像素,再将两个方向的判决结果取交集,消除部分复杂背景造成的误判。接着利用数学形态学运算和先验知识剔除伪文本区。最后利用改进的穿越线算法精确定位文本。实验表明,本算法不仅对横向文本具有较高的查全率和较低的虚警率,并且对竖向文本也有较好的定位效果。 This paper proposed an algorithm with max gradient difference by analyzing the text feature. It firstly calculated the gradient of two direct, vertical and horizontal. And then it got the max gradient different matrix by calculating the max gradient difference in a window. Then, it took an adaptive threshold algorithm to determine the text pixels, and calculated the intersec- tion of two results in order to eliminate the influence of part of the complex background. It conducted mathematical morphology operation and prior knowledge to eliminate the false text area. Finally, it used the improved across-line algorithm for precise locating of text. Experiments show that this algorithm not only has higher recall ratio of transverse text, and also has good effect for vertical text.

作者高士林吉立新高超

机构地区国家数字交换系统工程技术研究中心

出处《计算机应用研究》 CSCD 北大核心 2014年第10期3173-3176,共4页 Application Research of Computers

基金国家"863"计划资助项目(2011AA010603 2011AA010605)

关键词最大梯度差叠加文本文本定位穿越线算法 max gradient difference graphics text text detection across-line algorithm

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1ANTONACOPOULOS A, KARATZAS D.An anthropocentric approach to text extraction from WWW images[C]//Proc of the 4th IAPR Workshop on Document Analysis Systems.New York:ACM Press,2000:515-526. 被引量：1
2ZHONG Yu, KARU K, JAIN A K.Locating text in complex color images[J].Pattern Recognition,1995,28(10):1523-1535. 被引量：1
3LIU Chun-mei, WANG Chun-heng, DAI Ru-wei.Text detection in images based on unsupervised classification of edge-based features[C]//Proc of the 8th International Conference on Document Analysis and Recognition.[S.l.]:IEEE Press,2005:610-614. 被引量：1
4YE Qi-xiang, HUANG Qing-ming, GAO Wen, et al.Fast and robust text detection in images and video frames[J].Image and Vision Computing,2005,23(6):565-576. 被引量：1
5PHAN T Q, SHIVAKUMARA P, TAN C L.A Laplacian method for video text detection[C]//Proc of the 10th International Conference on Document Analysis and Recognition.[S.l.]:IEEE Press,2009:66-70. 被引量：1
6SHIVAKUMARA P, PHAN T Q, TAN C L.A gradient difference based technique for video text detection[C]//Proc of the 10th International Conference on Document Analysis and Recognition.[S.l.]:IEEE Press,2009:156-160. 被引量：1
7田破荒,彭天强,李弼程.基于文字穿越线和笔画连通性的视频文字提取方法[J].电子学报,2009,37(1):72-78. 被引量：10
8SHIVAKUMARA P, PHAN T Q, TAN C L.A Laplacian approach to multi-oriented text detection in video[J].IEEE Trans on Pattern Analysis and Machine Intelligence,2011,33(2):412-419. 被引量：1
9WONG E K, CHEN M.A new robust algorithm for video text extraction[J].Pattern Recognition,2003,36(6):1397-1406. 被引量：1

二级参考文献12

1R Lienhart, A Wemicke. Localizing and segmenting text in images, videos [ J ]. IEEE Transactions on Circuits Syst Video Technol, 2002,12(4) :256 - 268. 被引量：1
2Agnihotri L, Dimitrova N. Text detection for video analysis [ A]. IEEE Workshop on Content-Based Access of Image and Video Libraries [C ]. Fort Collins, CO, USA: IEEE Press, 1999.109 - 113. 被引量：1
3K Jain, B Yu. Automatic text location in images and video frames[ J]. Pattern recognition, 1998,31(12) :2055 - 2076. 被引量：1
4Wenge Mao,Fu-lai Chung,Lam, K K M, Wan-chi Sun.Hybrid Chinese/English text detection in images and video frames [ A]. Proceedings of 16th International Conference on Pattern Recognition, 2002 [C ]. Washington, DC, USA: IEEE Computer Society,Volume (3) ,Aug 2002. 1015 - 1018. 被引量：1
5J Gllavata, R Ewerth, B Freisleben. A text detection, localization and segmentation system for OCR in images[A]. Proceedings of the 1EEE Sixth International Symposium on Multimedia Software Engineering[ C]. Washington, DC, USA :IEEE Computer Society,2004.310 - 317. 被引量：1
6Michael R Lyu, Jiqiang Song, Min Cal. A comprehensive method for multilingual video text detection, localization, and extraction[J ]. IEEE Transaction on circuits and systems for video technology, 2005,15(2) :243 - 255. 被引量：1
7D Chen,K Shearer,H Bourlard. Text enhancement with asymmelric filter for vdeo OCR[A]. In Proceedings of 11 th International Conference Image Analysis Processing [ C ]. Palermo, I taly: IEEE Press,2001,192 - 197. 被引量：1
8T Sato, T Kanade, E K Hughes, M A Smith. Video OCR for digital news archive [ A ]. In Proceedings of IEEE Workshop Content-Based Access Image Video Database[ C]. Bombay, India: IEEE Press, 1998,52 - 60. 被引量：1
9C Ding,X He,H Zha,M Gu,H Simon. A rnin-max cut algorithm for graph partitioning and data clustering [A]. In Proceedings of IEEE International Conference Data Mining [ C ]. San Jose,CA,USA:IEEE Press,2001,107 - 114. 被引量：1
10S U Lee,S Y Chung,R H Park. A comparative performance study of several global thresholding techniques for segmentation[J]. Computer Vision, Graphics and Image Processing, 1990,52(2) : 171 - 190. 被引量：1

共引文献9

1叶利华.视频标签检测与识别[J].制造业自动化,2011,33(6):95-98. 被引量：1
2哈力旦.A,库尔班.买提木沙.基于小波变换的图像中维吾尔文字定位[J].计算机工程,2011,37(8):197-198. 被引量：10
3张建明,王娟,张菊,杜丹,房芳.基于条件笔画密度提取的文本定位方法[J].计算机工程与设计,2011,32(10):3446-3449. 被引量：4
4苏畅,胡晓冬,王斌辅,尚凤军.基于笔画相关加权的视频图像文字识别[J].计算机应用,2012,32(8):2305-2308. 被引量：4
5姜维,卢朝阳,李静,刘晓佩,姚超.基于视觉显著性与文字置信图的场景文字的背景抑制方法[J].电子学报,2015,43(1):62-68. 被引量：7
6赵洁,罗丹,樊李行,曹梦琪,耿耀君.农业科教视频中文字信息提取算法[J].数字技术与应用,2018,36(6):129-130.
7涂宇,王怡,吴志海,刘爱云.基于卷积神经网络的标签文字提取算法研究[J].衡阳师范学院学报,2019,40(6):31-33.
8魏晗,郭志刚,唐永旺.数字图像处理课程综合性实验的设计与实践[J].河南教育（高教版）（中）,2021(4):64-66.
9林涵阳,詹永照,陈羽中.复杂场景中机动车行驶证快速检测与识别[J].小型微型计算机系统,2019,40(5):1076-1082. 被引量：1

同被引文献7

1李闯,丁晓青,吴佑寿.一种基于直方图特征和AdaBoost的图像中的文字定位算法[J].中国图象图形学报,2006,11(3):325-331. 被引量：16
2付光远.一种基于Sobel分解算子的图像边缘检测并行算法[J].微电子学与计算机,2006,23(9):132-134. 被引量：18
3孙红星,赵楠楠,徐心和.基于小波变换和SVM的文本区域定位[J].东北大学学报（自然科学版）,2007,28(2):165-168. 被引量：7
4付忠良.关于AdaBoost有效性的分析[J].计算机研究与发展,2008,45(10):1747-1755. 被引量：47
5程豪,黄磊,刘昌平,谭怒涛.基于笔画和Adaboost的两层视频文字定位算法[J].自动化学报,2008,34(10):1312-1318. 被引量：10
6张建明,王娟,张菊,杜丹,房芳.基于条件笔画密度提取的文本定位方法[J].计算机工程与设计,2011,32(10):3446-3449. 被引量：4
7尹芳,陈德运,吴锐.改进的Gabor小波变换特征提取方法[J].计算机工程,2012,38(15):145-147. 被引量：5

引证文献1

1尹芳,郑亮,陈田田.基于Adaboost算法的场景中文文本定位[J].计算机工程与应用,2017,53(4):200-204. 被引量：6

二级引证文献6

1李心蕾,王昊,刘小敏,邓三鸿.面向微博短文本分类的文本向量化方法比较研究[J].数据分析与知识发现,2018,2(8):41-50. 被引量：14
2路雪,刘坤,程永翔.一种深度学习的非机动车辆目标检测算法[J].计算机工程与应用,2019,55(8):182-188. 被引量：14
3池凯,赵逢禹.改进EAST算法的游戏场景文本检测[J].小型微型计算机系统,2020,41(10):2189-2193. 被引量：8
4仝光,李解,徐飞,周汉杰.基于机器视觉与物联网云平台的无人扫路车路径规划系统设计[J].中国工程机械学报,2021,19(6):518-523. 被引量：2
5路鑫,杨硕.基于特征点的电影字幕提取[J].沈阳化工大学学报,2023,37(2):178-185.
6郑建云,刘军华,雷超阳.基于AdaBoost算法的数字图像文字识别与撷取研究[J].钦州学院学报,2019,34(1):44-49.

1侯发忠,周支元.基于形态学梯度差的车牌定位算法[J].科学技术与工程,2008,8(12):3355-3358. 被引量：2
2高赞,姜威,朱孔凤.基于最大梯度和阈值的自动聚焦算法[J].电子测量与仪器学报,2007,21(5):49-54. 被引量：11
3濮永仙.基于支持向量机与多特征选择的农作物彩色病斑边缘检测[J].计算机系统应用,2014,23(9):118-123. 被引量：3
4邹晔,宋永献.基于最大梯度差算法的扇形扫描车牌定位方法[J].计算机工程与设计,2008,29(19):5137-5139. 被引量：1
5晋瑾,平西建,张涛,陈明贵.图像中的文本定位技术研究综述[J].计算机应用研究,2007,24(6):8-11. 被引量：17
6王国松.进程管理器[J].电脑编程技巧与维护,2008(3):20-31. 被引量：1
7邓坚瑾,田金文.基于视差估计的图像双向匹配[J].计算机与数字工程,2015,43(12):2260-2265.
8党向盈,吴锡生,赵勇.基于边缘最大梯度的多方向优化插值算法[J].计算机应用研究,2007,24(9):317-320. 被引量：14
9薛峰,张佑生,江巨浪,偶春生.基于最大梯度和灰度相关的两步全景图拼接算法[J].系统仿真学报,2005,17(12):2965-2968. 被引量：17
10刘洲峰,王九各,赵全军,李春雷.基于改进自适应阈值的织物疵点检测算法研究[J].微型机与应用,2013,32(10):38-40. 被引量：4

计算机应用研究

2014年第10期

浏览历史

内容加载中请稍等...

基于最大梯度差的叠加文本定位被引量：1

参考文献9

二级参考文献12

共引文献9

同被引文献7

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于最大梯度差的叠加文本定位 被引量：1

参考文献9

二级参考文献12

共引文献9

同被引文献7

引证文献1

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于最大梯度差的叠加文本定位被引量：1