基于深度学习的场景文字检测与识别被引量：35

Deep learning for scene text detection and recognition

导出

摘要场景文字检测与识别是一种通用文字识别技术,已成为近年来计算机视觉与文档分析领域的热点研究方向.其被广泛应用于地理定位、车牌识别、无人驾驶等领域.相对于传统的文档文字检测和识别,场景文字在字体、尺度、排布、背景等方面变化更加剧烈,深度学习技术也由于卓越的性能成为该领域的主流方法.本文主要回顾了作者基于深度学习在此领域取得的代表性成果,并对此领域未来研究趋势进行了展望. Scene text detection and recognition is a universal text recognition technology, which has become a hot research topic in the field of computer vision and document analysis in recent years. It is widely applied in geographical positioning, license plate recognition, and driverless applications. Compared to traditional document text detection and recognition, scene text varies more dramatically in font, color, scale, layout, and background.Owing to its excellent performance, deep learning has been widely adopted in this field. In this paper, we mainly review our representative studies based on deep learning in this field and describe the future research trends in this field.

作者白翔杨明锟石葆光廖明辉 Xiang BAI;Mingkun YANG;Baoguang SHI(Minghui LIAO School of Electronic Information and Communications, Huazhong University of Science and Technology, Wuhan 430074, Chin)

机构地区华中科技大学电子信息与通信学院

出处《中国科学：信息科学》 CSCD 北大核心 2018年第5期531-544,共14页 Scientia Sinica(Informationis)

基金国家自然科学基金(批准号:61733007 61222308 61573160) 数字出版技术国家重点实验室开放课题(批准号:F2016001)资助项目

关键词深度学习场景文字文字检测文字识别计算机视觉 deep learning scene text text detection text recognition computer vision

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP391.41 [自动化与计算机技术—控制科学与工程]

引文网络
相关文献

参考文献1

1Yingying ZHU,Cong YAO,Xiang BAI.Scene text detection and recognition： recent advances and future trends[J].Frontiers of Computer Science,2016,10(1):19-36. 被引量：22

二级参考文献98

1Tsai S S, Chen H, Chen D, Schroth G, Grzeszczuk R, Girod B. Mobile Yingying ZHU et al. Scene text detection and recognition: recent advances and future trends visual search on printed documents using text and low bit-rate features. In: Proceedings of the 18th IEEE International Conference on Image Processing. 2011, 2601-2604. 被引量：1
2Barber D B, Redding J D, McLain T W, Beard R W, Taylor CN. Vision-based target geo-location using a fixed-wing miniature air vehi?cle. Journal of Intelligent and Robotic Systems, 2006, 47(4): 361-382. 被引量：1
3Kisacanin B, Pavlovic V, Huang T S. Real-time vision for human?computer interaction. Springer Science and Business Media, 2005. 被引量：1
4DeSouza G N, Kak A C. Vision for mobile robot navigation: a sur?vey. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2002,24(2): 237-267. 被引量：1
5Ham Y K, Kang M S, Chung H K, Park R H, Park G T. Recognition of raised characters for automatic classification of rubber tires. Optical Engineering. 1995, 34(1): 102-109. 被引量：1
6Yao C, Zhang X, Bai X, Liu W, Tu Z. Rotation-invariant features for multi-oriented text detection in natural images. PloS one, 2013, 8(8): e70173. 被引量：1
7Yao C, Bai X, Shi B, Liu W. Strokelets: A learned multi-scale represen?tation for scene text recognition. In: Proceedings of IEEE Conference on Computer Vision and Pattern Recognition. 2014, 4042-4049. 被引量：1
8Chen X, Yuille A L. Detecting and reading text in natural scenes. In: Proceedings of 2004 IEEE Computer Society Conference on Computer Vision and Pattern Recognition. 2004, 2. 被引量：1
9Epshtein B, Ofek E, Wexler Y. Detecting text in natural scenes with stroke width transform. In: Proceedings of 2010 IEEE Conference on Computer Vision and Pattern Recognition. 2010, 2963-2970. 被引量：1
10Neumann L, Matas J. A method for text localization and recognition in real-world images. Lecture Notes in Computer Science, 2011, 6494, 770-783. 被引量：1

共引文献21

1王润民,桑农,丁丁,陈杰,叶齐祥,高常鑫,刘丽.自然场景图像中的文本检测综述[J].自动化学报,2018,44(12):2113-2141. 被引量：54
2张矿,朱远平.基于超像素融合的文本分割[J].计算机应用,2016,36(12):3418-3422. 被引量：2
3杨飞.自然场景图像中的文字检测综述[J].电子设计工程,2016,24(24):165-168. 被引量：12
4李翌昕,马尽文.文本检测算法的发展与挑战[J].信号处理,2017,33(4):558-571. 被引量：8
5Junge ZHANG,Kaiqi HUANG,Tieniu TAN,Zhaoxiang ZHANG.Local structured representation for generic object detection[J].Frontiers of Computer Science,2017,11(4):632-648. 被引量：1
6朱盈盈,张拯,章成全,张兆翔,白翔,刘文予.适用于文字检测的候选框提取算法[J].数据采集与处理,2017,32(6):1097-1106. 被引量：2
7刘美华,傅彩明,梁开健,周细凤.应用MSER和局部二值化的网络图片文本定位[J].光电子．激光,2018,29(6):660-668. 被引量：2
8陈晓龙,陈显龙,袁建平,高宇豆,张加其.基于深度学习的电力设备铭牌识别[J].广西大学学报（自然科学版）,2018,43(6):2216-2226. 被引量：15
9陈硕,郑建彬,詹恩奇,汪阳.基于笔画角度变换和宽度特征的自然场景文本检测[J].计算机应用研究,2019,36(4):1270-1274. 被引量：4
10Anna ZHU,Seiichi UCHIDA.Scene word recognition from pieces to whole[J].Frontiers of Computer Science,2019,13(2):292-301. 被引量：1

同被引文献198

1牛小明,毕可骏,唐军.图文识别技术综述[J].中国体视学与图像分析,2019,0(3):241-256. 被引量：14
2应自炉,赵毅鸿,宣晨,邓文博.多特征融合的文档图像版面分析[J].中国图象图形学报,2020,0(2):311-320. 被引量：7
3易尧华,何婧婧,卢利琼,汤梓伟.顾及目标关联的自然场景文本检测[J].中国图象图形学报,2020,0(1):126-135. 被引量：14
4Qingqing WANG,Ye HUANG,Wenjing JIA,Xiangjian HE,Michael BLUMENSTEIN,Shujing LYU,Yue LU.FACLSTM:ConvLSTM with focused attention for scene text recognition[J].Science China(Information Sciences),2020,63(2):35-48. 被引量：11
5Yunze GAO,Yingying CHEN,Jinqiao WANG,Hanqing LU.Progressive rectification network for irregular text recognition[J].Science China(Information Sciences),2020,63(2):7-20. 被引量：3
6张国山,赵阳,马红悦.基于卷积神经网络的手势识别[J].光电子．激光,2019,30(12):1317-1322. 被引量：9
7曹雨生,徐昂.微机国际音标系统[J].民族语文,1990(1):74-79. 被引量：1
8骆剑承,周成虎,赵千钧,万庆.彩色扫描地图点状符号的自动识别[J].地球信息科学学报,1999,11(2):57-62. 被引量：4
9俞连笙.地图符号的哲学层面及其信息功能的开发[J].测绘学报,1995,24(4):259-266. 被引量：25
10徐同莹,彭定明,王卫星.改进的直方图均衡化算法[J].兵工自动化,2006,25(7):58-59. 被引量：19

引证文献35

1Minghui LIAO,Boyu SONG,Shangbang LONG,Minghang HE,Cong YAO,Xiang BAI.SynthText3D:synthesizing scene text images from 3D virtual worlds[J].Science China(Information Sciences),2020,63(2):65-78. 被引量：2
2姚砺,王昭丽.基于深度学习的驾驶证识别方法研究[J].智能计算机与应用,2020,10(7):40-43. 被引量：4
3闫晓婧,闫浩文,王小龙,王卓,马文骏.微地图符号的智能化匹配——“识图配符”[J].测绘科学,2022,47(10):205-212. 被引量：8
4冯谦,陶青川.基于EAST与CNN的钢材表面字符检测与识别方法[J].现代计算机,2019,25(9):71-74. 被引量：3
5郑伊,齐冬莲,王震宇.候选框密度可变的YOLO网络国际音标字符识别方法[J].计算机应用,2019,39(6):1675-1679.
6石鑫,董宝良,王俊丰.基于CRNN的中文手写识别方法研究[J].信息技术,2019,43(11):141-144. 被引量：7
7余萍,曹洁.深度学习在故障诊断与预测中的应用[J].计算机工程与应用,2020,56(3):1-18. 被引量：62
8艾合麦提江·麦提托合提,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.基于深度学习的场景文字检测与识别综述[J].电视技术,2019,43(14):65-70. 被引量：2
9任君兰,曹浩,司吉兵.基于堆栈稀疏自编码器的齿轮箱故障诊断[J].制造技术与机床,2020(5):49-53. 被引量：2
10张振宇,姜贺云,樊明宇.一种面向银行票据文字自动化识别的高效人工智能方法[J].温州大学学报（自然科学版）,2020,41(3):47-56. 被引量：3

二级引证文献157

1金迪,王增朝,张一哲,张孜聪,宋君杰.铁路站车销售预包装食品营养标签现况调查[J].河南预防医学杂志,2020(10):798-800. 被引量：1
2王兴,郑勇锋,严永兵,刘沿娟,张梦伊.基于OCR技术的票据识别算法研究[J].智能计算机与应用,2021,11(11):101-106. 被引量：7
3方煜敏,张立峰,闫浩文,何毅,王小龙,王炳瑄,陈鹤升,刘耀祥.用户角色特性导向的微地图逻辑架构设计[J].测绘科学,2024,49(5):163-175.
4侯宇豪,杨维芳,马文骏,王卓,余懿韬,闫香蓉,闫浩文.一种利用VSM检索微地图的方法[J].测绘科学,2023,48(12):225-233.
5晋军伟,钱彬,虞力英,王军华,顾席光.基于小样本的境外驾驶证分类方法[J].中国公共安全,2023(4):53-59.
6贾建忠.基于小波变换和CPN网络的手写签名鉴别[J].计算机与现代化,2020,0(7):27-31.
7赵吉山,王青海.基于循环神经网络的花儿信息模型建模方法[J].软件,2020,41(6):19-23.
8邓婕,李舜酩.基于深度学习的故障诊断方法研究综述[J].电子测试,2020,31(18):43-47. 被引量：9
9杨文忠,杨蒙蒙,温杰彬,张志豪,富雅玲.基于One Class-SVM+Autoencoder模型的车辆碰撞检测[J].新疆大学学报（自然科学版）,2020,37(3):271-276. 被引量：6
10欧大春.5G时代利用人工智能提升运营商网络竞争力的研究[J].邮电设计技术,2020(10):1-4. 被引量：6

1高龙,孙皓琦.“四个坚持”抓实“三会一课”[J].北京支部生活,2018,0(3):40-41.
2刘丽媛.道德与法治教材:融入生活与情境,不再“说教”[J].基础教育课程,2017(24):9-10. 被引量：4
3卷首语[J].中国林业产业,2008(5):1-1.
4徐筠,张立云,沈晴.影像控制点的综合管理[J].价值工程,2018,37(12):14-15.
5张萍.丝绸之路交通地理定位与道路网络复原研究[J].首都师范大学学报（社会科学版）,2018,0(2):33-40. 被引量：5
6卫星红外辐射云图的地理定位[J].复旦学报（自然科学版）,1976,25(1):35-47.
7卢树华,王引书.表面增强拉曼光谱检测爆炸物研究进展[J].光谱学与光谱分析,2018,38(5):1412-1419. 被引量：7
8董大明.探测雷达在车牌识别中的应用[J].汽车实用技术,2018,44(13):19-21.
9李杏清,王志兵.一种基于人眼状态的疲劳驾驶检测系统研究[J].信息与电脑,2017,29(23):73-75. 被引量：3
10红颈瓣蹼鹬[J].小学生时代,2018,0(6).

中国科学：信息科学

2018年第5期

浏览历史

内容加载中请稍等...

基于深度学习的场景文字检测与识别被引量：35

参考文献1

二级参考文献98

共引文献21

同被引文献198

引证文献35

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

基于深度学习的场景文字检测与识别 被引量：35

参考文献1

二级参考文献98

共引文献21

同被引文献198

引证文献35

二级引证文献157

相关作者

相关机构

相关主题

浏览历史

基于深度学习的场景文字检测与识别被引量：35