一种基于SWT面向RGB-D图像的高效字符检测算法被引量：2

A High Performance Text Detection System Based on SWT for RGB-D Image

下载PDF

导出

摘要自然场景中的字符识别有很多有意义的应用,比如机器人的自动导航,场景中文字的即时翻译等。深度相机在机器人以及可穿戴设备中已经有较为广泛的应用,而深度信息是否能辅助字符检测还没有被研究。一种基于SWT(Stroke Width Transform)的面向RGB-D图像的字符检测系统在这里被介绍,该算法利用场景三维结构和字符分布特征来优化SWT进行字符检测。虽然利用深度信息限制了该项研究的应用领域,很多应用仍然能够从该项研究中获益:比如携带Kinect的机器人的自动导航,增强现实眼镜Hololens的即时翻译等等。实验证明通过深度信息的辅助能够显著地提高基于SWT字符检测系统的性能。 Automatic detection and recognition of text in the natural scene is a prerequisite for a couple of applications,such as automatic robot navigation and instant scene text translation system.The RGB-D camera has wildly used in mobile robot and wearable device,whether depth can benefit text detection,however,has not been investigated deeply.A text detection system based on SWT using RGB-D image is introduced here,and depth Channel of RGB-D image and distribution of text are used to optimize the performance of SWT.Even though the dependency of Depth information would limit the application,many applications still can benefit from this research,such as automatic navigation of robot equipped with Kinect.and instant translation system of Holo Lens.The experiment result shows that the depth channel indeed can promote the performance of SWT text detection system.

作者宋云涛刘烨王源彬陈雁秋

机构地区复旦大学南京邮电大学

出处《微型电脑应用》 2015年第9期33-36,5,共4页 Microcomputer Applications

基金国家自然科学基金面上项目(61175036)

关键词字符检测笔画宽度变换 RGB—D图片字符分布 Text Detection Stroke Width Transform RGB-D Image Distribution of Text

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1Epshtein B, Ofek E, Wexler Y. Detecting text in natural scenes with stroke width transfoma[C],Computer Vision and Pattern Recognition (CVPR), 2010 IEEE Conference on. IEEE, 2010: 2963-2970. 被引量：1
2Lai K, Bo L, Ren X, et al. Detection-based object labeling in 3d scenes[C],Robotics and Automation (ICRA), 2012 IEEE International Conference on. IEEE, 2012: 1330-1337. 被引量：1
3Liu J, Liu Y, Cui Y, et al. Real-time human detection and tracking in complex environments using single RGBD camera[C],lCIE 2013: 3088-3092. 被引量：1
4Neumann L, Matas J. A method for text localization and recognition in real-world images[M],Computer Vision ACCV 2010. Springer Berlin Heidelberg, 2011: 770-783. 被引量：1
5欧新良,匡小兰,倪问尹.三维散乱点云分割技术综述[J].湖南工业大学学报,2010,24(5):45-49. 被引量：14
6Lucas S M, Panaretos A, Sosa L, et al. ICDAR 2003 robust reading competitions[C],2003 12th International Conference on Document Analysis and Recognition. IEEE Computer Society, 2003, 2: 682-682. 被引量：1

二级参考文献17

1肖春霞,冯结青,缪永伟,郑文庭,彭群生.基于Level Set方法的点采样曲面测地线计算及区域分解[J].计算机学报,2005,28(2):250-258. 被引量：16
2柯映林,单东日.基于边特征的点云数据区域分割[J].浙江大学学报（工学版）,2005,39(3):377-380. 被引量：36
3董明晓,郑康平,姚斌.曲面重构中点云数据的区域分割研究[J].中国图象图形学报（A辑）,2005,10(5):575-578. 被引量：17
4Yokoya N, Levine M D. Range Image Segmentation Based on Differential Geometry: A Hybrid Approach[J]. IEEE Transactions on, Pattern Analysis and Machine Intelligence, 1997, 11(6): 643-649. 被引量：1
5Yamazaki I, Natarajan V, Bai Z, et al. Segmenting Point Sets[J]. Proc. IEEE Intl. Conf. Shape Modeling and Applications(SMI), 2006(6): 4-13. 被引量：1
6Valerio Pascucci, Giorgio Scorzelli, Peer-Timo Bremer, et al. Robust On-Line Computation of Reeb Graphs: Simplicity and Speed[J]. ACM Transactions on Graphics, 2007, 26(3): 58.1-58.9. 被引量：1
7Xu Hui, Gossett Nathan, Chen Bao-quan. Knowledge-Based Modeling of Laser-Scanned Trees[C]//Proceedings of SIGGRAPH' 05 Sketches. NewYork: ACM, 2005: 124. 被引量：1
8Woo H, Kang E, Wang S Y, et al. A New Segmentation Method for Point Loud Data[J]. International Journal of Machine Tools and Manufacture, 2002, 42(2): 167-178. 被引量：1
9Vosselman M G, Gorte B G H, Sithole G, et al. Recogniseing Structure in Laser Scanning Point Clouds[C]// International Archives of Photogrammetry V Remote Sensing and Spatial Information Sciences. Freburg : ISPRS, 2004 : 33-38. 被引量：1
10Besl P J, Jain R C. Segmentation Through Variable-Order Surface Fitting[J]. IEEE Pattern Analysis and Machine Intelligence, 1988, 10(2): 167-192. 被引量：1

共引文献13

1孙金虎,周来水,安鲁陵.应用最小生成树实现点云分割[J].中国图象图形学报,2012,17(7):858-865. 被引量：11
2刘会云,李永强,陈猛,赵亮,刘炎冰,王秋云,冯宝林.基于车载LiDAR数据的建筑物三维重建[J].河南理工大学学报（自然科学版）,2014,33(3):295-298. 被引量：1
3盛仲飙,韩慧妍.散乱点云分割技术研究与实现[J].计算技术与自动化,2016,35(1):104-106. 被引量：3
4魏广宇,甘淑.机载Lidar建筑物点云中非建筑物点剔除研究[J].价值工程,2017,36(2):31-33. 被引量：1
5娄静谊,赵俊三.基于激光扫描数据正交投影分析的建筑物提取研究[J].价值工程,2017,36(14):147-149. 被引量：2
6肖培.点云模型交互式边界曲线分割算法研究[J].软件导刊,2017,16(10):61-63.
7姚砺,李瑶.基于最小割的彩色点云分割[J].智能计算机与应用,2017,7(5):10-12.
8黄礼辉,黄子懿.一种基于数学形态学的点云地物提取方法[J].铁道勘察,2018,44(2):26-29. 被引量：5
9谢小芳,万勇,严可馨,张洪军.地下洞库三维激光扫点云区域分割和容积计算[J].电子测量与仪器学报,2019,31(9):80-86. 被引量：5
10代璐,汪俊亮,陈治宇,鲍劲松,张洁.基于卷积神经网络的非等效点云分割方法[J].东华大学学报（自然科学版）,2019,45(6):862-868. 被引量：4

同被引文献15

1肖习雨,张昌凡,龙永红.基于骨架模板匹配的彩色印刷品文字缺陷检测[J].包装学报,2010,2(1):38-41. 被引量：3
2黄丽华,穆平安,戴曙光.汽车音响面板印刷字符缺陷快速检测算法[J].计算机与数字工程,2010,38(7):30-32. 被引量：2
3李晓,袁保社,陈卿,任宏宇,张建华.基于像素积分投影的印刷体维文字母切分方法[J].计算机技术与发展,2012,22(4):41-44. 被引量：9
4陈卿,袁保社,李晓,任宏宇,张建华.基于模板匹配的印刷维吾尔文字符识别研究[J].计算机技术与发展,2012,22(4):119-122. 被引量：10
5项辉宇,刘倩倩,黄佳军,孙超.基于HALCON的字符识别及缺陷检测[J].机电产品开发与创新,2014,27(2):77-79. 被引量：6
6谢聪凌,李征,王俊峰.一种改进的汉字字符识别法[J].四川大学学报（自然科学版）,2014,51(5):927-930. 被引量：2
7努尔艾力·喀迪尔,彭良瑞,哈力木拉提.一种基于HMM和统计语言模型的维吾尔文及阿拉伯文识别方法[J].计算机应用与软件,2015,32(1):171-174. 被引量：6
8姜志威,丁晓青,彭良瑞.针对无切分维吾尔文文本行识别的字符模型优化[J].清华大学学报（自然科学版）,2015,55(8):873-877. 被引量：3
9苏佩佩,哈力木拉提.买买提,艾尔肯.赛甫丁,王剑.一种基于连体段的维吾尔文单词特征提取方法[J].新疆大学学报（自然科学版）,2015,32(4):462-468. 被引量：2
10孔令美,汤庸.基于小波变换和小波神经网络的3D遮挡人脸识别方法[J].湘潭大学自然科学学报,2015,37(4):82-86. 被引量：12

引证文献2

1于丽,亚森.艾则孜.基于HOG特征和MLP分类器的印刷体维吾尔文识别方法[J].微型电脑应用,2017,33(6):30-33. 被引量：2
2尚玉廷.包装箱型号标记缺陷检测系统设计与实现[J].包装工程,2021,42(1):214-223. 被引量：2

二级引证文献4

1沙尔旦尔·帕尔哈提,阿布都热合曼·卡的尔,阿力木江·亚森.多字体印刷体维-哈-柯文关键词图像识别[J].计算机科学,2022,49(S02):615-620. 被引量：1
2熊黎剑,吾守尔·斯拉木,许苗苗.基于Django印刷体维吾尔文识别系统的设计与实现[J].郑州大学学报（理学版）,2021,53(3):9-14. 被引量：2
3戚嘉辉,赵一鸣,王壮,胡燕海.基于方向梯度直方图的螺纹连接件端面缺陷检测方法[J].宁波大学学报（理工版）,2022,35(5):86-90. 被引量：2
4苗相彬,罗建桥,李柏林.基于秩正则几何变换的无监督字符缺陷检测[J].机械制造与自动化,2023,52(5):127-133. 被引量：1

1贾曌峰,陈继荣.基于字符检测的车牌定位方法[J].计算机工程,2010,36(3):192-194. 被引量：7
2陶志勇,孙劲光,任晓奎.图像/视频字符区域定位算法的实现[J].辽宁工程技术大学学报（自然科学版）,2004,23(z1):162-164.
3杨英仓.基于字符包络和笔画宽度的伪车牌判断方法[J].计算机应用与软件,2017,34(3):222-226. 被引量：2
4杭宇,孙亚东.基于计算机视觉的通讯机壳部件精密测量方法[J].电脑知识与技术,2016,12(5X):252-254.
5罗辉武,唐远炎,蓝利君,王翊.融合特征和先验知识的车牌字符图像检测算法[J].计算机工程与应用,2012,48(18):187-192. 被引量：4
6陈泽民,陈益振,苏晓萍.基于即时翻译技术的威客平台的构建[J].福建电脑,2010,26(4):22-23. 被引量：1
7宋文,肖建于.基于笔画宽度变换的自然场景文本检测方法[J].计算机工程与应用,2013,49(9):190-192. 被引量：6
8黄先学,韩震宇.基于OpenCV的半导体电子元器件字符检测方法[J].计测技术,2013,33(4):30-32. 被引量：3
9陈梅.改进遗传算法在车牌定位中的应用[J].现代电子技术,2008,31(10):155-156. 被引量：2
10王海平,郭丹,项泰宁,胡学钢.字符分布特征对带有通配符串匹配问题的影响[J].计算机应用研究,2016,33(2):356-361.

微型电脑应用

2015年第9期

浏览历史

内容加载中请稍等...

一种基于SWT面向RGB-D图像的高效字符检测算法被引量：2

参考文献6

二级参考文献17

共引文献13

同被引文献15

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于SWT面向RGB-D图像的高效字符检测算法 被引量：2

参考文献6

二级参考文献17

共引文献13

同被引文献15

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于SWT面向RGB-D图像的高效字符检测算法被引量：2