期刊文献+
共找到602篇文章
< 1 2 31 >
每页显示 20 50 100
深度置信网络模型及应用研究综述 被引量:51
1
作者 刘方园 王水花 张煜东 《计算机工程与应用》 CSCD 北大核心 2018年第1期11-18,47,共9页
介绍深度置信网络(DBN)理论基础的发展,对比分析深层结构DBN与浅层网络结构的差异,最后引用多篇文献分析研究DBN在文字检测、人脸及表情识别领域和遥感图像领域的应用效果。全面介绍了深度学习模型DBN,深入分析DBN的构建与实际应用,为... 介绍深度置信网络(DBN)理论基础的发展,对比分析深层结构DBN与浅层网络结构的差异,最后引用多篇文献分析研究DBN在文字检测、人脸及表情识别领域和遥感图像领域的应用效果。全面介绍了深度学习模型DBN,深入分析DBN的构建与实际应用,为研究人员提供改进DBN的思路,以期在未来将其运用到更宽广的新兴领域中。 展开更多
关键词 深度置信网络 文字检测 人脸及表情识别 遥感图像领域
下载PDF
自然场景图像中的文本检测综述 被引量:49
2
作者 王润民 桑农 +4 位作者 丁丁 陈杰 叶齐祥 高常鑫 刘丽 《自动化学报》 EI CSCD 北大核心 2018年第12期2113-2141,共29页
本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然... 本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然场景文本检测方法的优缺点,并介绍了端对端文本识别技术.再次,论述了自然场景文本检测技术所面临的挑战,探讨了相应的解决方案.最后,本文列举了测试基准数据集、评估方法,将最具代表性的自然场景文本检测方法的性能进行了比较,本文还展望了本领域的发展趋势. 展开更多
关键词 文本检测 场景文本 深度学习 手工设计的特征 连通域分析
下载PDF
基于深度学习的自然场景文本检测与识别综述 被引量:40
3
作者 王建新 王子亚 田萱 《软件学报》 EI CSCD 北大核心 2020年第5期1465-1496,共32页
自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别... 自然场景文本检测与识别研究对于从场景中获取信息有重要意义,而深度学习技术有助于提高文本检测与识别的能力.主要对基于深度学习的自然场景文本检测与识别方法和其研究进展进行整理分类、分析和总结.首先论述自然场景文本检测与识别的相关研究背景及主要技术研究路线;然后,根据自然场景文本信息处理的不同阶段,进一步介绍文本检测模型、文本识别模型和端到端的文本识别模型,并阐述和分析每类模型方法的基本思路和优缺点;另外,列举了常见公共标准数据集以及性能评估指标和方法,并对不同模型相关实验结果进行了对比分析;最后总结基于深度学习的自然场景文本检测与识别技术面临的挑战和发展趋势. 展开更多
关键词 深度学习 自然场景 文本检测 文本识别 端到端
下载PDF
基于深度学习的场景文字检测与识别 被引量:35
4
作者 白翔 杨明锟 +1 位作者 石葆光 廖明辉 《中国科学:信息科学》 CSCD 北大核心 2018年第5期531-544,共14页
场景文字检测与识别是一种通用文字识别技术,已成为近年来计算机视觉与文档分析领域的热点研究方向.其被广泛应用于地理定位、车牌识别、无人驾驶等领域.相对于传统的文档文字检测和识别,场景文字在字体、尺度、排布、背景等方面变化更... 场景文字检测与识别是一种通用文字识别技术,已成为近年来计算机视觉与文档分析领域的热点研究方向.其被广泛应用于地理定位、车牌识别、无人驾驶等领域.相对于传统的文档文字检测和识别,场景文字在字体、尺度、排布、背景等方面变化更加剧烈,深度学习技术也由于卓越的性能成为该领域的主流方法.本文主要回顾了作者基于深度学习在此领域取得的代表性成果,并对此领域未来研究趋势进行了展望. 展开更多
关键词 深度学习 场景文字 文字检测 文字识别 计算机视觉
原文传递
图像和视频中的文字获取技术 被引量:13
5
作者 王勇 郑辉 胡德文 《中国图象图形学报(A辑)》 CSCD 北大核心 2004年第5期532-538,共7页
许多图像都包含丰富的文字信息 ,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别 ,对图像高层语义内容的自动理解、索引和检索非常有价值 ,因此引起国内外众多学者的研究兴趣。为使人... 许多图像都包含丰富的文字信息 ,如用作网页设计的以图像形式存在的标语和视频图像中的字幕。这些文字的自动检测、分割、提取和识别 ,对图像高层语义内容的自动理解、索引和检索非常有价值 ,因此引起国内外众多学者的研究兴趣。为使人们对该领域有一个系统的了解 ,并使该领域研究人员有所借鉴 ,在对目前国内外图像和视频中文字获取技术相关文献综合理解的基础上 ,综述了该领域的发展现状 ,同时从文字检测、抽取和文字识别两个方面 ,重点讨论了其主要的技术方法及应用优缺点 ,并结合当前面临的问题 ,指出今后可进一步研究的方向。 展开更多
关键词 图像 视频 文字获取技术 文字信息 文字检测 文字抽取 文字识别
下载PDF
基于深度学习的场景文字检测综述 被引量:27
6
作者 姜维 张重生 殷绪成 《电子学报》 EI CAS CSCD 北大核心 2019年第5期1152-1161,共10页
近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文... 近年来,基于深度学习的场景文字检测技术取得重要进展.本文综述了该技术在2014~2018年间的最新工作,将其分为传统区域建议方法、文字建议网络方法、基于分割的方法以及文字建议网络与分割的混合方法,并对各类方法的优劣进行分析.本文还展望了未来发展趋势,指出未来研究热点. 展开更多
关键词 深度学习 场景文字 检测定位
下载PDF
Scene text detection and recognition: recent advances and future trends 被引量:21
7
作者 Yingying ZHU Cong YAO Xiang BAI 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第1期19-36,共18页
Text, as one of the most influential inventions of humanity, has played an important role in human life, so far from ancient times. The rich and precise information embod- ied in text is very useful in a wide range of... Text, as one of the most influential inventions of humanity, has played an important role in human life, so far from ancient times. The rich and precise information embod- ied in text is very useful in a wide range of vision-based ap- plications, therefore text detection and recognition in natu- ral scenes have become important and active research topics in computer vision and document analysis. Especially in re- cent years, the community has seen a surge of research efforts and substantial progresses in these fields, though a variety of challenges (e.g. noise, blur, distortion, occlusion and varia- tion) still remain. The purposes of this survey are three-fold: 1) introduce up-to-date works, 2) identify state-of-the-art al- gorithms, and 3) predict potential research directions in the future. Moreover, this paper provides comprehensive links to publicly available resources, including benchmark datasets, source codes, and online demos. In summary, this literature review can serve as a good reference for researchers in the areas of scene text detection and recognition. 展开更多
关键词 text detection text recogntion natural image algorithms APPLICATIONS
原文传递
图像中的文本定位技术研究综述 被引量:17
8
作者 晋瑾 平西建 +1 位作者 张涛 陈明贵 《计算机应用研究》 CSCD 北大核心 2007年第6期8-11,共4页
介绍了图像中文本定位技术的研究现状,依据定位所利用的特征进行分类,分析了其中几种典型算法,并对文本定位算法的性能评价标准进行了深入讨论。
关键词 文本定位 文本检测 文本提取 图像检索
下载PDF
视频中的文字探测 被引量:13
9
作者 王辰 老松杨 胡晓峰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期478-481,共4页
视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字... 视频中出现的文字往往包含大量的信息 ,是视频分析的重要语义线索 ,探测并识别出来的文字可以为基于内容的视频检索提供索引 .本文简要介绍了目前现有的一些文字探测的方法 ,结合视频中出现的文字的特点 ,提出了一种较为高效的视频文字探测方法 ,该方法在一般图像质量的条件下对中、英文文字都有较好的探测效果 . 展开更多
关键词 文字探测 视频分析 边缘检测 图像处理 视频检索
下载PDF
结合MSCRs与MSERs的自然场景文本检测 被引量:18
10
作者 易尧华 申春辉 +1 位作者 刘菊华 卢利琼 《中国图象图形学报》 CSCD 北大核心 2017年第2期154-160,共7页
目的目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像... 目的目前,基于MSERs(maximally stable extremal regions)的文本检测方法是自然场景图像文本检测的主流方法。但是自然场景图像中部分文本的背景复杂多变,MSERs算法无法将其准确提取出来,降低了该类方法的鲁棒性。本文针对自然场景图像文本背景复杂多变的特点,将MSCRs(maximally stable color regions)算法用于自然场景文本检测,提出一种结合MSCRs与MSERs的自然场景文本检测方法。方法首先采用MSCRs算法与MSERs算法提取候选字符区域;然后利用候选字符区域的纹理特征训练随机森林字符分类器,对候选字符区域进行分类,从而得到字符区域;最后,依据字符区域的彩色一致性和几何邻接关系对字符进行合并,得到最终文本检测结果。结果本文方法在ICDAR 2013上的召回率、准确率和F值分别为71.9%、84.1%和77.5%,相对于其他方法的召回率和F值均有所提高。结论本文方法对自然场景图像文本检测具有较强的鲁棒性,实验结果验证了本文方法的有效性。 展开更多
关键词 自然场景 复杂背景 文本检测 MSCRs MSERs
原文传递
基于Single-Pass的网络舆情热点发现算法 被引量:17
11
作者 格桑多吉 乔少杰 +4 位作者 韩楠 张小松 杨燕 元昌安 康健 《电子科技大学学报》 EI CAS CSCD 北大核心 2015年第4期599-604,共6页
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比... 考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。 展开更多
关键词 舆情分析 single-pass 文本聚类 话题发现
下载PDF
一种自适应的视频帧中字幕检测定位方法 被引量:5
12
作者 王勇 燕继坤 郑辉 《计算机应用》 CSCD 北大核心 2004年第1期134-135,139,共3页
视频帧中的字幕往往包含当前视频的高层语意内容 ,对视频内容的自动理解、索引和检索有重要意义。文中提出了一种视频帧中字幕的自适应检测定位方法 ,与以往根据经验设定阈值的方法相比 ,该方法简单 ,对视频帧的复杂变化的适应能力更强 ... 视频帧中的字幕往往包含当前视频的高层语意内容 ,对视频内容的自动理解、索引和检索有重要意义。文中提出了一种视频帧中字幕的自适应检测定位方法 ,与以往根据经验设定阈值的方法相比 ,该方法简单 ,对视频帧的复杂变化的适应能力更强 ,检测定位更快速、准确。大量实验结果显示该方法是有效的。 展开更多
关键词 视频 字幕 文字检测 文字定位 边缘检测
下载PDF
基于主动学习和否定选择的垃圾邮件分类算法 被引量:16
13
作者 胡小娟 刘磊 邱宁佳 《电子学报》 EI CAS CSCD 北大核心 2018年第1期203-209,共7页
针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集... 针对现在网络上泛滥的垃圾邮件问题,本文结合主动学习方法和否定选择算法提出了一种二类文本分类方法:主动否定学习算法.根据用户少量标注建立双向兴趣集,利用否定选择算法的自体异常检测机制改善主动学习中的采样策略,并将双向兴趣集作为检测器,新增样本集作为自体集,对两者进行异常匹配.本文算法与在线垃圾邮件快速识别方法、增强差异性的半监督协同分类算法、垃圾邮件过滤方法、基于人工高免疫的多层垃圾邮件过滤算法和在线主动多领域学习方法在六个常用邮件语料集上进行了分析比较,结果表明本文算法具有较高的准确率、召回率、分类精度,和较低的用户标注负担.使用用户个性喜好转换为双向兴趣特征的方式有助于提高算法的分类能力;利用异常检测匹配选取未知类别特征的方式,有效地降低了用户标注负担. 展开更多
关键词 文本分类 垃圾邮件检测 主动学习 否定选择 双向用户兴趣集
下载PDF
视频文本检测和识别技术研究 被引量:11
14
作者 朱成军 李超 熊璋 《计算机工程》 CAS CSCD 北大核心 2007年第10期218-219,245,共3页
视频中的文本提供了描述视频内容的有用信息,对于构建基于高级语义的多媒体检索系统具有重要作用。该文从视频文本的特点出发,分析了视频文本检测和识别的各种技术方法及优缺点,以及该领域国内外的发展现状和下一步研究的重点方向。
关键词 视频检索 文本检测 文本识别
下载PDF
基于深度学习的电力设备铭牌识别 被引量:14
15
作者 陈晓龙 陈显龙 +2 位作者 袁建平 高宇豆 张加其 《广西大学学报(自然科学版)》 CAS 北大核心 2018年第6期2216-2226,共11页
为了获取铭牌图像中的基本参数信息,提出一种基于深度学习的端到端文本识别模型TDRN(Text Detection and Recognition Network)。模型避免了图像裁剪和字符分割,将文本看作一个序列,使用BLSTM(Bidirectional Long Short-term Memory)来... 为了获取铭牌图像中的基本参数信息,提出一种基于深度学习的端到端文本识别模型TDRN(Text Detection and Recognition Network)。模型避免了图像裁剪和字符分割,将文本看作一个序列,使用BLSTM(Bidirectional Long Short-term Memory)来获取上下文关系。同时,将文本检测和文本识别整合在同一个网络中共同训练,共享卷积层,以提高整体性能,在文本识别中还引入了注意力机制。模型在公共场景文本数据集SVT(Street View Text)上测试表现良好,F值为68. 69%,高于一般的端到端文本识别模型。与传统铭牌识别方法相比,TDRN准确率更高,鲁棒性更强,能适应复杂的电力场景变化。 展开更多
关键词 深度学习 文本识别 文本检测 铭牌识别 电力设备 中文文本
下载PDF
深度学习在场景文字识别技术中的应用综述 被引量:13
16
作者 刘艳菊 伊鑫海 +2 位作者 李炎阁 张惠玉 刘彦忠 《计算机工程与应用》 CSCD 北大核心 2022年第4期52-63,共12页
随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景... 随着深度学习技术在计算机视觉领域的发展,场景文本检测与文字识别技术也有了突破性的进展。受到自然场景下极端光照、遮挡、模糊、多方向多尺度等情况的影响,无约束的场景文本检测与识别仍然面临着巨大的挑战。从深度学习的角度对场景文本检测和文字识别技术进行深入研究,总结出在文本检测技术中将基于分割的方法与回归的方法优势相结合,可以解决小文本区域的召回率较低的问题,同时适应多尺度文本;在文本识别方法中将CTC机制与Attention机制相结合,可以相互监督以提升识别性能,降低长文本识别的出错率。 展开更多
关键词 深度学习 计算机视觉 自然场景 文本检测 文字识别
下载PDF
复杂背景下维吾尔文字符的分割算法 被引量:13
17
作者 哈力旦.A 伊力哈木.亚尔买买提 库尔班.买提木沙 《计算机工程与应用》 CSCD 北大核心 2007年第20期163-165,180,共4页
在视频或图像中包含丰富的文字信息,这些文字信息与视频或图像的内容密切相关,因此可以作为视频片断或者图像的内容标识和索引。以视频维吾尔文为例,首先用Canny算子将彩色图像转换为灰度化的边缘图像,其次对图像中的文字进行定位,再对... 在视频或图像中包含丰富的文字信息,这些文字信息与视频或图像的内容密切相关,因此可以作为视频片断或者图像的内容标识和索引。以视频维吾尔文为例,首先用Canny算子将彩色图像转换为灰度化的边缘图像,其次对图像中的文字进行定位,再对图像进行边缘点彩色分割,然后进行文字图像行区域和列区域的检测,最后基于候选文本区的特征从不同复杂度的彩色图像中提取文本信息,实验结果表明了算法的有效性。 展开更多
关键词 图像 视频 文字检测 提取
下载PDF
顾及目标关联的自然场景文本检测 被引量:12
18
作者 易尧华 何婧婧 +1 位作者 卢利琼 汤梓伟 《中国图象图形学报》 CSCD 北大核心 2020年第1期126-135,共10页
目的目前基于卷积神经网络(CNN)的文本检测方法对自然场景中小尺度文本的定位非常困难。但自然场景图像中文本目标与其他目标存在很强的关联性,即自然场景中的文本通常伴随特定物体如广告牌、路牌等同时出现,基于此本文提出了一种顾及... 目的目前基于卷积神经网络(CNN)的文本检测方法对自然场景中小尺度文本的定位非常困难。但自然场景图像中文本目标与其他目标存在很强的关联性,即自然场景中的文本通常伴随特定物体如广告牌、路牌等同时出现,基于此本文提出了一种顾及目标关联的级联CNN自然场景文本检测方法。方法首先利用CNN检测文本目标及包含文本的关联物体目标,得到文本候选框及包含文本的关联物体候选框;再扩大包含文本的关联物体候选框区域,并从原始图像中裁剪,然后以该裁剪图像作为CNN的输入再精确检测文本候选框;最后采用非极大值抑制方法融合上述两步生成的文本候选框,得到文本检测结果。结果本文方法能够有效地检测小尺度文本,在ICDAR-2013数据集上召回率、准确率和F值分别为0.817、0.880和0.847。结论本文方法顾及自然场景中文本目标与包含文本的物体目标的强关联性,提高了自然场景图像中小尺度文本检测的召回率。 展开更多
关键词 自然场景 文本检测 小尺度文本 目标关联 级联卷积神经网络
原文传递
基于蚁群优化算法的复杂背景图像文字检测方法 被引量:12
19
作者 李敏花 柏猛 《计算机应用》 CSCD 北大核心 2011年第7期1844-1846,共3页
针对复杂背景图像中的文字检测问题,提出一种基于蚁群优化算法的复杂背景图像文字检测方法。该方法首先采用蚁群优化算法提取图像边缘;然后在边缘图像上提取特征,采取由粗到精多级检测、验证的策略进行文字检测。与基于Soble算子、Cann... 针对复杂背景图像中的文字检测问题,提出一种基于蚁群优化算法的复杂背景图像文字检测方法。该方法首先采用蚁群优化算法提取图像边缘;然后在边缘图像上提取特征,采取由粗到精多级检测、验证的策略进行文字检测。与基于Soble算子、Canny算子等方法的对比实验结果表明,所提出的基于蚁群优化算法的文字检测方法可有效地实现复杂背景图像中的文字检测。 展开更多
关键词 文字检测 边缘检测 蚁群算法 复杂背景
下载PDF
基于深度学习的电力设备铭牌文本识别 被引量:10
20
作者 王逸凡 王佳宇 +1 位作者 仲林林 高丙团 《电力工程技术》 北大核心 2022年第5期210-218,共9页
电力设备铭牌包含丰富的设备信息,通过图文识别技术获取设备铭牌信息,可更加高效快捷地完成电力设备的信息统计、台帐校核等工作,也有利于提高电力系统的设备管理水平。针对电力设备铭牌与普通图像文本识别差异较大的特殊应用场景,文中... 电力设备铭牌包含丰富的设备信息,通过图文识别技术获取设备铭牌信息,可更加高效快捷地完成电力设备的信息统计、台帐校核等工作,也有利于提高电力系统的设备管理水平。针对电力设备铭牌与普通图像文本识别差异较大的特殊应用场景,文中提出一种基于深度学习的电力设备铭牌信息自动识别算法。该算法由铭牌检测、文本检测、文本识别三部分组成。通过改进损失函数设计、增加文本识别结果纠正、人工合成文本图像等方式,使得铭牌检测模型在测试集上的平均精度均值达到92.2%,文本检测模型在测试集上的F 1值达到91.2%,文本识别模型的字符识别准确率达到94.0%,文本行识别准确率达到82.3%。 展开更多
关键词 电力设备铭牌 计算机视觉 深度学习 目标检测 文本检测 文本识别
下载PDF
上一页 1 2 31 下一页 到第
使用帮助 返回顶部