期刊文献+
共找到23篇文章
< 1 2 >
每页显示 20 50 100
特征提取策略对高分辨率遥感图像场景分类性能影响的评估 被引量:30
1
作者 钱晓亮 李佳 +4 位作者 程塨 姚西文 赵素娜 陈宜滨 姜利英 《遥感学报》 EI CSCD 北大核心 2018年第5期758-776,共19页
高分辨率遥感图像场景分类方法主要涉及两个环节:特征提取以及特征分类,分类器的设计已经相对成熟,当前工作的重点是特征提取策略的研究。为了进一步推动特征提取策略的研究,将特征提取策略对高分辨率遥感图像场景分类性能的影响进行了... 高分辨率遥感图像场景分类方法主要涉及两个环节:特征提取以及特征分类,分类器的设计已经相对成熟,当前工作的重点是特征提取策略的研究。为了进一步推动特征提取策略的研究,将特征提取策略对高分辨率遥感图像场景分类性能的影响进行了定性和定量评估。首先,回顾了高分辨率遥感图像场景分类的发展历程;然后,对现有高分辨率遥感图像场景分类方法的特征提取策略进行分类总结,并从理论上将各类特征提取策略对场景分类性能的影响进行定性评估;最后,在3个规模较大的数据集上对多种特征提取策略进行实验对比,将不同特征提取策略对场景分类性能的影响和各数据集的复杂度进行定量评估。 展开更多
关键词 高分辨率 场景分类 特征提取策略 手工特征 数据驱动特征 深度学习
原文传递
面向深度学习的多模态情感识别研究进展 被引量:13
2
作者 赵小明 杨轶娇 张石清 《计算机科学与探索》 CSCD 北大核心 2022年第7期1479-1503,共25页
多模态情感识别是指通过与人类情感表达相关的语音、视觉、文本等不同模态信息来识别人的情感状态。该研究在人机交互、人工智能、情感计算等领域有着重要的研究意义,备受研究者关注。鉴于近年来发展起来的深度学习方法在各种任务中所... 多模态情感识别是指通过与人类情感表达相关的语音、视觉、文本等不同模态信息来识别人的情感状态。该研究在人机交互、人工智能、情感计算等领域有着重要的研究意义,备受研究者关注。鉴于近年来发展起来的深度学习方法在各种任务中所取得的巨大成功,目前各种深度神经网络已被用于学习高层次的情感特征表示,用于多模态情感识别。为了系统地总结深度学习方法在多模态情感识别领域中的研究现状,拟对近年来面向深度学习的多模态情感识别研究文献进行分析与归纳。首先,给出了多模态情感识别的一般框架,并介绍了常用的多模态情感数据集。然后,简要回顾了代表性深度学习技术的原理及其进展。随后,重点详细介绍了多模态情感识别中的两个关键步骤的研究进展:与语音、视觉、文本等不同模态相关的情感特征提取方法,包括手工特征和深度特征;融合不同模态信息的多模态信息融合策略。最后,分析了该领域面临的挑战和机遇,并指出了未来的发展方向。 展开更多
关键词 情感识别 多模态 深度学习 手工特征 深度特征 融合
下载PDF
级联手工特征与深度特征的视频关键帧检测方法 被引量:7
3
作者 毋立芳 赵宽 +1 位作者 简萌 王向东 《信号处理》 CSCD 北大核心 2019年第11期1871-1879,共9页
关键帧检测是有效的视频内容分析的关键环节。常用的基于手工特征的方法运行效率高但很难有效表征关键帧特征,因而性能不好。基于深度特征的方法因为网络结构复杂,导致效率不高。在体育比赛类视频中,关键帧常为比赛转播中镜头变化的最... 关键帧检测是有效的视频内容分析的关键环节。常用的基于手工特征的方法运行效率高但很难有效表征关键帧特征,因而性能不好。基于深度特征的方法因为网络结构复杂,导致效率不高。在体育比赛类视频中,关键帧常为比赛转播中镜头变化的最后一帧。但广播视频中除了包含比赛视频还包括很多其他类型的镜头如中场休息、渐变镜头等。因此检测最后一帧包含很多比赛无关内容。针对这一问题,本文提出了一种手工特征与深度特征相结合的视频关键帧检测方法。首先基于颜色直方图特征进行镜头边界检测获取最后一帧。进一步基于直方图相似性提出一种类似聚类的方法得到候选关键帧。最后,基于深度神经网络对候选关键帧进行分类,得到真正的关键帧。在冰壶比赛视频和篮球比赛视频上的对比实验结果表明,相对于传统的背景差分法、光流法等,本文提出方法能够快速、可靠地提取关键帧。 展开更多
关键词 手工特征 深度特征 神经网络 关键帧检测 镜头分割
下载PDF
基于骨骼的人体行为识别方法研究综述
4
作者 黄倩 崔静雯 李畅 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2024年第2期173-194,共22页
人体行为识别在视频理解中发挥了重要作用.近年来,基于骨骼的行为识别方法因其对复杂环境的干扰更具鲁棒性而受到广泛关注.文中共整理了102种基于骨骼的人体行为识别方法,并在9个公开数据集上对其进行了对比分析.按照特征学习方式的不同... 人体行为识别在视频理解中发挥了重要作用.近年来,基于骨骼的行为识别方法因其对复杂环境的干扰更具鲁棒性而受到广泛关注.文中共整理了102种基于骨骼的人体行为识别方法,并在9个公开数据集上对其进行了对比分析.按照特征学习方式的不同,分别介绍了基于手工特征的方法和基于深度学习的方法.其中,基于手工特征的方法按特征描述符的不同分为几何描述符、动力学描述符、统计描述符3个子类;基于深度学习的方法按网络主体的不同分为循环神经网络、卷积神经网络、图卷积网络、Transformer和混合网络5个子类.通过以上分析,不仅阐述了基于骨骼的行为识别方法的发展历程,还剖析了现有方法存在的泛化能力不强、计算成本高等局限.最后,从网络结构设计、相似动作区分、领域数据集拓展、多人交互等方面对未来研究方向进行了展望. 展开更多
关键词 计算机视觉 行为识别 骨骼数据 手工特征 深度学习 神经网络
下载PDF
基于骨骼数据特征的人体行为识别方法综述 被引量:3
5
作者 孙满贞 张鹏 苏本跃 《软件导刊》 2022年第4期233-239,共7页
人体行为识别是人工智能领域的一个研究热点,相对于视频、运动流等数据,人体骨骼数据具有简洁性和矢量计算的高效性。从基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法两方面对基于骨骼数据的人体行为识别相关研... 人体行为识别是人工智能领域的一个研究热点,相对于视频、运动流等数据,人体骨骼数据具有简洁性和矢量计算的高效性。从基于传统机器学习的手工特征提取方法和基于深度学习的深度特征提取方法两方面对基于骨骼数据的人体行为识别相关研究进行综述。将手工特征概括为物理属性特征和统计属性特征,将深度特征按卷积神经网络、循环神经网络、图卷积神经网络及混合神经网络等类别对基于骨骼数据的人体行为识别方法及其优缺点进行逐一阐述,并对相关的特征提取方法、技术路线、模型特点及识别率等进行分析与总结。 展开更多
关键词 人体行为识别 骨骼数据 手工特征 深度特征
下载PDF
基于深度学习的粒子滤波视频目标跟踪算法 被引量:4
6
作者 李敏 吴莎 《计算机技术与发展》 2020年第6期23-28,共6页
在视频目标跟踪中,由于环境以及目标形变等因素的影响,会导致跟踪算法出现鲁棒性差的问题,针对该问题提出了一种基于预训练卷积神经网络,在粒子滤波框架下将深度特征和手工特征相结合的视觉目标跟踪算法。该算法通过卷积神经网络对数万... 在视频目标跟踪中,由于环境以及目标形变等因素的影响,会导致跟踪算法出现鲁棒性差的问题,针对该问题提出了一种基于预训练卷积神经网络,在粒子滤波框架下将深度特征和手工特征相结合的视觉目标跟踪算法。该算法通过卷积神经网络对数万张通用目标图像进行离线预训练,得到可以对通用目标进行表示的从简单到复杂的结构性特征,再在粒子滤波跟踪框架下将深度特征和手工特征相结合用于目标跟踪。同时,该算法以一种懒惰的方式更新跟踪模型,避免了模板频繁更新而导致的昂贵计算代价。实验结果表明,与已有的传统粒子滤波跟踪方法相比,该方法在现有的跟踪基准测试中显示出优越的性能,在复杂背景、光照以及目标形变等恶劣条件影响下仍能稳定地跟踪目标,具有更强的鲁棒性。 展开更多
关键词 目标跟踪 粒子滤波 卷积神经网络 深度特征 手工特征
下载PDF
牙齿X线片的图像分割方法综述
7
作者 韩致远 姜玺军 +1 位作者 王晨 刘瑞军 《计算机工程与应用》 CSCD 北大核心 2023年第20期13-34,共22页
近年来,随着国民医疗水平的不断提高,医疗影像设备在基层医院的不断普及,医学影像数据已经成为医生做出病理诊断的重要依据,利用计算机技术处理口腔医学影像也引起了研究人员的兴趣。设计相关算法自动分割牙齿图像中的感兴趣区域,对于... 近年来,随着国民医疗水平的不断提高,医疗影像设备在基层医院的不断普及,医学影像数据已经成为医生做出病理诊断的重要依据,利用计算机技术处理口腔医学影像也引起了研究人员的兴趣。设计相关算法自动分割牙齿图像中的感兴趣区域,对于辅助口腔医生诊断,提升阅片效率,都有着重要的临床应用价值,同时对缓解手工分割工作强度也有重要研究意义。通过对近十年牙齿X线片分割方法进行回顾,将牙齿图像分割方法分为基于手工特征的方法和基于深度学习的方法。对这两大类方法的研究现状进行了梳理和阐述;总结了部分研究的使用数据集和常用的评价指标,并比较了各类方法在相关数据集上的实验结果;分析了牙齿图像分割领域目前存在的问题和未来可研究的方向。 展开更多
关键词 深度学习 牙齿图像分割 辅助诊断 手工特征
下载PDF
多特征融合的次峰抑制无人机目标跟踪 被引量:4
8
作者 吴贵山 林淑彬 杨文元 《计算机工程与应用》 CSCD 北大核心 2020年第14期104-110,共7页
无人机目标跟踪是计算机视觉一个热门的研究方向。多特征融合后的响应通常含有噪声,为了解决这个问题,提出一种基于多特征融合的次峰响应抑制的无人机目标跟踪算法。提取HOG特征和二维颜色属性特征,并进行融合产生响应。对次峰响应进行... 无人机目标跟踪是计算机视觉一个热门的研究方向。多特征融合后的响应通常含有噪声,为了解决这个问题,提出一种基于多特征融合的次峰响应抑制的无人机目标跟踪算法。提取HOG特征和二维颜色属性特征,并进行融合产生响应。对次峰响应进行抑制以去除噪声,将多个次峰聚合为一个中心主峰。引入自适应模型更新策略进一步增强算法的鲁棒性。在UAV123和VisDrone2019数据集上进行实验,结果显示该算法在无人机的快速运动、视角变化等挑战场景中表现出较好的跟踪精度和鲁棒性。 展开更多
关键词 计算机视觉 目标跟踪 背景感知 次峰抑制 手工特征
下载PDF
面向听视觉信息的多模态人格识别研究进展 被引量:3
9
作者 赵小明 唐志伟 张石清 《智能系统学报》 CSCD 北大核心 2021年第2期189-201,共13页
人格识别分析是人格计算研究中一个重要的研究内容,在人类行为分析、人工智能、人机交互、个性化推荐等方面具有重要的应用价值,是近年来心理学、认知学、计算机科学等领域中的一个多学科交叉的热点研究课题。本文介绍了与人格识别相关... 人格识别分析是人格计算研究中一个重要的研究内容,在人类行为分析、人工智能、人机交互、个性化推荐等方面具有重要的应用价值,是近年来心理学、认知学、计算机科学等领域中的一个多学科交叉的热点研究课题。本文介绍了与人格识别相关的各种人格类型表示理论和人格识别数据库,阐述了面向听视觉信息的各种听视觉人格特征提取技术,如手工特征和深度特征,并在此基础上对面向听视觉信息人格识别的多模态融合方法做了详细的分类和归纳,最后概括了面向听视觉信息的多模态人格识别发展趋势,并进行了展望。 展开更多
关键词 人格识别 人格计算 人格类型 听视觉信息 特征提取 手工特征 深度特征 多模态融合
下载PDF
基于多特征非线性融合的草图-图像检索方法 被引量:1
10
作者 苏亮亮 李惠 《安徽建筑大学学报》 2022年第3期74-82,共9页
草图-图像检索属于计算机视觉领域的跨域检索问题,由于草图的简单性和抽象性,导致其与自然图像的域间差异过大,至今其检索精度仍无法满足现实需求。本文提出了一种基于多特征非线性融合的草图-图像检索方法,非线性融合草图的形状特征和... 草图-图像检索属于计算机视觉领域的跨域检索问题,由于草图的简单性和抽象性,导致其与自然图像的域间差异过大,至今其检索精度仍无法满足现实需求。本文提出了一种基于多特征非线性融合的草图-图像检索方法,非线性融合草图的形状特征和具有语义特性的深度特征,形成新的图像特征表示。该融合策略结合了两类特征的优点,既能有效刻画草图的边缘轮廓信息,又能兼顾语义信息。最后在两个公开数据集(Flickr15k和TU-Berlin)上进行实验,其结果显示本文提出的特征融合方法得到的检索效果优于其他融合方法和基于单一特征的方法。另外,本文提出的融合策略易于扩展到其他多特征融合情况。 展开更多
关键词 草图-自然图像检索 手工特征 深度学习 特征融合
下载PDF
基于手工特征的视频哈希研究综述 被引量:1
11
作者 于梦竹 唐振军 《广西师范大学学报(自然科学版)》 CAS 北大核心 2022年第5期72-89,共18页
视频哈希是从视频中提取到的基于视觉内容的短小数字序列,在实际应用中,用视频哈希来表示视频,能降低视频的存储代价和视频相似计算的复杂度。目前,视频哈希已被广泛应用于拷贝检测、篡改取证、视频索引、视频检索等方面。近年,视频哈... 视频哈希是从视频中提取到的基于视觉内容的短小数字序列,在实际应用中,用视频哈希来表示视频,能降低视频的存储代价和视频相似计算的复杂度。目前,视频哈希已被广泛应用于拷贝检测、篡改取证、视频索引、视频检索等方面。近年,视频哈希研究取得许多重要进展,研究人员设计和开发出多种手工特征提取技术,并建立一系列视频哈希算法。本文将基于手工特征的视频哈希算法分为空域计算和时空域计算2个大类,其中基于空域计算的哈希算法又分为逐帧计算和关键帧计算2类,而基于时空域计算的哈希算法则分为正交变换、统计特征、视觉特征点、数据降维和其他技术5类。根据这些分类,本文先分析每类算法的代表性研究成果并总结其性能;然后介绍常用的哈希度量方法、性能评价指标和视频数据集;最后列出未来研究工作可重点关注的内容,包括面向篡改取证的视频哈希、基于深度学习的高效视频哈希和面向移动应用的轻量级视频哈希等。 展开更多
关键词 视频哈希 手工特征 特征提取 关键帧 数据降维
下载PDF
三维局部描述子综述
12
作者 方斌 丁军峰 +1 位作者 马杰 明德烈 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第11期1-15,共15页
对三维计算机视觉领域中近三十年的局部描述子进行总结,回顾了传统三维手工局部描述符的构造方法,介绍了基于深度学习的方法.首先,针对三维手工局部特征和学习型特征,分别从局部参考坐标系和三维数据的表示方式的角度出发,对它们进行分... 对三维计算机视觉领域中近三十年的局部描述子进行总结,回顾了传统三维手工局部描述符的构造方法,介绍了基于深度学习的方法.首先,针对三维手工局部特征和学习型特征,分别从局部参考坐标系和三维数据的表示方式的角度出发,对它们进行分类概述,并重点介绍部分典型方法;然后,概述了三维局部描述子的常用数据集,并统计了各数据集上现有描述子的性能;最后,探讨了三维描述子领域未来值得研究的一些问题. 展开更多
关键词 三维 局部 手工特征 深度学习特征 参考坐标系
原文传递
跨库语音情感识别研究进展
13
作者 张石清 刘瑞欣 赵小明 《计算机系统应用》 2022年第11期31-48,共18页
语音情感识别在人机交互过程中发挥极为重要的作用,近年来备受关注.目前,大多数的语音情感识别方法主要在单一情感数据库上进行训练和测试.然而,在实际应用中训练集和测试集可能来自不同的情感数据库.由于这种不同情感数据库的分布存在... 语音情感识别在人机交互过程中发挥极为重要的作用,近年来备受关注.目前,大多数的语音情感识别方法主要在单一情感数据库上进行训练和测试.然而,在实际应用中训练集和测试集可能来自不同的情感数据库.由于这种不同情感数据库的分布存在巨大差异性,导致大多数的语音情感识别方法取得的跨库识别性能不尽人意.为此,近年来不少研究者开始聚焦跨库语音情感识别方法的研究.本文系统性综述了近年来跨库语音情感识别方法的研究现状与进展,尤其对新发展起来的深度学习技术在跨库语音情感识别中的应用进行了重点分析与归纳.首先,介绍了语音情感识别中常用的情感数据库,然后结合深度学习技术,从监督、无监督和半监督学习角度出发,总结和比较了现有基于手工特征和深度特征的跨库语音情感识别方法的研究进展情况,最后对当前跨库语音情感识别领域存在的挑战和机遇进行了讨论与展望. 展开更多
关键词 语音情感识别 跨库 深度学习 手工特征 深度特征 语音情感
下载PDF
基于混合机器学习的电磁功率谱密度预测模型 被引量:1
14
作者 徐甜甜 韩光洁 +3 位作者 邹岩 朱宏博 王敏 林川 《太赫兹科学与电子信息学报》 2021年第4期623-627,共5页
功率谱密度(PSD)预测是频谱管理中的重要环节。由于功率谱密度具有高度的复杂性、非线性和不确定性,单一的预测模型很难确保预测的准确性和效率。为克服单一预测方法的不足,提出一种混合的机器学习模型,将自组织映射(SOM)网络与回归树(... 功率谱密度(PSD)预测是频谱管理中的重要环节。由于功率谱密度具有高度的复杂性、非线性和不确定性,单一的预测模型很难确保预测的准确性和效率。为克服单一预测方法的不足,提出一种混合的机器学习模型,将自组织映射(SOM)网络与回归树(RT)相结合,以预测信号的功率谱密度。使用自组织映射网络将具有相似手工特征的原始样本集聚类成簇;将每一个簇分别构建回归树来预测功率谱密度;最后,使用亚琛工业大学的数据进行实验。结果表明,预测结果的均方根误差比现有方法提高0.824,证明混合模型具有较高的预测精确度和较好的泛化能力。 展开更多
关键词 功率谱密度 自组织映射 回归树 手工特征
下载PDF
基于加权极限学习机的货车篷布识别技术探讨
15
作者 宋坤骏 张萼辉 《上海铁道》 2020年第S02期53-54,31,共3页
提出了将加权正则化极限学习机用于货车车顶照片的识别以判断车顶是否苫盖篷布和篷布是否存在故障的算法。在判断篷布是否苫盖的问题中,用到了图像的HOG特征,在测试集上取得了非常高的准确率和召回率。在判断苫盖的篷布是否存在故障的... 提出了将加权正则化极限学习机用于货车车顶照片的识别以判断车顶是否苫盖篷布和篷布是否存在故障的算法。在判断篷布是否苫盖的问题中,用到了图像的HOG特征,在测试集上取得了非常高的准确率和召回率。在判断苫盖的篷布是否存在故障的分类问题中,用LBP特征和笔者手工构造的特征,在测试集上取得了很高的召回率;单用笔者手工构造的特征,在测试集上取得了较高的准确率。同时由于极限学习机的快速特性,所提出的算法也能满足工程上对于速度的要求。 展开更多
关键词 货车篷布识别 加权极限学习机 HOG特征 LBP特征 手工特征
下载PDF
一种结合深度特征的人体运动序列追踪模型
16
作者 蒋宇 袁健 《软件导刊》 2020年第1期89-94,共6页
目前主流的判别式目标跟踪模型大多使用灰度、颜色等手工特征,在目标快速移动或受到视频序列背景等因素干扰情况下,目标跟踪器可能在跟踪目标时学习到错误特征而导致跟踪失败。因此,提出一种结合深度特征的相关滤波跟踪算法。首先将待... 目前主流的判别式目标跟踪模型大多使用灰度、颜色等手工特征,在目标快速移动或受到视频序列背景等因素干扰情况下,目标跟踪器可能在跟踪目标时学习到错误特征而导致跟踪失败。因此,提出一种结合深度特征的相关滤波跟踪算法。首先将待跟踪目标图像输入至卷积神经网络中,提取出较高层的卷积特征,然后将提取的卷积特征输入相关滤波器中得到响应,最后根据响应峰值得到追踪结果。以VOT2016中包含人体运动的视频序列为实验数据集,并分别与CN、SAMF及KPDCF模型进行对比。实验结果表明,结合深度特征的相关滤波算法具有较好的追踪性能,在不大幅降低追踪速度的情况下,提升了追踪精度和稳定性。 展开更多
关键词 手工特征 相关滤波器 深度特征 目标追踪 卷积神经网络 人体运动序列
下载PDF
交通标志检测与分类方法综述
17
作者 胡聪 何晓晖 +3 位作者 邵发明 张艳武 卢冠林 王金康 《软件工程与应用》 2021年第3期348-353,共6页
在过去的几年中,很多交通标志检测和分类方法被提出。本文综述了近年来交通标志检测与分类的一些有效方法。检测的主要目标是定位包含交通标志的感兴趣区域,检测方法大致分为三大类:基于颜色、基于形状和基于学习。分类方法主要分为两类... 在过去的几年中,很多交通标志检测和分类方法被提出。本文综述了近年来交通标志检测与分类的一些有效方法。检测的主要目标是定位包含交通标志的感兴趣区域,检测方法大致分为三大类:基于颜色、基于形状和基于学习。分类方法主要分为两类:基于手工特征的学习方法和深度学习方法。为了便于参考,还将检测和分类公开数据集进行了总结。 展开更多
关键词 交通标志检测 分类 综述 手工特征 深度学习
下载PDF
基于手工特征提取与结果融合的CNN音频隐写分析算法 被引量:5
18
作者 李敬轩 胡润文 +1 位作者 阮观奇 项世军 《计算机学报》 EI CAS CSCD 北大核心 2021年第10期2061-2075,共15页
随着互联网技术的快速发展,出现了基于IP的语音传输技术,给人们带来方便的同时也带来了许多安全隐患,如不法分子利用VoIP压缩域语音传输协议传送秘密信息.因此,针对基于G.729A编码的基音隐写算法和互补邻居顶点的量化索引调制音频隐写算... 随着互联网技术的快速发展,出现了基于IP的语音传输技术,给人们带来方便的同时也带来了许多安全隐患,如不法分子利用VoIP压缩域语音传输协议传送秘密信息.因此,针对基于G.729A编码的基音隐写算法和互补邻居顶点的量化索引调制音频隐写算法,本文提出了一种基于手工特征提取与结果融合的卷积神经网络音频隐写分析算法.通过将手工提取特征与卷积神经网络相结合,可以实现在VoIP压缩域同时对基于基音的隐写算法和互补邻居顶点的量化索引调制音频隐写算法进行有效检测.实验结果表明,在同时对基音隐写算法和互补邻居顶点的量化索引调制音频隐写算法进行检测时,本文所提出的基于手工特征提取与结果融合的卷积神经网络音频隐写分析算法的检测准确率可以达到86.2%(嵌入率为100%、音频样本时长为0.1s).与现有隐写分析算法相比,在音频时长较短时,本文所提算法取得了优异的检测结果. 展开更多
关键词 隐写分析 G.729A 卷积神经网络 手工特征提取 结果融合
下载PDF
光学遥感图像目标检测算法综述 被引量:56
19
作者 聂光涛 黄华 《自动化学报》 EI CAS CSCD 北大核心 2021年第8期1749-1768,共20页
目标检测技术是光学遥感图像理解的基础问题,具有重要的应用价值.本文对遥感图像目标检测算法发展进行了梳理和分析.首先阐述了遥感图像目标检测的特点和挑战;之后系统总结了典型的检测方法,包括早期的基于手工设计特征的算法和现阶段... 目标检测技术是光学遥感图像理解的基础问题,具有重要的应用价值.本文对遥感图像目标检测算法发展进行了梳理和分析.首先阐述了遥感图像目标检测的特点和挑战;之后系统总结了典型的检测方法,包括早期的基于手工设计特征的算法和现阶段基于深度学习的方法,对于深度学习方法首先介绍了典型的目标检测模型,进而针对遥感图像本身的难点详细梳理了优化改进方案;接着介绍了常用的检测数据集,并对现有方法的性能进行比较;最后对现阶段问题进行总结并对未来发展趋势进行展望. 展开更多
关键词 光学遥感 目标检测 手工设计特征 深度学习 数据集
下载PDF
自然场景图像中的文本检测综述 被引量:49
20
作者 王润民 桑农 +4 位作者 丁丁 陈杰 叶齐祥 高常鑫 刘丽 《自动化学报》 EI CSCD 北大核心 2018年第12期2113-2141,共29页
本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然... 本文对自然场景文本检测问题及其方法的研究进展进行了综述.首先,论述了自然场景文本的特点、自然场景文本检测技术的研究背景、现状以及主要技术路线.其次,从传统文本检测以及深度学习文本检测的视角出发,梳理、分析并比较了各类自然场景文本检测方法的优缺点,并介绍了端对端文本识别技术.再次,论述了自然场景文本检测技术所面临的挑战,探讨了相应的解决方案.最后,本文列举了测试基准数据集、评估方法,将最具代表性的自然场景文本检测方法的性能进行了比较,本文还展望了本领域的发展趋势. 展开更多
关键词 文本检测 场景文本 深度学习 手工设计的特征 连通域分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部