期刊文献+
共找到316篇文章
< 1 2 16 >
每页显示 20 50 100
面向自然语言处理的深度学习研究 被引量:222
1
作者 奚雪峰 周国栋 《自动化学报》 EI CSCD 北大核心 2016年第10期1445-1465,共21页
近年来,深度学习在图像和语音处理领域已经取得显著进展,但是在同属人类认知范畴的自然语言处理任务中,研究还未取得重大突破.本文首先从深度学习的应用动机、首要任务及基本框架等角度介绍了深度学习的基本概念;其次,围绕数据表示和学... 近年来,深度学习在图像和语音处理领域已经取得显著进展,但是在同属人类认知范畴的自然语言处理任务中,研究还未取得重大突破.本文首先从深度学习的应用动机、首要任务及基本框架等角度介绍了深度学习的基本概念;其次,围绕数据表示和学习模型两方面,重点分析讨论了当前面向自然语言处理的深度学习研究进展及其应用策略;并进一步介绍了已有的深度学习平台和工具;最后,对深度学习在自然语言处理领域的发展趋势和有待深入研究的难点进行了展望. 展开更多
关键词 自然语言处理 深度学习 表示学习 特征学习 神经网络
下载PDF
自编码神经网络理论及应用综述 被引量:144
2
作者 袁非牛 章琳 +2 位作者 史劲亭 夏雪 李钢 《计算机学报》 EI CSCD 北大核心 2019年第1期203-230,共28页
自编码器是深度学习中的一种非常重要的无监督学习方法,能够从大量无标签的数据中自动学习,得到蕴含在数据中的有效特征.因此,自编码方法近年来受到了广泛的关注,已成功应用于很多领域,例如数据分类、模式识别、异常检测、数据生成等.... 自编码器是深度学习中的一种非常重要的无监督学习方法,能够从大量无标签的数据中自动学习,得到蕴含在数据中的有效特征.因此,自编码方法近年来受到了广泛的关注,已成功应用于很多领域,例如数据分类、模式识别、异常检测、数据生成等.该文对传统自编码基础理论、自编码方法、改进技术以及应用领域进行了比较全面的综述.首先,该文介绍传统自编码基础理论与实现方法,分析自编码器的一般处理框架.然后,讨论现有各种改进的自编码器,分析这些方法的创新点、所要达成的目的和可能存在的问题.随后,该文介绍自编码器的实际应用领域,分析这些领域的代表性自编码算法,并详细地分析、比较和总结这些方法的特点.最后,总结现有方法存在的问题,并探讨了自编码器的将来发展趋势和可能挑战. 展开更多
关键词 自编码器 深度学习 无监督学习 特征学习 约束
下载PDF
基于一维卷积神经网络的齿轮箱故障诊断 被引量:82
3
作者 吴春志 江鹏程 +2 位作者 冯辅周 陈汤 陈祥龙 《振动与冲击》 EI CSCD 北大核心 2018年第22期51-56,共6页
传统故障诊断方法通常需要先人工提取特征再用模式识别方法进行分类,难以解决端到端故障诊断的问题,为此,提出了一种利用一维卷积神经网络的齿轮箱故障诊断模型。其特点是可以直接从原始振动信号中学习特征并完成故障诊断。采用PHM 2009... 传统故障诊断方法通常需要先人工提取特征再用模式识别方法进行分类,难以解决端到端故障诊断的问题,为此,提出了一种利用一维卷积神经网络的齿轮箱故障诊断模型。其特点是可以直接从原始振动信号中学习特征并完成故障诊断。采用PHM 2009 Challenge Data和某型坦克变速箱的复合故障数据对三种传统模型和一维卷积神经网络模型进行测试,结果表明,1-DCNN模型对单一和复合故障诊断准确率均高于传统诊断方法。 展开更多
关键词 卷积神经网络 故障诊断 齿轮箱 特征学习
下载PDF
旋转机械一维深度卷积神经网络故障诊断研究 被引量:74
4
作者 周奇才 刘星辰 +2 位作者 赵炯 沈鹤鸿 熊肖磊 《振动与冲击》 EI CSCD 北大核心 2018年第23期31-37,共7页
针对旋转机械故障特征需要人工提取、复杂故障识别困难和诊断模型鲁棒性差的问题,在经典卷积神经网络Alex Net基础上,提出基于一维深度卷积神经网络的故障诊断模型,模型采用改进的一维卷积核和池化层以适应一维时域信号。相比传统智能... 针对旋转机械故障特征需要人工提取、复杂故障识别困难和诊断模型鲁棒性差的问题,在经典卷积神经网络Alex Net基础上,提出基于一维深度卷积神经网络的故障诊断模型,模型采用改进的一维卷积核和池化层以适应一维时域信号。相比传统智能诊断模型的人工特征提取和故障分类两阶段模式,该模型将两者合二为一:首先利用多个交替的卷积层和池化层完成原始信号自适应特征学习,然后结合全连接层实现故障诊断。通过轴承和齿轮箱健康状态监测实验表明,提出了模型可以实现高精度、稳定和快速的故障诊断,并与BP神经网络、SVM、一维Le Net5模型和经典Alex Net模型对比,证明了提出模型的优势,最后通过PCA可视化分析说明模型在特征提取上的有效性。 展开更多
关键词 深度学习 卷积神经网络 特征学习 智能诊断 旋转机械
下载PDF
基于深度学习的人脸识别方法综述 被引量:42
5
作者 余璀璨 李慧斌 《工程数学学报》 CSCD 北大核心 2021年第4期451-469,共19页
人脸识别与虹膜识别、指纹识别、步态识别等其它生物特征识别技术相比,具有自然、便捷、用户体验友好等独特优势,因而受到了学术界和工业界的广泛关注.近年来,在深度学习技术的驱动下,人脸识别技术取得了突破性进展,在面对表情、姿态、... 人脸识别与虹膜识别、指纹识别、步态识别等其它生物特征识别技术相比,具有自然、便捷、用户体验友好等独特优势,因而受到了学术界和工业界的广泛关注.近年来,在深度学习技术的驱动下,人脸识别技术取得了突破性进展,在面对表情、姿态、光照、遮挡等外在干扰因素时,仍表现出较好的鲁棒性.特别地,基于深度学习的人脸识别技术已广泛应用于安防、金融、教育、交通、新零售等应用领域.我们认识到,在人脸识别技术不断走向大众化的过程中,急需一些综述性的和普及性的文献来总结人脸识别技术的基本原理和基本方法.基于此,本文首先简要回顾了人脸识别的发展脉络,之后从人脸预处理、深度特征学习、特征比对、人脸数据集、评价标准五个方面重点介绍了基于深度学习的人脸识别技术.最后指出了人脸识别技术未来的发展趋势. 展开更多
关键词 人脸识别 深度学习 卷积神经网络 特征学习
下载PDF
大规模复杂信息网络表示学习:概念、方法与挑战 被引量:41
6
作者 齐金山 梁循 +2 位作者 李志宇 陈燕方 许媛 《计算机学报》 EI CSCD 北大核心 2018年第10期2394-2420,共27页
大数据时代的到来,使得当前的复杂信息网络研究领域面临着三个基础性问题,即网络的动态性、大规模性以及网络空间的高维性.传统复杂信息网络特征的表示通常以邻接矩阵、出入度、中心性等离散型方式表达,这种表达方式在现有的大规模动态... 大数据时代的到来,使得当前的复杂信息网络研究领域面临着三个基础性问题,即网络的动态性、大规模性以及网络空间的高维性.传统复杂信息网络特征的表示通常以邻接矩阵、出入度、中心性等离散型方式表达,这种表达方式在现有的大规模动态信息网络的新环境下,其计算效率及准确率都受到了很大的挑战.随着机器学习算法的不断发展,复杂信息网络的特征表示学习同样也引起了越来越多的关注.与自然语言中的词向量学习的目标类似,目前较为前沿的大规模复杂网络特征表示学习方法的目标是将网络中任意顶点的结构特征映射到一个低维度的、连续的实值向量,在进行这种映射的过程中,尽量保留顶点之间的结构特征关系,使大规模网络特征学习能够有效地应用于各类网络应用中,如网络中的链接预测、顶点分类、个性化推荐、大规模社区发现等.通过对复杂信息网络特征的学习,不仅能够有效缓解网络数据稀疏性问题,而且把网络中不同类型的异质信息融合为整体,可以更好地解决某些特定问题.同时,还能够高效地实现语义相关性操作,从而显著提升在大规模,特别是超大规模的网络中进行相似性顶点匹配的计算效率等.该文主要对近些年来关于复杂信息网络表示学习的方法和研究现状进行了总结,并提出自己的想法和意见.首先概述了表示学习的发展历史,然后分别阐述了有关大规模复杂信息网络、网络表示学习等基本概念与理论基础;接着,根据学习模型的不同,对经典的、大规模的、基于内容的、基于融合的以及异构的网络表示学习模型进行了全面的分析与比较.另外,对当前的网络表示学习方法所采用的实验数据集、评测指标以及应用场景等也进行了总结概括.最后给出了大规模复杂信息网络表示学习的研究难题以及未来的研究方向.大规模复杂 展开更多
关键词 大规模复杂信息网络 网络特征 顶点嵌入 网络表示学习 深度学习 特征学习
下载PDF
基于深度一维残差卷积自编码网络的齿轮箱故障诊断 被引量:39
7
作者 周兴康 余建波 《机械工程学报》 EI CAS CSCD 北大核心 2020年第7期96-108,共13页
一维振动信号常常被用于齿轮箱的监测与故障诊断中,使得能及时地对齿轮箱维护以减少损失。因此,从一维振动信号中提取出关键故障特征决定了故障诊断模型的准确性与可靠性。典型的深度神经网络(deep neural network, DNN),如卷积神经网... 一维振动信号常常被用于齿轮箱的监测与故障诊断中,使得能及时地对齿轮箱维护以减少损失。因此,从一维振动信号中提取出关键故障特征决定了故障诊断模型的准确性与可靠性。典型的深度神经网络(deep neural network, DNN),如卷积神经网络已经在故障诊断中表现出良好的性能并得到了广泛的应用,但其监督式训练方式往往需要大量的标签数据而限制了其可应用性。因此,提出一种新的深度神经网络模型,一维残差卷积自编码器(1-dimension residual convolutional auto-encoder,1DRCAE),成功应用于振动信号的无监督学习及故障特征提取,显著提高了齿轮箱的故障诊断率。首先,提出了一维卷积层与自编码器的有效集成方法,形成了深度一维卷积自编码器;其次,引入残差学习机制训练一维卷积自编码器,实现对一维振动信号有效地特征提取;最后,基于编码器提取的特征,使用少量标签数据进行分类微调实现齿轮箱故障模式识别。通过齿轮箱试验台采集的传感器数据进行实验验证表明,这种无监督学习方法具有良好的去噪能力和故障特征提取能力,其特征提取效果好于典型的深度神经网络,如深度置信网络(Deepbeliefnetwork,DBN)和堆叠自编码网络(Stackedauto-encoders,SAE),同时故障诊断效果也优于一维卷积神经网络(1-dimension convolutional neural network, 1DCNN)。 展开更多
关键词 齿轮箱故障诊断 特征学习 深度学习 卷积自编码器 残差学习
原文传递
基于多通道一维卷积神经网络特征学习的齿轮箱故障诊断方法 被引量:37
8
作者 叶壮 余建波 《振动与冲击》 EI CSCD 北大核心 2020年第20期55-66,共12页
为了解决单通道图像信号输入不能全面表达故障特征的问题,提出基于多通道一维卷积神经网络(Multi-Channel One-dimensional Convolutional Neural Network,MC-1DCNN)的故障特征学习方法。利用经验模态分解(Empirical Mode Decomposition... 为了解决单通道图像信号输入不能全面表达故障特征的问题,提出基于多通道一维卷积神经网络(Multi-Channel One-dimensional Convolutional Neural Network,MC-1DCNN)的故障特征学习方法。利用经验模态分解(Empirical Mode Decomposition,EMD)方法对信号进行处理,得到多通道一维信号;构建MC-1DCNN模型,对多通道一维信号进行特征提取。在MC-1DCNN的全连接层后接堆叠降噪自编码器(Stacked Denoised Autoencoder,SDAE)层,进一步进行维度缩减和特征提取并实现特征分类。通过某型号齿轮箱故障诊断实验对所提方法进行验证,实验结果表明,所提方法的特征提取能力和故障诊断效果显著优于典型的深度学习方法和机器学习分类器。 展开更多
关键词 齿轮箱故障诊断 多通道信号 卷积神经网络 堆叠降噪自编码器 特征学习
下载PDF
基于多通道加权卷积神经网络的齿轮箱振动信号特征提取 被引量:33
9
作者 叶壮 余建波 《机械工程学报》 EI CAS CSCD 北大核心 2021年第1期110-120,共11页
为了解决单通道振动信号输入不能全面表达故障特征信息及齿轮箱故障早期诊断问题,提出了一种新的深度神经网络(Deep neural network, DNN)模型—多通道加权卷积神经网络(Multi-channels weighted convolutional neural network,MCW-CNN)... 为了解决单通道振动信号输入不能全面表达故障特征信息及齿轮箱故障早期诊断问题,提出了一种新的深度神经网络(Deep neural network, DNN)模型—多通道加权卷积神经网络(Multi-channels weighted convolutional neural network,MCW-CNN),并应用于齿轮箱振动信号特征学习和故障诊断。首先,采用经验模态分解(Empirical mode decomposition,EMD)对振动信号进行处理,得到多通道一维信号突出振动信号的故障特征,并将其转化为多通道图像输入,从而充分发挥CNN在图像特征提取上的优良性能,将齿轮箱故障诊断问题进一步转化为CNN更为擅长的多通道图像识别问题;其次,针对各通道图像频率和带宽的不同,在卷积层采用动态感受野进行图像特征提取,全面提取多通道图像特征细节;针对各通道图像携带冲击特征的强弱不同,提出了基于峭度加权的多通道融合方法,增强了冲击特征强的通道故障特征。最后,通过故障诊断仿真试验和齿轮箱故障诊断试验验证所提方法的有效性。试验结果表明,MCW-CNN可有效提取振动信号的故障特征,识别正确率明显高于典型的深度学习方法和传统的分类器。 展开更多
关键词 齿轮箱故障诊断 多通道信号 特征学习 卷积神经网络 信息融合
原文传递
基于深度学习特征的稀疏表示的人脸识别方法 被引量:30
10
作者 马晓 张番栋 封举富 《智能系统学报》 CSCD 北大核心 2016年第3期279-286,共8页
本文针对传统的基于稀疏表示的人脸识别方法在小样本情况下对类内变化鲁棒性不强的问题,从特征的层面入手,提出了基于深度学习特征的稀疏表示的人脸识别方法。本方法首先利用深度卷积神经网络提取对类内变化不敏感的人脸特征,然后通过... 本文针对传统的基于稀疏表示的人脸识别方法在小样本情况下对类内变化鲁棒性不强的问题,从特征的层面入手,提出了基于深度学习特征的稀疏表示的人脸识别方法。本方法首先利用深度卷积神经网络提取对类内变化不敏感的人脸特征,然后通过稀疏表示对所得人脸特征进行表达分类。本文通过实验,说明了深度学习得到的特征也具有一定的子空间特性,符合基于稀疏表示的人脸识别方法对于子空间的假设条件。实验证明,基于深度学习特征的稀疏表示的人脸识别方法具有较好的识别准确度,对类内变化具有很好的鲁棒性,特别在小样本问题中具有尤为突出的优势。 展开更多
关键词 机器学习 生物特征识别 深度学习 特征学习 子空间 小样本 稀疏表示 人脸识别
下载PDF
基于动态加权密集连接卷积网络的变转速行星齿轮箱故障诊断 被引量:27
11
作者 熊鹏 汤宝平 +1 位作者 邓蕾 赵明航 《机械工程学报》 EI CAS CSCD 北大核心 2019年第7期52-57,共6页
针对变转速工况下基于深度学习的行星齿轮箱故障诊断问题,提出动态加权密集连接卷积网络的故障诊断方法。将行星齿轮箱振动信号的小波包系数二维矩阵输入到密集连接卷积网络作为网络的初始特征图;在密集连接卷积网络的跨层连接中加入动... 针对变转速工况下基于深度学习的行星齿轮箱故障诊断问题,提出动态加权密集连接卷积网络的故障诊断方法。将行星齿轮箱振动信号的小波包系数二维矩阵输入到密集连接卷积网络作为网络的初始特征图;在密集连接卷积网络的跨层连接中加入动态加权层,形成动态加权密集连接卷积网络,加强网络的深层信息传递;通过动态加权网络层自适应提取不同频带内的故障特征信息进行行星齿轮箱故障诊断。试验表明了所提的动态加权密集连接卷积网络能有效诊断变转速行星齿轮箱故障。 展开更多
关键词 密集连接卷积网络 故障诊断 特征学习 小波包变换 行星齿轮箱
原文传递
基于自适应深度网络的无人机目标跟踪算法 被引量:24
12
作者 刘芳 王洪娟 +2 位作者 黄光伟 路丽霞 王鑫 《航空学报》 EI CAS CSCD 北大核心 2019年第3期174-183,共10页
针对无人机(UAV)视频中目标易受到遮挡、形变、复杂背景干扰等问题,提出一种基于自适应深度网络的无人机目标跟踪算法。首先,基于主成分分析(PCA)和卷积神经网络(CNN)算法,设计3阶的自适应深度网络进行目标特征提取,该网络对图像的H、S... 针对无人机(UAV)视频中目标易受到遮挡、形变、复杂背景干扰等问题,提出一种基于自适应深度网络的无人机目标跟踪算法。首先,基于主成分分析(PCA)和卷积神经网络(CNN)算法,设计3阶的自适应深度网络进行目标特征提取,该网络对图像的H、S、I通道分别进行主成分分析学习,将得到的特征向量输入网络进行分层卷积,优化了网络结构,提高了网络的收敛速度和精度。其次,将目标深度特征输入核相关滤波算法进行目标跟踪,通过分析相邻2帧图像的变化率,采用分段自适应调整学习率的算法进行目标模板更新,有效地改善目标遮挡问题。仿真实验结果表明,该算法有效地避免了复杂因素干扰导致的跟踪精度下降,具有较好的鲁棒性,相较于全卷积跟踪(FCNT)算法平均跟踪精度提高了9.62%,平均跟踪成功率提高了11.9%。 展开更多
关键词 卷积神经网络 主成分分析 特征学习 相关滤波 目标跟踪
原文传递
基于注意力机制的行人重识别特征提取方法 被引量:23
13
作者 刘紫燕 万培佩 《计算机应用》 CSCD 北大核心 2020年第3期672-676,共5页
针对真实环境中非重叠多摄像头的行人重识别受到不同摄像机场景、视角、光照等因素的影响导致行人重识别精度低的问题,提出一种基于注意力机制的行人重识别特征提取方法。首先,使用随机擦除法对输入的行人图像进行数据增强,提高网络的... 针对真实环境中非重叠多摄像头的行人重识别受到不同摄像机场景、视角、光照等因素的影响导致行人重识别精度低的问题,提出一种基于注意力机制的行人重识别特征提取方法。首先,使用随机擦除法对输入的行人图像进行数据增强,提高网络的鲁棒性;然后,通过构建自上而下的注意力机制网络增强空间像素特征的显著性,并将注意力机制网络嵌入ResNet50网络提取整个行人的显著特征;最后,将整个行人的显著特征进行相似性度量并排序得到行人重识别的结果。该注意力机制的行人重识别特征提取方法在Market1501数据集上Rank1达到88.53%,平均精度均值(mAP)为70.70%;在DukeMTMC-reID数据集上Rank1达到77.33%,mAP为59.47%。所提方法在两大行人重识别数据集上性能都有明显提升,具有一定的应用价值。 展开更多
关键词 行人重识别 特征学习 注意力机制 数据增强 显著特征
下载PDF
Exploiting multi-channels deep convolutional neural networks for multivariate time series classification 被引量:21
14
作者 Yi ZHENG QiLIU +2 位作者 Enhong CHEN Yong GE J. Leon ZHAO 《Frontiers of Computer Science》 SCIE EI CSCD 2016年第1期96-112,共17页
Time series classification is related to many dif- ferent domains, such as health informatics, finance, and bioinformatics. Due to its broad applications, researchers have developed many algorithms for this kind of ta... Time series classification is related to many dif- ferent domains, such as health informatics, finance, and bioinformatics. Due to its broad applications, researchers have developed many algorithms for this kind of tasks, e.g., multivariate time series classification. Among the classifi- cation algorithms, k-nearest neighbor (k-NN) classification (particularly 1-NN) combined with dynamic time warping (DTW) achieves the state of the art performance. The defi- ciency is that when the data set grows large, the time con- sumption of 1-NN with DTW will be very expensive. In con- trast to 1-NN with DTW, it is more efficient but less ef- fective for feature-based classification methods since their performance usually depends on the quality of hand-crafted features. In this paper, we aim to improve the performance of traditional feature-based approaches through the feature learning techniques. Specifically, we propose a novel deep learning framework, multi-channels deep convolutional neu- ral networks (MC-DCNN), for multivariate time series classi- fication. This model first learns features from individual uni- variate time series in each channel, and combines information from all channels as feature representation at the final layer. Then, the learnt features are applied into a multilayer percep- tron (MLP) for classification. Finally, the extensive experi- ments on real-world data sets show that our model is not only more efficient than the state of the art but also competitive in accuracy. This study implies that feature learning is worth to be investigated for the problem of time series classification. 展开更多
关键词 convolutional neural networks time series clas-sification feature learning deep learning
原文传递
基于深度学习的作曲家分类问题 被引量:21
15
作者 胡振 傅昆 张长水 《计算机研究与发展》 EI CSCD 北大核心 2014年第9期1945-1954,共10页
在音乐信息检索领域,作曲家分类是一个十分重要的问题,这一问题的目标是通过音频数据来识别相应的作曲家信息.传统的分类算法都是通过提取复杂的特征来进行分类的,而深层神经网络在特征学习上具有比较强的能力,因此提出用深层神经网络... 在音乐信息检索领域,作曲家分类是一个十分重要的问题,这一问题的目标是通过音频数据来识别相应的作曲家信息.传统的分类算法都是通过提取复杂的特征来进行分类的,而深层神经网络在特征学习上具有比较强的能力,因此提出用深层神经网络来解决这一问题.为了结合不同深层神经网络模型的优点,设计了一种混合模型,该模型基于深度置信网络(deep belief network,DBN)和级联去噪自编码器(stacked denoising autoencoder,SDA),可以较好地解决作曲家分类问题.实验表明,该模型取得了76.26%的正确率,这一结果比单纯用某一种模型搭建的深层神经网络以及支持向量机要好.和图像数据类似,人脑在提取音乐特征也是分层的,每一层对信号的处理不一样,因此混合模型在解决作曲家分类问题上具有一定的优势. 展开更多
关键词 作曲家分类 深层神经网络 混合模型 特征学习 过学习
下载PDF
基于XGBoost的双层协同实时校正超短期光伏预测 被引量:21
16
作者 唐雅洁 林达 +1 位作者 倪筹帷 赵波 《电力系统自动化》 EI CSCD 北大核心 2021年第7期18-27,共10页
针对超短期光伏预测应对突发过程性天气时准确性普遍下降,而通过实时气象监测校正辐射值对设备要求较高、对精细化预报依赖性强的问题,以数据驱动为理念,提出了基于XGBoost的双层协同实时校正超短期光伏预测模型。根据大气运动的连续演... 针对超短期光伏预测应对突发过程性天气时准确性普遍下降,而通过实时气象监测校正辐射值对设备要求较高、对精细化预报依赖性强的问题,以数据驱动为理念,提出了基于XGBoost的双层协同实时校正超短期光伏预测模型。根据大气运动的连续演变性和自相似性,从机器学习角度推演气象整体连续变化的过程,提升预测精度。首先,基于数值天气预报(NWP),在基准层建立强相关气象特征的预测模型。然后,在实时层由临近时段内的基准层动态预测情况挖掘潜在的气象变化规律,并推测未来预测时段气象因素对于光伏出力的影响,对时段内基准预测值进行逐点校正。采用中国杭州滨江一实际光伏电站实采数据进行算例分析,分别与基于NWP特征学习、时序分析、误差推移的XGBoost预测模型以及决策树、支持向量机、长短期记忆网络这3种经典预测模型相比较,结果表明所提模型具有更高的超短期光伏预测精度。 展开更多
关键词 超短期光伏预测 XGBoost 特征学习 时间序列 误差推演 协同校正
下载PDF
深度学习跨模态图文检索研究综述 被引量:19
17
作者 刘颖 郭莹莹 +3 位作者 房杰 范九伦 郝羽 刘继明 《计算机科学与探索》 CSCD 北大核心 2022年第3期489-511,共23页
随着深度神经网络的兴起,多模态学习受到广泛关注。跨模态检索是多模态学习的重要分支,其目的在于挖掘不同模态样本之间的关系,即通过一种模态样本来检索具有近似语义的另一种模态样本。近年来,跨模态检索逐渐成为国内外学术界研究的前... 随着深度神经网络的兴起,多模态学习受到广泛关注。跨模态检索是多模态学习的重要分支,其目的在于挖掘不同模态样本之间的关系,即通过一种模态样本来检索具有近似语义的另一种模态样本。近年来,跨模态检索逐渐成为国内外学术界研究的前沿和热点,是信息检索领域未来发展的重要方向。首先,聚焦于深度学习跨模态图文检索研究的最新进展,对基于实值表示学习和基于二进制表示学习方法的发展动态进行了详细介绍,其中,基于实值表示的方法用于提升跨模态语义相关性,进而提高跨模态检索准确度,基于二进制表示学习的方法用于提升跨模态图文检索效率,减小存储空间;其次,总结了跨模态检索领域常用的公开数据集,对比了不同算法在不同数据集上的性能表现;此外,总结并分析了跨模态图文检索技术在公安、传媒及医学等领域的具体应用情况;最后,结合现有技术探讨了该领域的发展趋势及未来研究方向。 展开更多
关键词 跨模态检索 深度学习 特征学习 图文匹配 实值表示 二进制表示
下载PDF
多层级特征融合的无人机航拍图像目标检测 被引量:15
18
作者 徐光达 毛国君 《计算机科学与探索》 CSCD 北大核心 2023年第3期635-645,共11页
针对无人机航拍图像中小目标样本多、可提取特征信息少易受背景干扰的问题,基于YOLOv5提出一种多层特征融合的无人机航拍图像检测算法。首先,增加浅层网络的高分辨率特征图保留充足的目标特征信息,同时加入对应尺度的检测头以此增强对... 针对无人机航拍图像中小目标样本多、可提取特征信息少易受背景干扰的问题,基于YOLOv5提出一种多层特征融合的无人机航拍图像检测算法。首先,增加浅层网络的高分辨率特征图保留充足的目标特征信息,同时加入对应尺度的检测头以此增强对微小目标的检测能力;其次,考虑不同层级特征图所包含的信息对于小目标检测任务贡献不同,设计了多层级特征融合层来整合不同的感受野信息,通过融合不同层级特征图聚合上下文信息,并根据训练目标样本大小自适应生成各层级特征图输出权重来动态优化特征图的表达能力;最后,在预测过程中为了减少在不同任务中需求特征信息的冲突,将解耦检测头替换原本的耦合检测头,可以更佳地完成分类和定位任务。在公开数据集VisDrone上进行实验,该方法的平均均值精度达到了35.5%,较基线方法YOLOv5提高了4.4个百分点,同时与主流的检测方法相比也取得更高的检测精度。结果表明,所提出的方法对于小目标检测任务具有较好的性能。 展开更多
关键词 目标检测 特征融合 航拍图像 特征学习
下载PDF
基于改进卷积深度置信网络的轴承故障诊断研究 被引量:18
19
作者 谢佳琪 尤伟 +1 位作者 沈长青 朱忠奎 《电子测量与仪器学报》 CSCD 北大核心 2020年第2期36-43,共8页
机械设备故障诊断在工业应用中具有重要的意义。传统的基于振动信号处理与分析的故障诊断方法,依赖于丰富的专业知识和人工经验,难以保证准确的特征提取与故障诊断。利用深度学习方法可以自动学习数据深层次特征的特点,提出一种基于改... 机械设备故障诊断在工业应用中具有重要的意义。传统的基于振动信号处理与分析的故障诊断方法,依赖于丰富的专业知识和人工经验,难以保证准确的特征提取与故障诊断。利用深度学习方法可以自动学习数据深层次特征的特点,提出一种基于改进卷积深度置信网络的滚动轴承故障定性、定量诊断方法。首先,为了提供较好的浅层输入,将原始振动信号转换至频域信号;其次,在模型训练过程中,引入Adam优化器,加快模型训练,提高模型收敛速度;最后,为了充分发挥模型各层特征表征能力,对模型结构进行优化,提出多层特征融合学习结构,以提高模型的泛化能力。实验结果表明,所提出的改进模型相比于传统的栈式自动编码器、人工神经网络、深度置信网络以及标准卷积深度信念网络,具有更好的诊断精度,有效地实现了轴承故障的定性、定量化诊断。 展开更多
关键词 故障诊断 轴承 特征学习 卷积深度置信网络
下载PDF
稀疏自编码和Softmax回归的快速高效特征学习 被引量:18
20
作者 徐德荣 陈秀宏 田进 《传感器与微系统》 CSCD 2017年第5期55-58,共4页
针对特征学习效果与时间平衡问题,提出了一种快速高效的特征学习方法。将稀疏自编码和Softmax回归组合成一个新的特征提取模型,在提取原始图像潜在信息的基础上,利用多分类器返回值可以反映输入信息的相似程度的特点,快速高效的学习利... 针对特征学习效果与时间平衡问题,提出了一种快速高效的特征学习方法。将稀疏自编码和Softmax回归组合成一个新的特征提取模型,在提取原始图像潜在信息的基础上,利用多分类器返回值可以反映输入信息的相似程度的特点,快速高效的学习利于分类的特征向量。鉴于标签信息已知,该算法在图像分类效果上明显优于几种典型的特征学习方法。为了使所提算法具有更好的泛化能力,回归模型的损失函数中加入了L2范数防止过拟合,同时,采用随机梯度下降的方法得到模型的最优参数。在4个标准数据集上的测试结果表明该算法是有效可行的。 展开更多
关键词 稀疏自编码 Softmax回归 特征学习 图像分类 随机梯度下降
下载PDF
上一页 1 2 16 下一页 到第
使用帮助 返回顶部