期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
基于迁移学习与深度残差网络的滚动轴承快速故障诊断算法 被引量:38
1
作者 刘飞 陈仁文 +2 位作者 邢凯玲 丁汕汕 张迈一 《振动与冲击》 EI CSCD 北大核心 2022年第3期154-164,共11页
针对现有基于深度学习的滚动轴承故障诊断算法训练参数量大,训练时间长且需要大量训练样本的缺点,提出了一种基于迁移学习(TL)与深度残差网络(ResNet)的快速故障诊断算法(TL-ResNet)。首先开发了一种将短时傅里叶变换(STFT)与伪彩色处... 针对现有基于深度学习的滚动轴承故障诊断算法训练参数量大,训练时间长且需要大量训练样本的缺点,提出了一种基于迁移学习(TL)与深度残差网络(ResNet)的快速故障诊断算法(TL-ResNet)。首先开发了一种将短时傅里叶变换(STFT)与伪彩色处理相结合的振动信号转三通道图像数据的方法;然后将在ImageNet数据集上训练的ResNet18模型作为预训练模型,通过迁移学习的方法,应用到滚动轴承故障诊断领域当中;最后对滚动轴承在不同工况下的故障诊断问题,提出了采用小样本迁移的方法进行诊断。在凯斯西储大学(CWRU)与帕德博恩大学(PU)数据集上进行了试验,TL-ResNet的诊断准确率分别为99.8%与95.2%,且在CWRU数据集上TL-ResNet的训练时间仅要1.5 s,这表明本算法优于其他的基于深度学习的故障诊断算法与经典算法,可用于实际工业环境中的快速故障诊断。 展开更多
关键词 迁移学习 深度学习 短时傅里叶变换(STFT) 深度残差网络(ResNet) 滚动轴承故障诊断
下载PDF
基于深度强化学习的异构云无线接入网自适应无线资源分配算法 被引量:18
2
作者 陈前斌 管令进 +3 位作者 李子煜 王兆堃 杨恒 唐伦 《电子与信息学报》 EI CSCD 北大核心 2020年第6期1468-1477,共10页
为了满足无线数据流量大幅增长的需求,异构云无线接入网(H-CRAN)的资源优化仍然是亟待解决的重要问题。该文在H-CRAN下行链路场景下,提出一种基于深度强化学习(DRL)的无线资源分配算法。首先,该算法以队列稳定为约束,联合优化拥塞控制... 为了满足无线数据流量大幅增长的需求,异构云无线接入网(H-CRAN)的资源优化仍然是亟待解决的重要问题。该文在H-CRAN下行链路场景下,提出一种基于深度强化学习(DRL)的无线资源分配算法。首先,该算法以队列稳定为约束,联合优化拥塞控制、用户关联、子载波分配和功率分配,并建立网络总吞吐量最大化的随机优化模型。其次,考虑到调度问题的复杂性,DRL算法利用神经网络作为非线性近似函数,高效地解决维度灾问题。最后,针对无线网络环境的复杂性和动态多变性,引入迁移学习(TL)算法,利用TL的小样本学习特性,使得DRL算法在少量样本的情况下也能获得最优的资源分配策略。此外,TL通过迁移DRL模型的权重参数,进一步地加快了DRL算法的收敛速度。仿真结果表明,该文所提算法可以有效地增加网络吞吐量,提高网络的稳定性。 展开更多
关键词 异构云无线接入网络 资源分配 深度强化学习 迁移学习
下载PDF
基于迁移学习的卫星云图云分类 被引量:14
3
作者 胡凯 严昊 +3 位作者 夏旻 徐同 胡伟 徐春燕 《大气科学学报》 CSCD 北大核心 2017年第6期856-863,共8页
针对在基于机器学习的云图识别中,由于不存在公认的云分类样本库的现实条件下,带来的训练样本数量不足和不平衡,从而难以获得可靠的分类模型的问题,利用迁移学习中的多源加权Tradaboost算法(内部采用极限学习机作为分类器)来进行卫星云... 针对在基于机器学习的云图识别中,由于不存在公认的云分类样本库的现实条件下,带来的训练样本数量不足和不平衡,从而难以获得可靠的分类模型的问题,利用迁移学习中的多源加权Tradaboost算法(内部采用极限学习机作为分类器)来进行卫星云图云的检测。利用多人(多源)标注的大量厚云的样本,构成多源辅助样本集;利用少量标注的薄云样板构成目标样本集。使用迁移学习和辅助样本集,对仅在薄云样本集下的训练获得的极限学习机分类器进行辅助训练,提高其薄云识别率。基于国家卫星气象中心的HJ-1A/B的卫星数据实验结果表明,迁移学习可以充分利用容易获得的大样本厚云辅助样本知识,对同类型有关联的小样本薄云分类器进行识别提高。实验表明,迁移学习算法可以进一步用于更多多源样本和其他云分类的任务。 展开更多
关键词 云分类 迁移学习 极限学习机
下载PDF
基于迁移深度强化学习的低轨卫星跳波束资源分配方案 被引量:6
4
作者 陈前斌 麻世庆 +2 位作者 段瑞吉 唐伦 梁承超 《电子与信息学报》 EI CSCD 北大核心 2023年第2期407-417,共11页
针对低轨(LEO)卫星场景下,传统资源分配方案容易造成特定小区资源分配无法满足需求的问题,该文提出一种基于迁移深度强化学习(TDRL)的低轨卫星跳波束资源分配方案。首先,该方案联合星上缓冲信息、业务到达情况和信道状态,以最小化卫星... 针对低轨(LEO)卫星场景下,传统资源分配方案容易造成特定小区资源分配无法满足需求的问题,该文提出一种基于迁移深度强化学习(TDRL)的低轨卫星跳波束资源分配方案。首先,该方案联合星上缓冲信息、业务到达情况和信道状态,以最小化卫星上数据包平均时延为目标,建立支持跳波束技术的低轨卫星资源分配优化模型。其次,针对低轨卫星网络的动态多变性,该文考虑动态随机变化的通信资源和通信需求,采用深度Q网络(DQN)算法利用神经网络作为非线性近似函数。进一步,为实现并加速深度强化学习(DRL)算法在其他目标任务中的收敛过程,该文引入迁移学习(TL)概念,利用源卫星学习的调度任务快速寻找目标卫星的波束调度和功率分配策略。仿真结果表明,该文所提出的算法能够优化卫星服务过程中的时隙分配,减少数据包的平均传输时延,并有效提高系统的吞吐量和资源利用效率。 展开更多
关键词 低轨卫星网络 跳波束 资源分配 深度强化学习 迁移学习
下载PDF
一种基于局部加权均值的领域适应学习框架 被引量:8
5
作者 皋军 黄丽莉 孙长银 《自动化学报》 EI CSCD 北大核心 2013年第7期1037-1052,共16页
最大均值差异(Maximum mean discrepancy,MMD)作为一种能有效度量源域和目标域分布差异的标准已被成功运用.然而,MMD作为一种全局度量方法一定程度上反映的是区域之间全局分布和全局结构上的差异.为此,本文通过引入局部加权均值的方法... 最大均值差异(Maximum mean discrepancy,MMD)作为一种能有效度量源域和目标域分布差异的标准已被成功运用.然而,MMD作为一种全局度量方法一定程度上反映的是区域之间全局分布和全局结构上的差异.为此,本文通过引入局部加权均值的方法和理论到MMD中,提出一种具有局部保持能力的投影最大局部加权均值差异(Projected maximum local weighted mean discrepancy,PMLWD)度量,结合传统的学习理论提出基于局部加权均值的领域适应学习框架(Local weighted mean based domain adaptation learning framework,LDAF),在LDAF框架下,衍生出两种领域适应学习方法:LDAF MLC和LDAF SVM.最后,通过测试人工数据集、高维文本数据集和人脸数据集来表明LDAF比其他领域适应学习方法更具优势. 展开更多
关键词 迁移学习 领域适应学习 局部加权均值 投影最大局部加权均值差异 基于局部加权均值的领域适应学习框架
下载PDF
进化迁移优化算法综述 被引量:3
6
作者 伍洲 杨寒石 +2 位作者 邬俊俊 张海军 宋晴 《计算机工程》 CAS CSCD 北大核心 2023年第1期1-14,共14页
进化算法是模拟自然界生物进化的启发式算法,具有良好的搜索能力和灵活性且广泛用于复杂优化问题的求解,但在求解过程中默认问题先验知识为零,然而由于问题很少孤立存在,解决单一任务积累的经验可迁移至其他相关任务。进化迁移优化算法... 进化算法是模拟自然界生物进化的启发式算法,具有良好的搜索能力和灵活性且广泛用于复杂优化问题的求解,但在求解过程中默认问题先验知识为零,然而由于问题很少孤立存在,解决单一任务积累的经验可迁移至其他相关任务。进化迁移优化算法利用相关领域的知识学习和迁移,实现了更好的优化效率和性能。介绍进化迁移优化算法的基本分类,从源任务选择、知识迁移、缩小搜索空间差异、进化算法搜索、进化资源分配等5个角度出发对主流进化迁移优化算法的核心策略和优劣势进行梳理和分析。通过中国知网和WOS平台对2014年至2021年的进化迁移优化相关文献进行检索,运用知识图谱进行数据挖掘、信息处理、知识计量和图形绘制,根据进化迁移优化的发展趋势和经验分析总结了其面临的主要挑战和未来研究方向。 展开更多
关键词 进化算法 进化迁移优化 进化多任务优化 知识迁移 迁移学习
下载PDF
基于改进MobileNetV2的恶意代码分类方法 被引量:3
7
作者 轩勃娜 李进 +1 位作者 宋亚飞 马泽煊 《计算机应用》 CSCD 北大核心 2023年第7期2217-2225,共9页
针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图... 针对传统恶意代码分类方法存在的精度不足、预测时间成本高和抗混淆能力弱等问题,提出一种基于改进MobileNetV2的恶意代码分类方法。首先,针对恶意代码加密和混淆等问题,使用坐标注意力(CA)方法引入更大范围的空间位置来增强恶意代码图像的特征;然后,针对从头开始训练导致的训练成本过高的问题,使用迁移学习(TL)来改进MobileNetV2的学习方式以提升抗混淆能力;最后,针对传统深度学习网络计算量大和收敛慢的问题,使用MobileNetV2轻量化卷积网络模型,并结合Ranger21改进训练方式以促进网络迅速收敛。实验结果表明:上述方法对Malimg数据集和DataCon数据集的准确率分别达到了99.26%和96.98%。在malimg数据集相较于AlexNet方法在准确率上平均提升了1.49%,检测效率上平均提升了45.31%;在DataCon数据集相较于集成学习方法准确率平均提升了1.14%。可见,基于改进MobileNetV2的恶意代码分类方法可以提升模型的泛化能力、抗混淆能力与分类效率。 展开更多
关键词 网络安全 恶意代码分类 迁移学习 MobileNetV2 坐标注意力 Ranger21优化算法
下载PDF
基于预训练GoogleNet模型和迁移学习的齿轮箱故障检测方法 被引量:1
8
作者 杨魏华 阮爱国 黄国勇 《机电工程》 CAS 北大核心 2024年第2期262-270,共9页
针对以往齿轮箱故障诊断中特征处理算法繁琐、人为因素影响较大等问题,提出了一种基于预训练GoogleNet模型和迁移学习(TL)的故障诊断方法。首先,利用连续小波变换(CWT)将离散时间序列转变为二维小波尺度图,构建了样本集;然后,对预训练... 针对以往齿轮箱故障诊断中特征处理算法繁琐、人为因素影响较大等问题,提出了一种基于预训练GoogleNet模型和迁移学习(TL)的故障诊断方法。首先,利用连续小波变换(CWT)将离散时间序列转变为二维小波尺度图,构建了样本集;然后,对预训练模型进行了结构微调及参数微调使其符合任务需求,利用处理得到的训练样本对微调后的模型进行了微训练,使其达到理想精度,然后保存模型,再将其应用于故障分类任务;最后,为了对上述模型的可行性进行验证,利用昆明理工大学控制与优化重点实验室的平行齿轮箱数据以及东南大学的行星齿轮箱数据对微调模型进行了验证。研究结果表明:相比于传统卷积神经网络(CNN)以及未经预训练的GoogleNet模型,基于预训练GoogleNet模型和迁移学习的故障诊断方法在训练样本较少的情况下,其分类准确率均值仍然高达97.40%,且模型的收敛速度更快,对计算机算力的依赖程度更低。微调模型高层的方法能根据任务分类情况个性化设置模型输出,因此该模型能够适用于不同的场景。 展开更多
关键词 变速器 预训练网络 迁移学习 连续小波变换 尺度图 卷积神经网络
下载PDF
基于改进交替迁移学习的滚动轴承故障诊断算法
9
作者 王鹏 李丹青 王恒 《振动与冲击》 EI CSCD 北大核心 2024年第5期239-249,共11页
针对不同型号滚动轴承监测信号之间特征分布差异大、故障数据样本少,导致轴承故障精度低的问题,提出了一种基于改进交替迁移学习的滚动轴承故障诊断算法。为了充分发挥卷积神经网络(convolutional neural network, CNN)对二维数据优秀... 针对不同型号滚动轴承监测信号之间特征分布差异大、故障数据样本少,导致轴承故障精度低的问题,提出了一种基于改进交替迁移学习的滚动轴承故障诊断算法。为了充分发挥卷积神经网络(convolutional neural network, CNN)对二维数据优秀的特征提取能力,首先将一维振动信号转化为二维图像,输入到深度卷积神经网络中学习;其次,为了减少源域与目标域数据间的特征分布差异,提出了改进的交替迁移学习(improved alternately transfer learning, IATL),通过交替计算域间的CORAL损失函数和最大均值差异(maximum mean discrepancy, MMD)损失函数,并反向传播更新各层网络权重与偏置参数,以实现变工况、跨轴承型号和小故障样本条件下轴承特征迁移适配;最后,在全连接层使用Softmax函数对目标域数据进行故障诊断。为了验证该算法的有效性,采用凯斯西储大学(Case Western Reserve University, CWRU)的滚动轴承数据集进行了迁移试验验证。结果表明,与仅计算CORAL损失函数和MMD损失函数等算法对比可知,该算法有效地减少了领域数据之间的特征分布差异,具有较高的故障分类准确率。 展开更多
关键词 滚动轴承 故障诊断 迁移学习(tl) 损失函数 深度卷积神经网络
下载PDF
基于ResNet-ELM和迁移学习的风机齿轮箱故障诊断方法 被引量:2
10
作者 孙晔 张泽明 刘晓悦 《机电工程》 CAS 北大核心 2023年第7期978-987,1078,共11页
在变工况以及混合故障情况下,采用传统的方法对风力发电机齿轮箱进行故障诊断时,存在诊断效果不佳、泛化能力差等问题,为此,提出了一种基于深度残差网络(ResNet)-极限学习机(ELM)和迁移学习(TL)的风力发电机齿轮箱故障诊断方法(TL-RN-E... 在变工况以及混合故障情况下,采用传统的方法对风力发电机齿轮箱进行故障诊断时,存在诊断效果不佳、泛化能力差等问题,为此,提出了一种基于深度残差网络(ResNet)-极限学习机(ELM)和迁移学习(TL)的风力发电机齿轮箱故障诊断方法(TL-RN-ELM)。首先,分别介绍了连续小波变换(CWT)、卷神经网络(CNN)、深度残差网络(ResNet)、迁移学习(TL)、极限学习机(ELM)的原理;然后,基于上述原理,建立了TL-RN-ELM的风力发电机齿轮箱故障诊断模型(流程);最后,使用轴承数据集和齿轮箱数据集对上述方法进行了实验验证,即从美国凯斯西储大学(CWRU)轴承数据集和东南大学(SEU)齿轮箱数据集中进行了数据采集和处理,利用CWT将原始一维振动信号转换成了二维小波时频图像,使用CWRU轴承数据集对搭建的ResNet18模型进行了训练,生成了预训练模型;将预训练模型中的数据迁移至SEU齿轮箱数据集,微调了模块,提取了特征,并将其输入到ELM分类器,然后将分类结果与其他3类模型进行了对比分析。实验结果表明:对于从轴承到轴承、轴承到齿轮以及混合故障的小样本迁移故障诊断,TL-RN-ELM的平均准确率可达98.79%;与其他方法相比,该方法的平均准确率提升了4.73%~9.6%。研究结果表明:该方法具有良好的诊断效果和泛化能力。 展开更多
关键词 齿轮传动 迁移学习 深度残差网络 极限学习机 卷积神经网络 连续小波变换 模型预训练 模型迁移 小波时频图
下载PDF
基于迁移学习和参数优化的干扰效能评估方法
11
作者 孙志国 肖硕 +2 位作者 吴毅杰 李诗铭 王震铎 《电子与信息学报》 EI CAS CSCD 北大核心 2024年第6期2515-2524,共10页
针对数字通信系统中传统误码率评估导致干扰效能评估结果单一的问题,该文提出了一种基于迁移学习和参数优化的干扰效能评估方法。该方法选取各信号处理模块的核心参数作为机器学习的训练指标,并以优劣解距离的评估结果作为分类标准,采... 针对数字通信系统中传统误码率评估导致干扰效能评估结果单一的问题,该文提出了一种基于迁移学习和参数优化的干扰效能评估方法。该方法选取各信号处理模块的核心参数作为机器学习的训练指标,并以优劣解距离的评估结果作为分类标准,采用支持向量机训练评估模型。通过改进蚁群算法的全局搜索能力和迁移学习的知识传递特性分别解决了支持向量机中的参数优化问题和训练样本中的数据缺失问题。仿真实验结果表明,掌握源域数据集的支持向量机在模型准确度方面提升4.2%,牺牲初始收敛能力的参数优化与最优解的靠近程度提升4.7%,并且可以应用于数字通信系统的干扰效能评估。 展开更多
关键词 干扰效能评估 数字通信 支持向量机 蚁群优化 迁移学习
下载PDF
融合迁移学习与CGAN的风电集群功率超短期预测
12
作者 周军 王渴心 王岩 《电力系统及其自动化学报》 CSCD 北大核心 2024年第5期9-18,共10页
针对可再生能源不确定性导致电力系统消纳能力不足的问题,提出一种基于条件生成对抗网络与迁移学习融合的风电集群功率超短期预测方法。首先,分析了风电集群功率预测样本模式的不均衡性以及导致的神经网络预测误差偏移现象;其次,构建了... 针对可再生能源不确定性导致电力系统消纳能力不足的问题,提出一种基于条件生成对抗网络与迁移学习融合的风电集群功率超短期预测方法。首先,分析了风电集群功率预测样本模式的不均衡性以及导致的神经网络预测误差偏移现象;其次,构建了条件生成对抗网络修复不均衡问题;最后,采用迁移学习结合时间卷积网络构建了风电集群功率超短期预测模型。测试结果表明,所提方法能够显著提高风电集群功率超短期预测精度。 展开更多
关键词 风电预测 风电集群 条件生成对抗网络 迁移学习 时间卷积网络
下载PDF
强化学习中的策略重用:研究进展 被引量:4
13
作者 何立 沈亮 +2 位作者 李辉 王壮 唐文泉 《系统工程与电子技术》 EI CSCD 北大核心 2022年第3期884-899,共16页
策略重用(policy reuse, PR)作为一种迁移学习(transfer learning, TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning, RL)收敛... 策略重用(policy reuse, PR)作为一种迁移学习(transfer learning, TL)方法,通过利用任务之间的内在联系,将过去学习到的经验、知识用于加速学习当前的目标任务,不仅能够在很大程度上解决传统强化学习(reinforcement learning, RL)收敛速度慢、资源消耗大等问题,而且避免了在相似问题上难以复用的问题。本文综述了RL中的PR方法,将现有方法细分为策略重构、奖励设计、问题转换、相似性度量等方面来分别介绍和分析各自的特点,及其在多智能体场景和深度RL(deep RL, DRL)中的扩展。并且,介绍了源和目标任务之间的映射方法。最后,基于当前PR的应用,叙述了该课题在未来发展方向上的一些猜想和假设。 展开更多
关键词 强化学习 迁移学习 策略重用 任务映射
下载PDF
基于多语BERT的无监督攻击性言论检测 被引量:4
14
作者 师夏阳 张风远 +1 位作者 袁嘉琪 黄敏 《计算机应用》 CSCD 北大核心 2022年第11期3379-3385,共7页
攻击性言论会对社会安定造成严重不良影响,但目前攻击性言论自动检测主要集中在少数几种高资源语言,对低资源语言缺少足够的攻击性言论标注语料导致检测困难,为此,提出一种跨语言无监督攻击性迁移检测方法。首先,使用多语BERT(mBERT)模... 攻击性言论会对社会安定造成严重不良影响,但目前攻击性言论自动检测主要集中在少数几种高资源语言,对低资源语言缺少足够的攻击性言论标注语料导致检测困难,为此,提出一种跨语言无监督攻击性迁移检测方法。首先,使用多语BERT(mBERT)模型在高资源英语数据集上进行对攻击性特征的学习,得到一个原模型;然后,通过分析英语与丹麦语、阿拉伯语、土耳其语、希腊语的语言相似程度,将原模型迁移到这四种低资源语言上,实现对低资源语言的攻击性言论自动检测。实验结果显示,与BERT、线性回归(LR)、支持向量机(SVM)、多层感知机(MLP)这四种方法相比,所提方法在丹麦语、阿拉伯语、土耳其语、希腊语这四种语言上的攻击性言论检测的准确率和F1值均提高了近2个百分点,接近目前的有监督检测,可见采用跨语言模型迁移学习和迁移检测相结合的方法能够实现对低资源语言的无监督攻击性检测。 展开更多
关键词 跨语言模型 攻击性言论检测 BERT 无监督方法 迁移学习
下载PDF
基于多尺度残差网络的域适应轴承故障识别方法
15
作者 赵志宏 孙美玲 窦广鉴 《机电工程》 CAS 北大核心 2023年第12期1898-1906,共9页
不同工况下的故障轴承原始振动信号存在分布差异较大的问题,在进行故障诊断时也会存在特征提取不充分,从而导致故障诊断模型诊断精度较低的问题,为此,提出了一种基于多尺度残差网络的对数相关对齐(logCORAL-MsRN)的域适应轴承故障识别方... 不同工况下的故障轴承原始振动信号存在分布差异较大的问题,在进行故障诊断时也会存在特征提取不充分,从而导致故障诊断模型诊断精度较低的问题,为此,提出了一种基于多尺度残差网络的对数相关对齐(logCORAL-MsRN)的域适应轴承故障识别方法(模型)。首先,对轴承原始振动信号进行了预处理,将其转换为二维灰度图像;然后,使用多尺度残差块和空洞卷积对残差神经网络ResNet50的网络结构进行了改进,设计了一种多尺度残差网络(MsRN),以充分提取轴承的故障特征,避免深层网络结构的梯度消失问题;提出了一种对数相关对齐(logCORAL)域适应方法,更好地进行了域间分布对齐;最后,采用交叉熵损失和logCORAL损失作为目标优化函数,对上述模型(方法)进行了训练,在美国凯斯西储大学(CWRU)公开数据集上进行了变工况下的对比实验和消融实验。研究结果表明:logCORAL-MsRN方法在变工况条件下的轴承故障诊断的平均准确率高达96.53%,并且优于其他对比方法,即特征提取网络MsRN可以提取出不同尺度的、更加丰富的轴承故障信息,域适应方法logCORAL可以有效地对齐源域和目标域之间的特征分布,验证了该方法的有效性及优越性。 展开更多
关键词 多尺度残差网络对数相关对齐 域适应 深度学习 迁移学习 变工况对比实验 消融实验
下载PDF
随机集成策略迁移 被引量:1
16
作者 常田 章宗长 俞扬 《计算机科学与探索》 CSCD 北大核心 2022年第11期2531-2536,共6页
强化学习(RL)在序列决策问题上取得了巨大的成功。随着强化学习的飞速发展,迁移学习(TL)成为了一种重要的可以通过利用和转移外部知识来加速强化学习的技术。策略迁移是一种外部知识来自教师策略的迁移强化学习方法。现有的策略转移方... 强化学习(RL)在序列决策问题上取得了巨大的成功。随着强化学习的飞速发展,迁移学习(TL)成为了一种重要的可以通过利用和转移外部知识来加速强化学习的技术。策略迁移是一种外部知识来自教师策略的迁移强化学习方法。现有的策略转移方法要么通过测量源任务与目标任务之间的相似性来转移知识,要么通过估计源策略在目标任务上的性能来选择最佳源策略。但是,性能估计有时可能不可靠,这可能会导致负迁移。针对这种问题,提出了一种新的策略转移方法,称为随机集成策略迁移(SEPT)。SEPT不是在源策略库中选择一个策略,而是利用源策略集成出教师策略来进行迁移。SEPT把策略迁移转变为选项学习问题以便获得终止概率,用终止概率计算出源策略的概率权重,根据概率权重从策略库中集成出教师策略。然后,通过策略蒸馏的方式从教师策略进行知识迁移。实验结果表明SEPT可以有效地加速强化学习训练,并且在离散和连续空间上都能胜过其他最佳的策略迁移方法。 展开更多
关键词 迁移学习(tl) 强化学习(RL) 策略迁移 选项学习 集成 策略蒸馏
下载PDF
双Q网络学习的迁移强化学习算法 被引量:3
17
作者 曾睿 周建 +2 位作者 刘满禄 张俊俊 陈卓 《计算机应用研究》 CSCD 北大核心 2021年第6期1699-1703,共5页
深度强化学习在训练过程中会探索大量环境样本,造成算法收敛时间过长,而重用或传输来自先前任务(源任务)学习的知识,对算法在新任务(目标任务)的学习具有提高算法收敛速度的潜力。为了提高算法学习效率,提出一种双Q网络学习的迁移强化... 深度强化学习在训练过程中会探索大量环境样本,造成算法收敛时间过长,而重用或传输来自先前任务(源任务)学习的知识,对算法在新任务(目标任务)的学习具有提高算法收敛速度的潜力。为了提高算法学习效率,提出一种双Q网络学习的迁移强化学习算法,其基于actor-critic框架迁移源任务最优值函数的知识,使目标任务中值函数网络对策略作出更准确的评价,引导策略快速向最优策略方向更新。将该算法用于Open AI Gym以及在三维空间机械臂到达目标物位置的实验中,相比于常规深度强化学习算法取得了更好的效果,实验证明提出的双Q网络学习的迁移强化学习算法具有较快的收敛速度,并且在训练过程中算法探索更加稳定。 展开更多
关键词 深度强化学习 双Q网络学习 actor-critic框架 迁移学习
下载PDF
数据驱动的RF信号深度调制识别方法
18
作者 徐亚军 郭恩豪 +1 位作者 陈林 司成可 《计算机与现代化》 2022年第6期80-86,95,共8页
基于卷积结构的信号调制识别神经网络的识别性能受信号调制类型种类限制。例如,在12 d B信噪比条件下,同时对24种信号调制类型进行识别,其识别准确率仅为80%。若需要进一步提高识别性能,则要求更复杂的网络模型,导致网络训练所需数据集... 基于卷积结构的信号调制识别神经网络的识别性能受信号调制类型种类限制。例如,在12 d B信噪比条件下,同时对24种信号调制类型进行识别,其识别准确率仅为80%。若需要进一步提高识别性能,则要求更复杂的网络模型,导致网络训练所需数据集规模和硬件资源成本增大。鉴于此,针对无线电信号特征,设计一种适用于无线电信号调制识别的紧致残差神经网络,将其作为信号调制类型特征学习和特征提取工具,实现从原始I、Q数据到信号调制类型的端到端识别。利用迁移学习降低网络重新训练所需样本数,增强在无线信道响应发生变化时的环境适应能力,降低训练阶段所需的硬件资源和训练数据集规模。研究表明,当信道脉冲响应改变时,所提的信号调制识别神经网络在信噪比为12 d B条件下的识别性能达到95%,多个对比实验验证本文所设计神经网络的识别性能具有优势。 展开更多
关键词 深度调制识别 残差神经网络 迁移学习 数据驱动 卷积神经网络
下载PDF
机场终端区RF信号深度调制识别方法
19
作者 陈林 唐文波 +1 位作者 丁学科 樊荣 《计算机与数字工程》 2022年第2期424-430,共7页
论文构建了24种不同信号调制类型的数据集,并提出一款端到端的信号调制识别神经网络。研究了网络卷积层数、卷积核以及训练数据集大小对信号调制识别性能的影响。所提方法避免了基于特征提取的信号调制识别方法中所需的特征选择、信号... 论文构建了24种不同信号调制类型的数据集,并提出一款端到端的信号调制识别神经网络。研究了网络卷积层数、卷积核以及训练数据集大小对信号调制识别性能的影响。所提方法避免了基于特征提取的信号调制识别方法中所需的特征选择、信号同步、载波跟踪、信噪比估计等繁杂的处理流程。最后,引入迁移学习技术解决因信道环境变化导致网络识别性能下降的问题,提升了所提网络的环境适应能力。实验结果表明当信道环境发生变化时,通过迁移学习,仅利用不到总样本数的40%作为训练样本即可实现与全部数据集相近的识别性能,并且网络训练时长同比降至总训练样本所需训练时长的1/3。 展开更多
关键词 深度调制识别 机场终端区 数据驱动 卷积神经网络 迁移学习
下载PDF
基于深度特征选取的旋转机械跨域故障诊断 被引量:2
20
作者 何财林 费国华 +2 位作者 朱坚 董飞 宋俊材 《机电工程》 CAS 北大核心 2022年第10期1345-1355,共11页
在实际的工业场景中,对旋转机械进行故障诊断时,存在着标签故障样本不足和数据分布差异的问题,为此,基于深度特征选取和迁移学习方法,提出了一种新的跨域故障诊断方法。首先,利用深度自编码器进行了深度特征提取,利用不同激活函数下的... 在实际的工业场景中,对旋转机械进行故障诊断时,存在着标签故障样本不足和数据分布差异的问题,为此,基于深度特征选取和迁移学习方法,提出了一种新的跨域故障诊断方法。首先,利用深度自编码器进行了深度特征提取,利用不同激活函数下的深度自编码器提取出的深度特征,构建了深度特征池;然后,采用提出的面向跨域诊断的特征选取方法,选取了可迁移特征用于后续的特征迁移学习,利用所提出的改进联合分布适应方法,降低了源域和目标域特征数据间分布差异;最后,基于经迁移学习后的有标签源域样本和无标签目标域样本,对故障识别分类器进行了训练,并利用机械故障模拟实验台的轴承和电机故障数据,开展了旋转机械跨域故障诊断的实验。研究结果表明:与对比模型相比,所提出的方法能够取得更优秀的跨域故障诊断性能;在选取合适的特征数时,其最大故障诊断准确率明显高于其他对比模型(其中,轴承为95.42%,电机为88.67%)。 展开更多
关键词 转动机件 标签故障样本不足 深度特征选取 联合分布适应 多核最大均值差异 迁移学习方法 深度自编码器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部