期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于自生成专家样本的探索增强算法
1
作者 刘健 赵恒一 《控制理论与应用》 EI CAS CSCD 北大核心 2023年第3期485-492,共8页
为进一步提高深度强化学习算法在连续动作环境中的探索能力,以获得更高水平的奖励值,本文提出了基于自生成专家样本的探索增强算法.首先,为满足自生成专家样本机制以及在连续动作环境中的学习,在双延迟深度确定性策略梯度算法的基础上,... 为进一步提高深度强化学习算法在连续动作环境中的探索能力,以获得更高水平的奖励值,本文提出了基于自生成专家样本的探索增强算法.首先,为满足自生成专家样本机制以及在连续动作环境中的学习,在双延迟深度确定性策略梯度算法的基础上,设置了两个经验回放池结构,搭建了确定性策略算法的总体框架.同时提出复合策略更新方法,在情节的内部循环中加入一种类同策略学习过程,智能体在这个过程中完成对于参数空间的启发式探索.然后,提出基于自生成专家样本的演示机制,由智能体自身筛选产生专家样本,并根据参数的更新不断调整,进而形成动态的筛选标准,之后智能体将模仿这些专家样本进行学习.在OpenAI Gym的8组虚拟环境中的仿真实验表明,本文提出的算法能够有效提升深度强化学习的探索能力. 展开更多
关键词 深度强化学习 探索 专家样本 确定性策略
下载PDF
基于专家样本库和最小二乘支持向量机的配电网线损率预测模型 被引量:32
2
作者 丁忠安 高琛 +2 位作者 蒋敏敏 林永春 吕游 《水电能源科学》 北大核心 2020年第3期195-198,194,共5页
配电网线损率是评价电网企业运营的一项重要经济指标,利用电力运行数据建立线损率模型时建模样本对模型的预测精度具有重要影响。对此,提出了一种基于专家样本库和最小二乘支持向量机(LS-SVM)的线损率计算模型,利用离散粒子群优化算法... 配电网线损率是评价电网企业运营的一项重要经济指标,利用电力运行数据建立线损率模型时建模样本对模型的预测精度具有重要影响。对此,提出了一种基于专家样本库和最小二乘支持向量机(LS-SVM)的线损率计算模型,利用离散粒子群优化算法从台区配电网电力运行数据中寻找包含较大运行状态信息量的样本记录,构建专家样本库,考虑台区配电网的有功供电量、无功供电量、端口电流、居民容量占比、表计数目及气象温度和气象湿度,基于专家样本库采用LS-SVM算法建立配电网线损率预测模型,并利用该模型对0.4kV配电网线损率进行计算验证。结果表明,基于专家样本库建立的线损率模型与普通样本建立的模型相比,具有更高的预测精度。 展开更多
关键词 线损率 最小二乘支持向量机 专家样本 离散粒子群 电力数据 预测模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部