期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于自生成专家样本的探索增强算法
1
作者
刘健
赵恒一
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023年第3期485-492,共8页
为进一步提高深度强化学习算法在连续动作环境中的探索能力,以获得更高水平的奖励值,本文提出了基于自生成专家样本的探索增强算法.首先,为满足自生成专家样本机制以及在连续动作环境中的学习,在双延迟深度确定性策略梯度算法的基础上,...
为进一步提高深度强化学习算法在连续动作环境中的探索能力,以获得更高水平的奖励值,本文提出了基于自生成专家样本的探索增强算法.首先,为满足自生成专家样本机制以及在连续动作环境中的学习,在双延迟深度确定性策略梯度算法的基础上,设置了两个经验回放池结构,搭建了确定性策略算法的总体框架.同时提出复合策略更新方法,在情节的内部循环中加入一种类同策略学习过程,智能体在这个过程中完成对于参数空间的启发式探索.然后,提出基于自生成专家样本的演示机制,由智能体自身筛选产生专家样本,并根据参数的更新不断调整,进而形成动态的筛选标准,之后智能体将模仿这些专家样本进行学习.在OpenAI Gym的8组虚拟环境中的仿真实验表明,本文提出的算法能够有效提升深度强化学习的探索能力.
展开更多
关键词
深度强化学习
探索
专家
样本
确定性策略
下载PDF
职称材料
基于专家样本库和最小二乘支持向量机的配电网线损率预测模型
被引量:
32
2
作者
丁忠安
高琛
+2 位作者
蒋敏敏
林永春
吕游
《水电能源科学》
北大核心
2020年第3期195-198,194,共5页
配电网线损率是评价电网企业运营的一项重要经济指标,利用电力运行数据建立线损率模型时建模样本对模型的预测精度具有重要影响。对此,提出了一种基于专家样本库和最小二乘支持向量机(LS-SVM)的线损率计算模型,利用离散粒子群优化算法...
配电网线损率是评价电网企业运营的一项重要经济指标,利用电力运行数据建立线损率模型时建模样本对模型的预测精度具有重要影响。对此,提出了一种基于专家样本库和最小二乘支持向量机(LS-SVM)的线损率计算模型,利用离散粒子群优化算法从台区配电网电力运行数据中寻找包含较大运行状态信息量的样本记录,构建专家样本库,考虑台区配电网的有功供电量、无功供电量、端口电流、居民容量占比、表计数目及气象温度和气象湿度,基于专家样本库采用LS-SVM算法建立配电网线损率预测模型,并利用该模型对0.4kV配电网线损率进行计算验证。结果表明,基于专家样本库建立的线损率模型与普通样本建立的模型相比,具有更高的预测精度。
展开更多
关键词
线损率
最小二乘支持向量机
专家
样本
库
离散粒子群
电力数据
预测模型
下载PDF
职称材料
题名
基于自生成专家样本的探索增强算法
1
作者
刘健
赵恒一
机构
中国矿业大学信息与控制工程学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023年第3期485-492,共8页
基金
国家自然科学基金项目(61906198)
江苏省自然科学基金项目(BK20190622)资助。
文摘
为进一步提高深度强化学习算法在连续动作环境中的探索能力,以获得更高水平的奖励值,本文提出了基于自生成专家样本的探索增强算法.首先,为满足自生成专家样本机制以及在连续动作环境中的学习,在双延迟深度确定性策略梯度算法的基础上,设置了两个经验回放池结构,搭建了确定性策略算法的总体框架.同时提出复合策略更新方法,在情节的内部循环中加入一种类同策略学习过程,智能体在这个过程中完成对于参数空间的启发式探索.然后,提出基于自生成专家样本的演示机制,由智能体自身筛选产生专家样本,并根据参数的更新不断调整,进而形成动态的筛选标准,之后智能体将模仿这些专家样本进行学习.在OpenAI Gym的8组虚拟环境中的仿真实验表明,本文提出的算法能够有效提升深度强化学习的探索能力.
关键词
深度强化学习
探索
专家
样本
确定性策略
Keywords
deep reinforcement learning
exploration
expert sample
deterministic policy
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
基于专家样本库和最小二乘支持向量机的配电网线损率预测模型
被引量:
32
2
作者
丁忠安
高琛
蒋敏敏
林永春
吕游
机构
国网福建省电力有限公司电力科学研究院
国网信通亿力科技有限责任公司
华北电力大学新能源电力系统国家重点实验室
出处
《水电能源科学》
北大核心
2020年第3期195-198,194,共5页
基金
国家自然科学基金青年基金项目(51606063)。
文摘
配电网线损率是评价电网企业运营的一项重要经济指标,利用电力运行数据建立线损率模型时建模样本对模型的预测精度具有重要影响。对此,提出了一种基于专家样本库和最小二乘支持向量机(LS-SVM)的线损率计算模型,利用离散粒子群优化算法从台区配电网电力运行数据中寻找包含较大运行状态信息量的样本记录,构建专家样本库,考虑台区配电网的有功供电量、无功供电量、端口电流、居民容量占比、表计数目及气象温度和气象湿度,基于专家样本库采用LS-SVM算法建立配电网线损率预测模型,并利用该模型对0.4kV配电网线损率进行计算验证。结果表明,基于专家样本库建立的线损率模型与普通样本建立的模型相比,具有更高的预测精度。
关键词
线损率
最小二乘支持向量机
专家
样本
库
离散粒子群
电力数据
预测模型
Keywords
line loss rate
least squares support vector machine
expert sample base
discrete particle swarm optimization
electricity data
prediction model
分类号
TM714 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于自生成专家样本的探索增强算法
刘健
赵恒一
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023
0
下载PDF
职称材料
2
基于专家样本库和最小二乘支持向量机的配电网线损率预测模型
丁忠安
高琛
蒋敏敏
林永春
吕游
《水电能源科学》
北大核心
2020
32
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部