1
|
深度强化学习理论及其应用综述 |
万里鹏
兰旭光
张翰博
郑南宁
|
《模式识别与人工智能》
EI
CSCD
北大核心
|
2019 |
67
|
|
2
|
基于Q-learning的虚拟网络功能调度方法 |
王晓雷
陈云杰
王琛
牛犇
|
《计算机工程》
CAS
CSCD
北大核心
|
2019 |
35
|
|
3
|
求解随机需求库存-路径问题的一种算法 |
赵达
李军
马丹祥
|
《系统工程》
CSCD
北大核心
|
2006 |
18
|
|
4
|
基于马尔科夫决策过程的应急资源调度方案的动态优化 |
王炜
刘茂
王丽
|
《南开大学学报(自然科学版)》
CAS
CSCD
北大核心
|
2010 |
22
|
|
5
|
多Agent系统中任务分配问题的分析与建模 |
马巧云
洪流
陈学广
|
《华中科技大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2007 |
11
|
|
6
|
基于深度强化学习的两阶段显著性目标检测 |
卢笑
曹意宏
周炫余
王耀南
|
《电子测量与仪器学报》
CSCD
北大核心
|
2021 |
18
|
|
7
|
计及多种储能协调运行的数据中心实时能量管理 |
吴云芸
方家琨
艾小猛
薛熙臻
胡伟
沈煜
文劲宇
|
《电力自动化设备》
EI
CSCD
北大核心
|
2021 |
18
|
|
8
|
基于运行状态监测与预测的海上风机维护策略 |
刘璐洁
符杨
马世伟
赵华
|
《电网技术》
EI
CSCD
北大核心
|
2015 |
17
|
|
9
|
基于模糊-概率策略实时反馈的虚拟电厂多时间尺度优化调度 |
李翔宇
赵冬梅
|
《电工技术学报》
EI
CSCD
北大核心
|
2021 |
16
|
|
10
|
基于马尔科夫决策过程的家庭能量管理智能优化策略 |
傅质馨
李潇逸
朱俊澎
袁越
|
《电力自动化设备》
EI
CSCD
北大核心
|
2020 |
16
|
|
11
|
网络结构自调整的柔性内涵初探 |
程东年
汪斌强
王保进
张建辉
|
《通信学报》
EI
CSCD
北大核心
|
2012 |
15
|
|
12
|
基于深度强化学习的有轨电车信号优先控制 |
王云鹏
郭戈
|
《自动化学报》
EI
CSCD
北大核心
|
2019 |
15
|
|
13
|
基于MDP及激励需求响应的电动汽车有序充电控制 |
廖鑫
李婧
徐佳
宋长平
|
《电力科学与技术学报》
CAS
北大核心
|
2021 |
14
|
|
14
|
多机器人系统强化学习研究综述 |
马磊
张文旭
戴朝华
|
《西南交通大学学报》
EI
CSCD
北大核心
|
2014 |
14
|
|
15
|
马尔科夫决策过程在多路径冗余传输调度算法中的应用 |
于波
于东
孙建伟
|
《小型微型计算机系统》
CSCD
北大核心
|
2012 |
12
|
|
16
|
汽车纵向自动驾驶的因果推理型决策 |
高振海
孙天骏
何磊
|
《吉林大学学报(工学版)》
EI
CAS
CSCD
北大核心
|
2019 |
12
|
|
17
|
基于MDP框架的飞行器隐蔽接敌策略 |
徐安
于雷
寇英信
徐保伟
李战武
|
《系统工程与电子技术》
EI
CSCD
北大核心
|
2011 |
11
|
|
18
|
基于深度强化学习的配电网实时电压优化控制方法 |
全欢
彭显刚
刘涵予
周鹏
吴泽霖
苏浩坤
|
《电网技术》
EI
CSCD
北大核心
|
2023 |
7
|
|
19
|
基于DQN和DDPG算法的交直流配电网多设备协同电压控制方法 |
韩照洋
赵倩宇
王守相
董逸超
钱广超
|
《供用电》
|
2023 |
7
|
|
20
|
基于深度宽卷积Q网络的行星齿轮箱故障智能诊断方法 |
王辉
徐佳文
严如强
|
《仪器仪表学报》
EI
CAS
CSCD
北大核心
|
2022 |
9
|
|