1
|
数据驱动的工业过程运行优化控制 |
李金娜
高溪泽
柴天佑
范家璐
|
《控制理论与应用》
EI
CAS
CSCD
北大核心
|
2016 |
13
|
|
2
|
基于Q-强化学习的多Agent协商策略及算法 |
隋新
蔡国永
史磊
|
《计算机工程》
CAS
CSCD
北大核心
|
2010 |
7
|
|
3
|
基于RBF神经网络和强化学习算法的供应链产销协同计划冲突消解研究 |
武玉英
李豪
蒋国瑞
|
《计算机应用研究》
CSCD
北大核心
|
2015 |
5
|
|
4
|
基于Q-Learning反馈机制的无线传感网络通信节点自愈算法 |
杨惠
|
《传感技术学报》
CAS
CSCD
北大核心
|
2022 |
3
|
|
5
|
基于Q-Learning算法的无人机空战机动决策研究 |
姚培源
魏潇龙
俞利新
李胜厚
|
《电光与控制》
CSCD
北大核心
|
2023 |
0 |
|
6
|
基于改进DQN强化学习算法的弹性光网络资源分配研究 |
尚晓凯
韩龙龙
翟慧鹏
|
《光通信技术》
|
2023 |
0 |
|
7
|
基于Q-强化学习的干道交叉口信号配时模型 |
徐建闽
席嘉鹏
|
《广西大学学报(自然科学版)》
CAS
北大核心
|
2021 |
2
|
|
8
|
基于强化学习的多目标点航关联方法 |
丁国胜
蔡民杰
|
《指挥控制与仿真》
|
2022 |
0 |
|
9
|
基于Q-强化学习和Adaboost算法的自适应谈判方法 |
庞婷
郭绍永
何喜军
蒋国瑞
|
《江苏科技大学学报(自然科学版)》
CAS
|
2018 |
1
|
|
10
|
基于网上采购平台的资源动态实时调度研究 |
滕建洁
商明曦
|
《中国物流与采购》
|
2022 |
0 |
|
11
|
基于Q学习算法和BP神经网络的倒立摆控制 |
蒋国飞
吴沧浦
|
《自动化学报》
EI
CSCD
北大核心
|
1998 |
55
|
|
12
|
一种基于Agent的单路口交通信号学习控制方法 |
马寿峰
李英
刘豹
|
《系统工程学报》
CSCD
|
2002 |
62
|
|
13
|
基于深度强化学习的微能源网能量管理与优化策略研究 |
刘俊峰
陈剑龙
王晓生
曾君
黄倩颖
|
《电网技术》
EI
CSCD
北大核心
|
2020 |
60
|
|
14
|
基于多主体博弈与强化学习的并网型综合能源微网协调调度 |
刘洪
李吉峰
葛少云
张鹏
陈星屹
|
《电力系统自动化》
EI
CSCD
北大核心
|
2019 |
59
|
|
15
|
基于BP神经网络的双层启发式强化学习方法 |
刘智斌
曾晓勤
刘惠义
储荣
|
《计算机研究与发展》
EI
CSCD
北大核心
|
2015 |
38
|
|
16
|
基于Q学习的互联电网动态最优CPS控制 |
余涛
周斌
陈家荣
|
《中国电机工程学报》
EI
CSCD
北大核心
|
2009 |
35
|
|
17
|
基于Q-learning的虚拟网络功能调度方法 |
王晓雷
陈云杰
王琛
牛犇
|
《计算机工程》
CAS
CSCD
北大核心
|
2019 |
35
|
|
18
|
Q-学习及其在智能机器人局部路径规划中的应用研究 |
张汝波
杨广铭
顾国昌
张国印
|
《计算机研究与发展》
EI
CSCD
北大核心
|
1999 |
17
|
|
19
|
一种多移动机器人协作围捕策略 |
苏治宝
陆际联
童亮
|
《北京理工大学学报》
EI
CAS
CSCD
北大核心
|
2004 |
23
|
|
20
|
基于Q-学习算法的认知雷达对抗过程设计 |
李云杰
朱云鹏
高梅国
|
《北京理工大学学报》
EI
CAS
CSCD
北大核心
|
2015 |
32
|
|