1
|
基于启发式强化学习的AGV路径规划 |
唐恒亮
唐滋芳
董晨刚
尹棋正
海秋茹
|
《北京工业大学学报》
CAS
CSCD
北大核心
|
2021 |
8
|
|
2
|
一种多步Q强化学习方法 |
陈圣磊
吴慧中
韩祥兰
肖亮
|
《计算机科学》
CSCD
北大核心
|
2006 |
3
|
|
3
|
一种二阶TD Error快速Q(λ)算法 |
傅启明
刘全
孙洪坤
高龙
李瑾
王辉
|
《模式识别与人工智能》
EI
CSCD
北大核心
|
2013 |
5
|
|
4
|
基于群智能强化学习的电网最优碳-能复合流算法 |
郭乐欣
张孝顺
谭敏
余涛
|
《电测与仪表》
北大核心
|
2017 |
4
|
|
5
|
基于强化学习理论的输电网扩展规划方法 |
王渝红
胡胜杰
宋雨妍
江栗
沈力
|
《电网技术》
EI
CSCD
北大核心
|
2021 |
12
|
|
6
|
基于图像识别的爬壁机器人的路径规划 |
何宏
李宇
张志宏
|
《工业技术创新》
|
2015 |
1
|
|
7
|
基于MDP自适应决策的库存控制 |
刘虹
|
《河北建筑科技学院学报》
|
2006 |
0 |
|
8
|
基于自加强学习算法的发电商报价策略研究 |
马豫超
蒋传文
候志俭
Ettore Bompard
王承民
|
《中国电机工程学报》
EI
CSCD
北大核心
|
2006 |
17
|
|
9
|
基于多步回溯Q(λ)学习算法的多目标最优潮流计算 |
余涛
胡细兵
刘靖
|
《华南理工大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
|
2010 |
6
|
|
10
|
强化学习下能耗优化的虚拟机放置策略 |
卢海峰
顾春华
罗飞
丁炜超
袁野
任强
|
《计算机科学》
CSCD
北大核心
|
2019 |
5
|
|
11
|
基于Q(λ)-learning的移动机器人路径规划改进探索方法 |
王健
赵亚川
赵忠英
张平陆
|
《自动化与仪表》
|
2019 |
4
|
|