-
题名基于多智能体强化学习的多AGV路径规划方法
被引量:10
- 1
-
-
作者
刘辉
肖克
王京擘
-
机构
青岛大学自动化系
-
出处
《自动化与仪表》
2020年第2期84-89,共6页
-
基金
山东省自然科学基金项目(ZR2017PF005)
青岛市博士后应用研究项目
-
文摘
AGV(automated guided vehicle)路径规划问题已成为货物运输、快递分拣等领域中一项关键技术问题。由于在此类场景中需要较多的AGV合作完成,传统的规划模型难以协调多AGV之间的相互作用,采用分而治之的思想或许能获得系统的最优性能。基于此,该文提出一种最大回报频率的多智能体独立强化学习MRF(maximum reward frequency)Q-learning算法,对任务调度和路径规划同时进行优化。在学习阶段AGV不需要知道其他AGV的动作,减轻了联合动作引起的维数灾问题。采用Boltzmann与ε-greedy结合策略,避免收敛到较差路径,另外算法提出采用获得全局最大累积回报的频率作用于Q值更新公式,最大化多AGV的全局累积回报。仿真实验表明,该算法能够收敛到最优解,以最短的时间步长完成路径规划任务。
-
关键词
多智能体强化学习
AGV路径规划
独立强化学习
-
Keywords
multi-agent reinforcement learning
AGV path planning
independent reinforcement learning
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向无人机集群协同感知的多智能体资源分配策略
被引量:5
- 2
-
-
作者
王志宏
冷甦鹏
熊凯
-
机构
电子科技大学信息与通信工程学院
电子科技大学(深圳)高等研究院
-
出处
《物联网学报》
2023年第1期18-26,共9页
-
基金
国家自然科学基金资助项目(No.62171104)。
-
文摘
在智能物联网技术发展的推动下,无人机集群已广泛用于应急、救援等场景的感知监测。无人机在任务区域自动感知发现任务目标,邻近无人机组成协作感知与协作计算任务群组,协同完成数据的感知、采集和处理。然而,重复的感知资源以及多任务间的计算资源供需不平衡,会造成额外的计算与通信开销,增大端到端处理时延。为了应对这一挑战,提出了一种结合仿生学和多智能体独立强化学习的多任务资源分配策略,基于局部的任务信息进行资源协同分配决策。该方法用任务情景信息浓度表示各个任务的资源需求,并通过情景信息在各任务群组间的扩散,动态更新各任务异构资源需求。同时,结合独立多智能体强化学习方法进行智能决策,以对各任务异构资源进行智能协同分配。仿真结果表明,所提方案不仅能够有效缩短任务执行时间,还可显著提高计算资源利用率。
-
关键词
无人机集群
资源分配
独立强化学习
仿生学
多智能体
-
Keywords
UAV swarm
resource allocation
independent reinforcement learning
bionics
multi-agent
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-