期刊文献+
共找到251篇文章
< 1 2 13 >
每页显示 20 50 100
The Multi-agent Learning Model Based on Dynamic Fuzzy Logic 被引量:2
1
作者 Liping Xie Fanzhang Li 《通讯和计算机(中英文版)》 2006年第3期87-99,共13页
下载PDF
一种基于MAS-GA的混合进化计算模型
2
作者 王文彦 《石油化工高等学校学报》 CAS 2007年第3期33-36,共4页
针对优化规划求解目前还缺乏高效、实用的算法,而传统遗传算法由于受确定编码形式的制约而缺乏对复杂系统的表述能力的问题,提出了一种基于Agent行为遗传和范例学习的新型进化算法。并分别采用新型遗传算法和传统遗传算法对同一算例网... 针对优化规划求解目前还缺乏高效、实用的算法,而传统遗传算法由于受确定编码形式的制约而缺乏对复杂系统的表述能力的问题,提出了一种基于Agent行为遗传和范例学习的新型进化算法。并分别采用新型遗传算法和传统遗传算法对同一算例网络进行优化规划,实验结果说明了本文算法具有更好的复杂的问题表述能力、计算效率、收敛稳定性以及可扩展性。 展开更多
关键词 agent行为 agent学习 进化算法 优化规划
下载PDF
复杂环境中的多智能体强化学习 被引量:9
3
作者 罗青 李智军 吕恬生 《上海交通大学学报》 EI CAS CSCD 北大核心 2002年第3期302-305,共4页
提出在机器人足球这样的复杂、动态的环境中使用强化学习的方式与问题 ,阐述了强化学习的实现及如何处理机器学习中的常见问题 ,即延迟奖赏、探索与利用、不完整信息等 ,同时探讨了减少复杂性的若干措施 .
关键词 多智能体系统 机器人足球 复杂环境 强化学习
下载PDF
多智能体博弈、学习与控制 被引量:12
4
作者 王龙 黄锋 《自动化学报》 EI CAS CSCD 北大核心 2023年第3期580-613,共34页
近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现... 近年来,人工智能(Artificial intelligence,AI)技术在棋牌游戏、计算机视觉、自然语言处理和蛋白质结构解析与预测等研究领域取得了众多突破性进展,传统学科之间的固有壁垒正在被逐步打破,多学科深度交叉融合的态势变得越发明显.作为现代智能科学的三个重要组成部分,博弈论、多智能体学习与控制论自诞生之初就逐渐展现出一种“你中有我,我中有你”的关联关系.特别地,近年来在AI技术的促进作用下,这三者间的交叉研究成果正呈现出一种井喷式增长的态势.为及时反映这一学术动态和趋势,本文对这三者的异同、联系以及最新的研究进展进行了系统梳理.首先,介绍了作为纽带连接这三者的四种基本博弈形式,进而论述了对应于这四种基本博弈形式的多智能体学习方法;然后,按照不同的专题,梳理了这三者交叉研究的最新进展;最后,对这一新兴交叉研究领域进行了总结与展望. 展开更多
关键词 博弈论 多智能体学习 控制论 强化学习 人工智能
下载PDF
一种新颖的多agent强化学习方法 被引量:8
5
作者 周浦城 洪炳镕 黄庆成 《电子学报》 EI CAS CSCD 北大核心 2006年第8期1488-1491,共4页
提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追... 提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追捕问题的仿真结果验证了所提方法的有效性. 展开更多
关键词 agent学习 Q-学习 利益分配学习 模块化结构 对手建模
下载PDF
一般和博弈中的合作多agent学习 被引量:7
6
作者 宋梅萍 顾国昌 +1 位作者 张国印 刘海波 《控制理论与应用》 EI CAS CSCD 北大核心 2007年第2期317-321,共5页
理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的... 理性和收敛是多agent学习研究所追求的目标,在理性合作的多agent系统中提出利用Pareto占优解代替非合作的Nash平衡解进行学习,使agent更具理性,另一方面引入社会公约来启动和约束agent的推理,统一系统中所有agent的决策,从而保证学习的收敛性.利用2人栅格游戏对多种算法进行验证,成功率的比较说明了所提算法具有较好的学习性能. 展开更多
关键词 agent学习 一般和随机博弈 NASH平衡 PARETO占优 Q-学习
下载PDF
多Agent协作的强化学习模型和算法 被引量:6
7
作者 刘菲 曾广周 宋言伟 《计算机科学》 CSCD 北大核心 2006年第12期156-158,186,共4页
结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并... 结合强化学习技术讨论了多Agent协作学习的过程,构造了一个新的多Agent协作学习模型。在这个模型的基础上,提出一个多Agent协作学习算法。算法充分考虑了多Agent共同学习的特点,使得Agent基于对动作长期利益的估计来预测其动作策略,并做出相应的决策,进而达成最优的联合动作策略。最后,通过对猎人-猎物追逐问题的仿真试验验证了该算法的收敛性,表明这种学习算法是一种高效、快速的学习方法。 展开更多
关键词 协作学习 强化学习 agent学习 学习模型 学习算法
下载PDF
一种共享经验元组的多agent协同强化学习算法 被引量:4
8
作者 王长缨 尹晓虎 +1 位作者 鲍翊平 姚莉 《模式识别与人工智能》 EI CSCD 北大核心 2005年第2期234-239,共6页
Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,... Q学习算法是一种最受欢迎的模型无关强化学习算法。本文通过对Q学习算法进行合适的扩充,提出了一种适合于多agent协作团队的共享经验元组的多agent协同强化学习算法,其中采用一种新的状态行为的知识表示方法使得状态行为空间得到缩减,采用相似性变换和经验元组的共享使得学习的效率得到提高。最后将该算法应用于猎人捕物问题域。实验结果表明该算法能够加快多个猎人合作抓捕猎物的进程,有利于协作任务的成功执行,并能提高多agent协作团队的协作效率,因此该算法是有效的。 展开更多
关键词 agent学习 强化学习 Q学习 状态行为空间 协作团队
原文传递
多agent协同强化学习算法SE-MACOL及其应用 被引量:5
9
作者 王长缨 陈文伟 《广西师范大学学报(自然科学版)》 CAS 北大核心 2006年第4期167-170,共4页
针对多agent团队中各成员之间是协作关系且自主决策的学习模型,在此对Q学习算法进行了适当扩充,提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法,采用相似性变换和经验元组... 针对多agent团队中各成员之间是协作关系且自主决策的学习模型,在此对Q学习算法进行了适当扩充,提出了适合于多agent团队的一种共享经验元组的多agent协同强化学习算法。其中采用新的状态行为的知识表示方法,采用相似性变换和经验元组的共享,能够提高多agent团队协同工作的效率。最后将该算法应用于猎人捕物问题域,实验结果表明该算法能够明显加快多个猎人合作抓捕猎物的进程。 展开更多
关键词 agent学习 强化学习 Q学习 状态行为空间 协作团队
下载PDF
多智能体博弈学习研究进展 被引量:1
10
作者 罗俊仁 张万鹏 +2 位作者 苏炯铭 袁唯淋 陈璟 《系统工程与电子技术》 EI CSCD 北大核心 2024年第5期1628-1655,共28页
随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文... 随着深度学习和强化学习而来的人工智能新浪潮,为智能体从感知输入到行动决策输出提供了“端到端”解决方案。多智能体学习是研究智能博弈对抗的前沿课题,面临着对抗性环境、非平稳对手、不完全信息和不确定行动等诸多难题与挑战。本文从博弈论视角入手,首先给出了多智能体学习系统组成,进行了多智能体学习概述,简要介绍了各类多智能体学习研究方法。其次,围绕多智能体博弈学习框架,介绍了多智能体博弈基础模型及元博弈模型,均衡解概念和博弈动力学,学习目标多样、环境(对手)非平稳、均衡难解且易变等挑战。再次,全面梳理了多智能体博弈策略学习方法,离线博弈策略学习方法,在线博弈策略学习方法。最后,从智能体认知行为建模与协同、通用博弈策略学习方法和分布式博弈策略学习框架共3个方面探讨了多智能体学习的前沿研究方向。 展开更多
关键词 博弈学习 多智能体学习 元博弈 在线无悔学习
下载PDF
基于强化学习的多移动Agent学习算法 被引量:2
11
作者 刘菲 曾广周 《计算机工程与应用》 CSCD 北大核心 2006年第5期50-53,共4页
结合强化学习技术讨论了单移动Agent学习的过程,然后扩展到多移动Agent学习领域,提出一个多移动Agent学习算法MMAL(MultiMobileAgentLearning)。算法充分考虑了移动Agent学习的特点,使得移动Agent能够在不确定和有冲突目标的上下文中进... 结合强化学习技术讨论了单移动Agent学习的过程,然后扩展到多移动Agent学习领域,提出一个多移动Agent学习算法MMAL(MultiMobileAgentLearning)。算法充分考虑了移动Agent学习的特点,使得移动Agent能够在不确定和有冲突目标的上下文中进行决策,解决在学习过程中Agent对移动时机的选择,并且能够大大降低计算代价。目的是使Agent能在随机动态的环境中进行自主、协作的学习。最后,通过仿真试验表明这种学习算法是一种高效、快速的学习方法。 展开更多
关键词 强化学习 移动agent学习 学习算法
下载PDF
群智能在多智能体系统中的应用研究进展 被引量:2
12
作者 段俊花 朱怡安 钟冬 《计算机科学》 CSCD 北大核心 2012年第6期6-9,共4页
群智能算法是受群居性昆虫群体的集体行为启发而设计的分布式问题求解方法,将它应用到多智能体系统,旨在提高系统的鲁棒性、灵活性和自适应性。以群智能在多智能体系统中的应用为线索,首先介绍群智能的核心机制,然后从多智能体系统通信... 群智能算法是受群居性昆虫群体的集体行为启发而设计的分布式问题求解方法,将它应用到多智能体系统,旨在提高系统的鲁棒性、灵活性和自适应性。以群智能在多智能体系统中的应用为线索,首先介绍群智能的核心机制,然后从多智能体系统通信机制、协作技术、学习问题及体系结构建立这几个方面总结群智能理论在多智能体系统中的已有工作。最后分析和讨论了群智能方法在多智能体系统应用中存在的问题,并提出今后的工作展望。 展开更多
关键词 群智能 多智能体系统 STIGMERGY 分布式协作 多智能体学习
下载PDF
基于多Agent学习机制的服务组合
13
作者 赵海燕 曹健 徐文博 《计算机工程与科学》 CSCD 北大核心 2013年第9期117-121,共5页
服务Agent能够利用本身的功能以及来自外部的多个软件服务,向外界提供更为高层的服务。为了向用户提供综合的功能,服务Agent之间必须通过相互协同实现服务组合。提出了一种依靠多Agent学习机制进行服务组合的方法,其独特性在于通过学习... 服务Agent能够利用本身的功能以及来自外部的多个软件服务,向外界提供更为高层的服务。为了向用户提供综合的功能,服务Agent之间必须通过相互协同实现服务组合。提出了一种依靠多Agent学习机制进行服务组合的方法,其独特性在于通过学习,这些Agent能够对类似的输入迅速得到优化解。对基于多Agent协同进行服务组合的框架进行了介绍,在此基础上详细说明了如何利用多Agent学习机制进行服务组合,并对相关的实验进行了介绍。 展开更多
关键词 服务组合 服务agent agent学习
下载PDF
认知无线电网络的分布式路由协议的研究 被引量:2
14
作者 王燕军 《现代电子技术》 北大核心 2019年第19期23-27,共5页
分布式路由算法广泛应用于认知无线电网络(CRNs)。为此,分析多跳CRNs的路由问题,利用无中心的Markov决策过程(DEC-POMDP)建立问题模型,并确保次级用户对主级用户的干扰少于预定阈值,进而控制端到端时延。最后引用多智能体学习算法解决... 分布式路由算法广泛应用于认知无线电网络(CRNs)。为此,分析多跳CRNs的路由问题,利用无中心的Markov决策过程(DEC-POMDP)建立问题模型,并确保次级用户对主级用户的干扰少于预定阈值,进而控制端到端时延。最后引用多智能体学习算法解决此问题模型,进而形成基于多智能体学习的路由(MALR)。实验结果表明,提出的路由能够控制时延,并降低了干扰率。 展开更多
关键词 认知无线电网络 MALR MARKOV决策过程 干扰降低 多智能体学习 时延控制
下载PDF
基于多代理分散式控制的智能电网存储管理
15
作者 王丽君 蔚承建 +2 位作者 胡恒恺 王开 刘凯 《计算机工程与应用》 CSCD 2014年第16期265-270,共6页
在智能电网中,储能设备是实现智能电网的重要基础之一。因此,如何对储能设备进行有效的管理是必需解决的关键问题。提出了基于Agent技术的自适应学习ZIPML算法调整存储策略,同时考虑多代理学习,使得实际存储策略逐渐逼近最优存储策略。... 在智能电网中,储能设备是实现智能电网的重要基础之一。因此,如何对储能设备进行有效的管理是必需解决的关键问题。提出了基于Agent技术的自适应学习ZIPML算法调整存储策略,同时考虑多代理学习,使得实际存储策略逐渐逼近最优存储策略。通过模拟实验验证了该自适应学习算法的有效性,电网高峰期的负荷得到有效降低,用户可以节省约6.1%的用电花费,发电所产生的CO2则可以减少6.4%。 展开更多
关键词 智能电网 多代理系统 电力市场 多代理学习
下载PDF
群体环境下基于随机对策的多Agent局部学习算法
16
作者 尹怡欣 江道平 +1 位作者 班晓娟 孟祥嵩 《信息与控制》 CSCD 北大核心 2008年第6期703-708,共6页
基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法.算法在与局部环境交互中采用贪婪策略最大化自身利益.分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法;提出了... 基于群体环境中个体agent局部感知和交互的生物原型,提出一种随机对策框架下的多agent局部学习算法.算法在与局部环境交互中采用贪婪策略最大化自身利益.分别在零和、一般和的单个平衡点和多个平衡点情形下改进了Nash-Q学习算法;提出了行为修正方法,并证明了算法收敛、计算复杂度降低. 展开更多
关键词 agent学习 随机对策 Nash—Q 局部学习
下载PDF
多Agent MDPs中并行Rollout学习算法
17
作者 李豹 《安徽工程大学学报》 CAS 2014年第2期75-78,共4页
文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿... 文章在rollout算法基础上研究了在多Agent MDPs的学习问题.利用神经元动态规划逼近方法来降低其空间复杂度,从而减少算法"维数灾".由于Rollout算法具有很强的内在并行性,文中还分析了并行求解方法.通过多级仓库库存控制的仿真试验,验证了Rollout算法在多Agent学习中的有效性. 展开更多
关键词 ROLLOUT算法 神经元动态规划 agent学习 性能势 并行算法
下载PDF
双向DIAL的多智能体交流
18
作者 樊敏风 洪居亭 《现代计算机》 2020年第16期23-27,共5页
差异智能体间学习(DIAL)方法虽然可以很好地解决多智能体交流问题,但是智能体之间信息传递方式是单向的,这使得智能体之间的连接结构不稳定,不能很好地处理复杂的动态环境问题.尤其是当智能体的个数增多,训练情况就变得复杂很多,信息交... 差异智能体间学习(DIAL)方法虽然可以很好地解决多智能体交流问题,但是智能体之间信息传递方式是单向的,这使得智能体之间的连接结构不稳定,不能很好地处理复杂的动态环境问题.尤其是当智能体的个数增多,训练情况就变得复杂很多,信息交流的速度也会慢很多,智能体的学习效率会非常低.针对这些问题,提出双向DIAL的方法,该方法是在DIAL的基础上将智能体之间连接方式从单向变成了正反两个方向,信息传递方式也从单向变成双向.这样使得后一个智能体的信息不仅能传递给前一个智能体,同时前一个智能体的信息也能传递给后一个智能体.最后通过仿真实验证明双向DIAL的性能确实更优于DIAL. 展开更多
关键词 差异智能体间学习 交流 学习效率 双向DIAL
下载PDF
强化学习研究综述 被引量:270
19
作者 高阳 陈世福 陆鑫 《自动化学报》 EI CSCD 北大核心 2004年第1期86-100,共15页
强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化... 强化学习通过试错与环境交互获得策略的改进,其自学习和在线学习的特点使其成为机器学习研究的一个重要分支.该文首先介绍强化学习的原理和结构;其次构造一个二维分类图,分别在马尔可夫环境和非马尔可夫环境下讨论最优搜索型和经验强化型两类算法;然后结合近年来的研究综述了强化学习技术的核心问题,包括部分感知、函数估计、多agent强化学习,以及偏差技术;最后还简要介绍强化学习的应用情况和未来的发展方向. 展开更多
关键词 机器学习 强化学习 马尔可夫环境 函数估计 偏差技术
下载PDF
多智能体深度强化学习研究综述 被引量:66
20
作者 孙彧 曹雷 +2 位作者 陈希亮 徐志雄 赖俊 《计算机工程与应用》 CSCD 北大核心 2020年第5期13-24,共12页
多智能体深度强化学习是机器学习领域的一个新兴的研究热点和应用方向,涵盖众多算法、规则、框架,并广泛应用于自动驾驶、能源分配、编队控制、航迹规划、路由规划、社会难题等现实领域,具有极高的研究价值和意义。对多智能体深度强化... 多智能体深度强化学习是机器学习领域的一个新兴的研究热点和应用方向,涵盖众多算法、规则、框架,并广泛应用于自动驾驶、能源分配、编队控制、航迹规划、路由规划、社会难题等现实领域,具有极高的研究价值和意义。对多智能体深度强化学习的基本理论、发展历程进行简要的概念介绍;按照无关联型、通信规则型、互相合作型和建模学习型4种分类方式阐述了现有的经典算法;对多智能体深度强化学习算法的实际应用进行了综述,并简单罗列了多智能体深度强化学习的现有测试平台;总结了多智能体深度强化学习在理论、算法和应用方面面临的挑战和未来的发展方向。 展开更多
关键词 强化学习 深度学习 多智能体系统 多智能体深度强化学习
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部