检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到7篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于Multi-Agent的区域交通协调控制研究被引量：9: 1; 作者张辉陈阳舟 +1 位作者杨玉珍李世伟《交通与计算机》 2006年第2期94-98,共5页; 提出了一种基于M u lti-A gen t的区域交通协调控制系统。系统针对路网中各交叉口交通流相互影响的特点,构造了一种基于分布权值函数的分布式Q学习算法,采用此算法实现了M u lti-A gen t的学习以及协调机制。通过各A gen t间的协调控制... 展开更多; 关键词 MULTI—AGENT 协调控制分布式q学习; 下载PDF 职称材料

基于分布式Q学习的区域交通协调控制的研究被引量：8: 2; 作者张辉杨玉珍 +1 位作者李振龙陈阳舟《武汉理工大学学报（交通科学与工程版）》 2007年第6期1121-1124,共4页; 介绍了强化学习和分布式Q学习的基本思想,并将分布式Q学习应用到区域交通协调控制中,通过对其进行研究和分析,提出一种适合于区域交通协调控制的奖惩函数和权值函数.在微观交通仿真软件Paramics上对控制算法进行仿真实验,实验结果说明... 展开更多; 关键词分布式q学习奖惩函数权值函数协调控制; 下载PDF 职称材料

基于多智能体强化学习的多部件系统维修优化: 3; 作者周一帆郭凯李帮诚《长沙理工大学学报（自然科学版）》 CAS 2023年第2期27-34,共8页; 【目的】研究多智能体强化学习算法用于多部件生产系统维修优化的有效性,及维修优化领域知识用于强化学习的可行性。【方法】将生产系统的维修决策建模为马尔可夫决策过程(Markov decision process,MDP),并采用一种基于奖励塑造的分布式... 展开更多; 关键词多部件生产系统奖励塑造分布式q学习多智能体强化学习深度强化学习; 下载PDF 职称材料

机器类通信中集中式与分布式Q学习的资源分配算法研究: 4; 作者余云河孙君《电信科学》 2021年第11期41-50,共10页; 针对海量机器类通信(massive machine type communication,mMTC)场景,以最大化系统吞吐量为目标,且在保证部分机器类通信设备(machine type communication device,MTCD)的服务质量(quality of service,QoS)要求前提下,提出两种基于Q学... 展开更多; 关键词资源分配集中式q学习分布式q学习余弦相似度多维向量; 下载PDF 职称材料

共享经验分布式Q-学习模型在RoboCup中的应用被引量：1: 5; 作者张煌辉陈焕文 +1 位作者刘泽文陈哲平《微计算机信息》 2010年第8期25-26,共2页; RoboCup仿真比赛平台提供了一个完全分布式控制、实时异步多智能体的环境,从而为多智能体的智能控制和人工智能理论的研究提供了绝佳的实验平台。文中提出了一种基于共享经验策略的分布式Q-学习模型,应用于RoboCup仿真实验中,取得了较... 展开更多; 关键词共享经验分布式q-学习多智能体 ROBOCUP; 下载PDF 职称材料

异构网络中基于强化学习的通信-计算资源联合分配算法: 6; 作者李丽妍李学华 +1 位作者陈硕孙立新《电讯技术》北大核心 2024年第8期1266-1274,共9页; 基于强化学习(Reinforcement Learning,RL),在保证用户服务质量(Quality of Service,QoS)的前提下,研究了人机物混合接入的异构网络中通信-计算资源联合分配算法。建立了一种新型人机物混合接入的异构网络拓扑结构。在最小服务质量需求... 展开更多; 关键词异构网络人机物混合接入资源分配分布式q学习多无人机通信; 下载PDF 职称材料

Distributional Reinforcement Learning with Quantum Neural Networks: 7; 作者 Wei Hu James Hu 《Intelligent Control and Automation》 2019年第2期63-78,共16页; Traditional reinforcement learning (RL) uses the return, also known as the expected value of cumulative random rewards, for training an agent to learn an optimal policy. However, recent research indicates that learnin... 展开更多; 关键词 Continuous-Variable qUANTUM Computers qUANTUM REINFORCEMENT learning distributional REINFORCEMENT learning qUANTILE Regression distributional q learning Grid World ENVIRONMENT MDP Chain ENVIRONMENT; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	基于Multi-Agent的区域交通协调控制研究	张辉陈阳舟杨玉珍李世伟	《交通与计算机》	2006	9	下载PDF 职称材料
2	基于分布式Q学习的区域交通协调控制的研究	张辉杨玉珍李振龙陈阳舟	《武汉理工大学学报（交通科学与工程版）》	2007	8	下载PDF 职称材料
3	基于多智能体强化学习的多部件系统维修优化	周一帆郭凯李帮诚	《长沙理工大学学报（自然科学版）》 CAS	2023	0	下载PDF 职称材料
4	机器类通信中集中式与分布式Q学习的资源分配算法研究	余云河孙君	《电信科学》	2021	0	下载PDF 职称材料
5	共享经验分布式Q-学习模型在RoboCup中的应用	张煌辉陈焕文刘泽文陈哲平	《微计算机信息》	2010	1	下载PDF 职称材料
6	异构网络中基于强化学习的通信-计算资源联合分配算法	李丽妍李学华陈硕孙立新	《电讯技术》北大核心	2024	0	下载PDF 职称材料
7	Distributional Reinforcement Learning with Quantum Neural Networks	Wei Hu James Hu	《Intelligent Control and Automation》	2019	0	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部