期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
可重入生产系统的平均报酬型强化学习调度
被引量:
5
1
作者
柳长春
沈志江
于海斌
《信息与控制》
CSCD
北大核心
2004年第2期145-150,共6页
在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优...
在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 .
展开更多
关键词
可重入生产系统
平均
报酬
型
强化
学习
调度
优化
调度
策略
下载PDF
职称材料
题名
可重入生产系统的平均报酬型强化学习调度
被引量:
5
1
作者
柳长春
沈志江
于海斌
机构
中国科学院沈阳自动化研究所
出处
《信息与控制》
CSCD
北大核心
2004年第2期145-150,共6页
基金
国家自然科学基金资助项目 (699740 3 9)
文摘
在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 .
关键词
可重入生产系统
平均
报酬
型
强化
学习
调度
优化
调度
策略
Keywords
average reward reinforcement learning
reentrant system
scheduling
temporal differences
分类号
O224 [理学—运筹学与控制论]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
可重入生产系统的平均报酬型强化学习调度
柳长春
沈志江
于海斌
《信息与控制》
CSCD
北大核心
2004
5
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部