期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
可重入生产系统的平均报酬型强化学习调度 被引量:5
1
作者 柳长春 沈志江 于海斌 《信息与控制》 CSCD 北大核心 2004年第2期145-150,共6页
在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优... 在可重入生产系统中 ,一个重要的问题就是对调度策略进行优化 ,以提高系统平均输出率 .本文采用了一种平均报酬型强化学习算法来解决该问题 ,直接从所关心的系统品质出发 ,自动获得具有自适应性的动态调度策略 .仿真结果表明 ,其性能优于两种熟知的优先权调度策略 . 展开更多
关键词 可重入生产系统 平均报酬强化学习调度 优化 调度策略
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部