期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
改进的Q学习算法在作业车间调度中的应用 被引量:8
1
作者 王超 郭静 包振强 《计算机应用》 CSCD 北大核心 2008年第12期3268-3270,共3页
在制造业系统中车间调度是一项关键技术,可以用强化学习中的Q学习实现对车间作业的动态调度。传统的Q学习存在收敛速度慢和容易导致局部收敛的矛盾,为此提出一种改进的Q学习算法。在行为动作上提出了一种双层动作合成的动作组,给出常规... 在制造业系统中车间调度是一项关键技术,可以用强化学习中的Q学习实现对车间作业的动态调度。传统的Q学习存在收敛速度慢和容易导致局部收敛的矛盾,为此提出一种改进的Q学习算法。在行为动作上提出了一种双层动作合成的动作组,给出常规数学中"聚度"概念来衡量在某一状态动作组选择的均匀程度,达到既能加速收敛又能防止局部收敛的目的,能有效适应现今复杂多变的动态生产环境。实验表明,该方法运用于动态车间调度中有较好的效果。 展开更多
关键词 作业车问题 强化学习 Q学习
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部