期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于马尔科夫决策的网络故障模型 被引量:1
1
作者 葛章秀 霍明德 《信息与电脑》 2020年第15期70-72,共3页
马尔科夫决策过程MDP是一种强化学习的基本框架,通过对马尔科夫决策过程采用的时间差分TD算法、神经网络反向传播BP算法和遗传算法等强化学习算法的研究及结合现实中复杂的网络故障,构造了一种解决复杂网络故障的智能体强化学习的网络... 马尔科夫决策过程MDP是一种强化学习的基本框架,通过对马尔科夫决策过程采用的时间差分TD算法、神经网络反向传播BP算法和遗传算法等强化学习算法的研究及结合现实中复杂的网络故障,构造了一种解决复杂网络故障的智能体强化学习的网络故障模型。通过该模型能够智能诊断和预测复杂的网络故障,为快速抢通恢复网络故障提供了重要的智能手段。 展开更多
关键词 时间差分td算法 神经网络反向传播BP算法 遗传算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部