期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于Q-Learning反馈机制的无线传感网络通信节点自愈算法 被引量:6
1
作者 杨惠 《传感技术学报》 CAS CSCD 北大核心 2022年第7期974-979,共6页
针对目前无线网络通信节点自愈能力差,以及自愈后网络流量出口带宽低的问题,提出基于Q-learning反馈机制的无线传感网络通信节点自愈算法。通过计算网路节点的RSSI值建立节点衰减模型,通过质心算法完成节点定位;应用Q-learning学习算法... 针对目前无线网络通信节点自愈能力差,以及自愈后网络流量出口带宽低的问题,提出基于Q-learning反馈机制的无线传感网络通信节点自愈算法。通过计算网路节点的RSSI值建立节点衰减模型,通过质心算法完成节点定位;应用Q-learning学习算法获取链路选取策略,完成节点传输过程路径时延、吞吐量以及丢包率的计算,建立网络节点模型提取链路反馈机制,利用Q-learning学习算法进行迭代计算,实现无线传感网络的通信节点自愈。仿真分析表明,运用该算法自愈网络通信节点时,当检测次数为100时,检测出的节点自愈数量为280个,节点拓扑移动距离平均值为175 m,网络流量出口带宽平均值为550 Mbyte/s,证明该算法的节点自愈能力高。 展开更多
关键词 无线传感网络 通信节点自愈 q-learning学习算法 节点定位
下载PDF
基于网上采购平台的资源动态实时调度研究
2
作者 滕建洁 商明曦 《中国物流与采购》 2022年第1期116-117,共2页
针对随机环境下动态决策的调度问题,本文对基于网上采购平台环境下的制造资源动态调度问题利用马尔可夫决策过程进行建模,考虑在实际制造过程中的确定性因素和随机因素对原调度方案的影响,设计调动策略,综合考虑不同环境下的动态调度过... 针对随机环境下动态决策的调度问题,本文对基于网上采购平台环境下的制造资源动态调度问题利用马尔可夫决策过程进行建模,考虑在实际制造过程中的确定性因素和随机因素对原调度方案的影响,设计调动策略,综合考虑不同环境下的动态调度过程。实现理论上可靠、实际中有效的动态调度方案。 展开更多
关键词 动态资源调度 马尔可夫决策过程 q-learning学习算法
原文传递
基于大数据分析的PLC控制系统性能的优化与改进
3
作者 张瑞宽 《自动化应用》 2024年第6期70-71,74,共3页
为优化PLC控制系统的性能,提出了一种改进的Q-Learning强化学习算法。该算法在每次迭代优化过程中,利用模型预测未来的状态集,并在这些状态中选择了预期收益最大的决策。通过模拟实验,可发现该算法在控制相关的性能指标上具有明显优势。
关键词 强化学习 迭代优化 q-learning强化学习算法
下载PDF
基于Q-Learning算法的无人机空战机动决策研究
4
作者 姚培源 魏潇龙 +1 位作者 俞利新 李胜厚 《电光与控制》 CSCD 北大核心 2023年第5期16-22,共7页
针对无人机空战对抗自主机动决策问题,设计了侧向机动决策算法。通过加入启发式因子的方式和双Q表交替学习的机制,弥补了传统Q-Learning算法学习速度慢、无效学习多的不足。通过路径规划仿真和数据的对比,验证了改进Q-Learning算法具有... 针对无人机空战对抗自主机动决策问题,设计了侧向机动决策算法。通过加入启发式因子的方式和双Q表交替学习的机制,弥补了传统Q-Learning算法学习速度慢、无效学习多的不足。通过路径规划仿真和数据的对比,验证了改进Q-Learning算法具有更好的稳定性和求解能力。设计了动态的栅格规划环境,能够使无人机根据变化的空战态势自适应调整栅格尺寸大小,且对求解的速率不产生影响。基于Q-Learning算法,构建了无人机空战对抗侧向机动决策模型,并通过武器平台调换的方式验证了改进Q-Learning算法能显著提升无人机空战胜负比。 展开更多
关键词 无人机 空战 机动决策 动态栅格环境 路径规划 q-learning学习算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部