期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
不完全信息下基于多代理深度确定策略梯度算法的发电商竞价策略 被引量:6
1
作者 员江洋 杨明 +3 位作者 刘宁宁 张长行 黄诗颖 朱青 《电网技术》 EI CSCD 北大核心 2022年第12期4832-4842,共11页
在电力现货市场中,发电商竞价行为受多种因素综合影响,且由于信息受限无法做出最优决策,难以实现自身收益最大化。将发电商竞价决策行为建模为马尔科夫博弈过程,提出了基于多代理模型的发电商日前市场竞价模型,应用多代理深度确定性策... 在电力现货市场中,发电商竞价行为受多种因素综合影响,且由于信息受限无法做出最优决策,难以实现自身收益最大化。将发电商竞价决策行为建模为马尔科夫博弈过程,提出了基于多代理模型的发电商日前市场竞价模型,应用多代理深度确定性策略梯度(multi-agent deep deterministic policy gradient, MADDPG)算法,分别在IEEE-3节点算例和IEEE-30节点算例模拟发电侧竞价行为。算例分析表明,所提模型通信开销低、训练结果良好,可以在不完全信息条件下提高发电商收益,并实现发电侧报价的激励相容。 展开更多
关键词 电力现货市场 代理模型 不完全信息 代理深度确定性策略梯度 最优报价策略 激励相容
下载PDF
基于强化学习的非正交多址接入和移动边缘计算联合系统信息年龄更新 被引量:4
2
作者 李保罡 石泰 +3 位作者 陈静 李诗璐 王宇 张天魁 《电子与信息学报》 EI CSCD 北大核心 2022年第12期4238-4245,共8页
物联网发展对信息时效性的需求越来越高,信息新鲜度变得至关重要。为了维持信息新鲜度,在非正交多址接入(NOMA)和移动边缘计算(MEC)的联合系统中,对多设备单边缘计算服务器的传输场景进行了研究。在该场景中,如何分配卸载任务量和卸载... 物联网发展对信息时效性的需求越来越高,信息新鲜度变得至关重要。为了维持信息新鲜度,在非正交多址接入(NOMA)和移动边缘计算(MEC)的联合系统中,对多设备单边缘计算服务器的传输场景进行了研究。在该场景中,如何分配卸载任务量和卸载功率以最小化平均更新代价是一个具有挑战性的问题。该文考虑到现实中的信道状态变化情况,基于多代理深度确定性策略梯度(MADDPG)算法,考虑信息新鲜度影响,建立了最小化平均更新代价的优化问题,提出一种寻找最优的卸载因子和卸载功率决策。仿真结果表明,采用部分卸载的方式可以有效地降低平均更新代价,利用MADDPG算法可以进一步优化卸载功率,经比较,MADDPG算法在降低平均更新代价方面优于其他方案,并且适当地减少设备数量在降低平均更新代价方面效果更好。 展开更多
关键词 非正交址接入 移动边缘计算 信息年龄 代理深度确定性策略梯度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部