期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于强化学习的异步动态定价算法 被引量:4
1
作者 王金田 唐昊 +1 位作者 程文娟 毕翔 《系统工程学报》 CSCD 北大核心 2011年第5期664-670,共7页
研究电子零售市场上两个销售商在彼此没有信息交互情况下的异步动态定价问题.基于性能势理论,建立了同时适用于平均和折扣两种优化准则下的异步定价策略的Q学习和WoLF-PHC算法,通过一个数值例子比较了相关算法的学习优化效果.仿真结果表... 研究电子零售市场上两个销售商在彼此没有信息交互情况下的异步动态定价问题.基于性能势理论,建立了同时适用于平均和折扣两种优化准则下的异步定价策略的Q学习和WoLF-PHC算法,通过一个数值例子比较了相关算法的学习优化效果.仿真结果表明,Q学习和WoLF-PHC算法都能较好地解决异步动态定价问题,但由于后者采用混合策略和可变学习率,故能更好地适应环境变化,并具有更好的学习优化效果. 展开更多
关键词 异步动态定价 多AGENT 性能势 wolfphc算法
下载PDF
基于多Agent的季节性商品动态定价算法 被引量:2
2
作者 陆慧 《计算机应用》 CSCD 北大核心 2011年第11期3135-3139,共5页
研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,... 研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,Q学习算法定价和Wolf-PHC算法定价进行比较,得到Wolf-PHC算法定价的优化效果更明显,适应性更强。 展开更多
关键词 季节性商品 动态定价 Q学习算法 wolf-phc算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部