-
题名基于强化学习的异步动态定价算法
被引量:4
- 1
-
-
作者
王金田
唐昊
程文娟
毕翔
-
机构
合肥工业大学计算机与信息学院
安徽省审计厅
教育部安全关键工业测控技术教育部工程研究中心
-
出处
《系统工程学报》
CSCD
北大核心
2011年第5期664-670,共7页
-
基金
教育部留学回国人员科研启动基金资助项目(教外司2008890)
安徽省自然科学基金资助项目(070416242
+2 种基金
090-412046)
安徽高校省级自然科学研究重点资助项目(KJ2008A058
KJ2010A256)
-
文摘
研究电子零售市场上两个销售商在彼此没有信息交互情况下的异步动态定价问题.基于性能势理论,建立了同时适用于平均和折扣两种优化准则下的异步定价策略的Q学习和WoLF-PHC算法,通过一个数值例子比较了相关算法的学习优化效果.仿真结果表明,Q学习和WoLF-PHC算法都能较好地解决异步动态定价问题,但由于后者采用混合策略和可变学习率,故能更好地适应环境变化,并具有更好的学习优化效果.
-
关键词
异步动态定价
多AGENT
性能势
wolf—phc算法
-
Keywords
asynchronous dynamic pricing
multi-agent
performance potential
wolf-phc algorithm
-
分类号
TP273
[自动化与计算机技术—检测技术与自动化装置]
-
-
题名基于多Agent的季节性商品动态定价算法
被引量:2
- 2
-
-
作者
陆慧
-
机构
安徽财贸职业学院电子信息系
合肥工业大学计算机与信息学院
-
出处
《计算机应用》
CSCD
北大核心
2011年第11期3135-3139,共5页
-
基金
教育部留学回国人员科研启动基金资助项目(070416242)
安徽省自然科学基金资助项目(090412046)
+1 种基金
安徽高校省级自然科学研究重点项目(KJ2007A063
KJ2008A058)
-
文摘
研究两个提供商销售季节性商品时的最优定价策略问题。在性能势理论的基础上,针对季节性商品的特殊属性,建立两个提供商之间没有信息交互情况下的季节性商品的动态定价模型,并引入了Q学习算法和Wolf-PHC算法。通过仿真实验对DF方法定价,Q学习算法定价和Wolf-PHC算法定价进行比较,得到Wolf-PHC算法定价的优化效果更明显,适应性更强。
-
关键词
季节性商品
动态定价
Q学习算法
wolf-phc算法
-
Keywords
seasonal goods
dynamic pricing
Q-learning algorithm
wolf-phc algorithm
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
TP315
[自动化与计算机技术—计算机科学与技术]
-