检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

A Simulation Optimization Algorithm for CTMDPs Based on Randomized Stationary Policies^1）被引量：4: 1; 作者 TANGHao XIHong-Sheng YINBao-Qun 《自动化学报》 EI CSCD 北大核心 2004年第2期229-234,共6页; Based on the theory of Markov performance potentials and neuro-dynamic programming(NDP) methodology, we study simulation optimization algorithm for a class of continuous timeMarkov decision processes (CTMDPs) under ra... 展开更多; 关键词仿真优化算法随机平稳策略 ctmdp Markov性能势理论; 下载PDF 职称材料

CTMDP AND ITS RELATIONSHIP WITH DTMDP: 2; 作者胡奇英《Chinese Science Bulletin》 SCIE EI CAS 1990年第8期687-691,共5页; Continuous time Markov decision programming (shortly, CTMDP) with discount return criterion investigated in this note is {S,[(A(i), (i)), i∈S], q, r, α}. In this model the state set S is countable; the action set A(... 展开更多; 关键词 ctmdp DTMDP OPTIMALITY equation.; 原文传递

报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划被引量：2: 3; 作者伍从斌《应用数学学报》 CSCD 北大核心 1997年第2期196-208,共13页; 本文首次在报酬函数及转移速率族均非一致有界的条件下，对可数状态空间，可数行动集的连续时间折扣马氏决策规划进行研究.文中引入了一类新的无界报酬函数，在一类新的马氏策略中，讨论了最优策略的存在性及其结构，除证明了在有界报... 展开更多; 关键词马氏决策规划转移速率族 ctmdp 报酬函数; 原文传递

报酬无界的连续时间折扣马氏决策规划被引量：2: 4; 作者伍从斌张继红《应用概率统计》 CSCD 北大核心 1997年第1期1-10,共10页; 本文讨论报酬函数无界，转移速率族一致有界，状态空间和行动集均可数的连续时间折扣马氏决策规划（CTMDP）．文中引入了一类新的无界报酬函数，并在一新的马氏策略类中，证明了有界报酬下成立的所有结果；讨论了最优策略的结构，得到... 展开更多; 关键词马氏决策规划无界报酬折扣准则 ctmdp; 下载PDF 职称材料

马尔科夫决策过程在电子商务中的一个应用: 5; 作者刘明华张峥嵘《科技资讯》 2007年第32期251-254,共4页; 着眼于电子商务的长期运作,基于有限的服务台,分析了运营商的运作规律,建立了连续时间的马尔科夫决策过程(CTMDP)模型,给出了如何作出最优决策的简洁方法。决策最大化了运营商的长期折扣利润的同时提高了可带来高利润的客户群的服务水... 展开更多; 关键词有限服务台长期折扣报酬 ctmdp 最优决策; 下载PDF 职称材料

CONTINUOUS TIME MARKOV DECISION PROGRAMMING WITH AVERAGE REWARD CRITERION AND UNBOUNDED REWARD RATE: 6; 作者郑少慧《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 1991年第1期6-16,共11页; This paper deals with the continuous time Markov decision programming (briefly CTMDP) withunbounded reward rate.The economic criterion is the long-run average reward. To the models withcountable state space,and compa... 展开更多; 关键词 CONTINUOUS TIME MARKOV DECISION PROGRAMMING WITH AVERAGE REWARD CRITERION AND UNBOUNDED REWARD RATE ctmdp; 原文传递

基于马尔科夫过程的网络交易单积分声誉系统被引量：2: 7; 作者李家齐惠雷李博威《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心 2010年第9期1468-1471,1475,共5页; 基于鼓励商家在交易中选择守信策略,考虑对商家利益的保护,该文提出电子商务的单积分声誉机制的理念。分析电子商务平台上声誉与顾客到达之间的函数关系;建立基于连续时间Markov决策过程(CTMDP)的电子商务交易模型,给出不同策略下的收... 展开更多; 关键词电子商务单积分声誉机制 MARKOV过程连续时间Markov决策过程(ctmdp) 收益函数惩罚强度; 原文传递

事件驱动Q学习在呼叫接入控制中的应用: 8; 作者任付彪周雷 +1 位作者马学森魏振春《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心 2011年第1期76-79,共4页; 文章研究了计时报酬方式下最优呼叫接入控制问题,建立了系统的连续时间Markov决策过程(CT-MDP),根据系统特征引入后状态Q值更新方法,给出呼叫接入控制问题基于事件驱动Q学习优化算法,并给出一个数值仿真实例;仿真结果表明,该算法比Q学... 展开更多; 关键词连续时间Markov决策过程事件驱动Q学习呼叫接入控制; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	A Simulation Optimization Algorithm for CTMDPs Based on Randomized Stationary Policies^1）	TANGHao XIHong-Sheng YINBao-Qun	《自动化学报》 EI CSCD 北大核心	2004	4	下载PDF 职称材料
2	CTMDP AND ITS RELATIONSHIP WITH DTMDP	胡奇英	《Chinese Science Bulletin》 SCIE EI CAS	1990	0	原文传递
3	报酬函数及转移速率族均非一致有界的连续时间折扣马氏决策规划	伍从斌	《应用数学学报》 CSCD 北大核心	1997	2	原文传递
4	报酬无界的连续时间折扣马氏决策规划	伍从斌张继红	《应用概率统计》 CSCD 北大核心	1997	2	下载PDF 职称材料
5	马尔科夫决策过程在电子商务中的一个应用	刘明华张峥嵘	《科技资讯》	2007	0	下载PDF 职称材料
6	CONTINUOUS TIME MARKOV DECISION PROGRAMMING WITH AVERAGE REWARD CRITERION AND UNBOUNDED REWARD RATE	郑少慧	《Acta Mathematicae Applicatae Sinica》 SCIE CSCD	1991	0	原文传递
7	基于马尔科夫过程的网络交易单积分声誉系统	李家齐惠雷李博威	《清华大学学报（自然科学版）》 EI CAS CSCD 北大核心	2010	2	原文传递
8	事件驱动Q学习在呼叫接入控制中的应用	任付彪周雷马学森魏振春	《合肥工业大学学报（自然科学版）》 CAS CSCD 北大核心	2011	0	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部