-
题名Bandit过程及其应用(英文)
- 1
-
-
作者
王熙逵
-
机构
Manitoba大学统计系
-
出处
《经济数学》
2001年第4期39-48,共10页
-
基金
the Natural Sciences and Engineering Research Council( NSERC) of Canada
-
文摘
本文有两个目的 .第一 ,对 Bandit过程这一学科的主要概念及结果作一次系统性的介绍 .第二 ,综述Bandit过程的模型 ,计算与应用的最新发展 .本文刻画了 Bandit过程与马氏决策规划的关系 .通过考虑理论上或方法论上的局限 ,实际中或计算上的困难 ,以及应用中的限制 .
-
关键词
应用
Bandit过程
动态规划
马氏决策过程
最优决策
近视决策
-
Keywords
Bandit processes
dynamic programming
Markov decision processes
optimal strategy
play-the-winner rule
myopic strategy
-
分类号
O211.62
[理学—概率论与数理统计]
O221.3
[理学—数学]
-
-
题名面向印制电路板钻孔任务动态调度的短视策略
- 2
-
-
作者
鄢敏杰
王小明
朱松平
陈庆新
毛宁
-
机构
广东工业大学广东省计算机集成制造重点实验室
-
出处
《工业工程》
北大核心
2021年第6期18-24,56,共8页
-
基金
国家自然科学基金资助项目(71972053,61973089,51505090,51775120)。
-
文摘
印制电路板钻孔任务因随机到达和工艺要求而难以调度。考虑该问题的NP难性质,提出基于优先规则和智能算法的短视策略。该策略采用事件驱动的再调度机制,在任务到达和任务完工时触发优化算法对当前未开工任务进行决策。为了高效求解每个决策时刻的优化问题,构建了嵌入局部优势定理的模拟退火和变邻域搜索算法,其初始解由优先规则获得。通过计算实验,在不同调度环境下对比两种智能算法与经典优先规则的表现。实验结果表明,智能算法在多数目标下的优化效果较优先规则可提升20%以上,变邻域搜索的优化效果略好于模拟退火,但是模拟退火的计算效率高一倍。
-
关键词
印制电路板
钻孔任务
动态调度
短视策略
模拟退火
变邻域搜索
-
Keywords
printed circuit board
drilling tasks
dynamic scheduling
myopic strategy
simulated annealing
variable neighborhood search
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名带宽有限条件下的网络检测算法
被引量:2
- 3
-
-
作者
方正
文成林
-
机构
杭州电子科技大学信息与控制研究所
-
出处
《科技通报》
北大核心
2011年第2期252-257,共6页
-
基金
面向大型工程安全预测与评估的信息融合方法(No60934009)
-
文摘
考虑了一类可以用有向图模型表示的网络结构,介绍了在全局最小Bayes风险准则下的集中式和近似分散式两种决策,以及它们的变分公式的表达形式。权衡了它们各自的优缺点,给定一些模型假设,考虑信念传播算法,结合队决策理论的方法,推导出在P-B-P最优准则下的检测算法。该算法分为在线计算和离线计算,离线计算可以看作是正序的似然函数传递和倒序的代价函数传递两个过程。这是一个迭代的过程,而且节点在每步迭代中都调整了自身的阈值。这种算法的计算量和性能介于集中式和近似分散式之间,最后通过一个简单网络的实验仿真验证了算法的有效性和稳定性。
-
关键词
Bayes风险
集中式决策
近似分散式决策
消息传递算法
-
Keywords
Bayesian risk
centralized strategy
myopic decentralized strategy
message-passing algorithm
-
分类号
TP393.06
[自动化与计算机技术—计算机应用技术]
-
-
题名基于P-B-P最优准则的网络检测算法
- 4
-
-
作者
文成林
方正
崔永超
李秀娟
-
机构
杭州电子科技大学信息与控制研究所
河南工业大学电气工程学院
-
出处
《电子学报》
EI
CAS
CSCD
北大核心
2013年第1期56-61,共6页
-
基金
国家自然科学基金(No.60934009
No.61034006
+1 种基金
No.61173133
No.91016020)
-
文摘
本文以有向拓扑结构的传感器网络为背景,通过分析在全局贝叶斯风险最小准则下已建立的集中式和近似分散式两种决策方法各自优势与不足,并考虑到现有的队决策方法求解决策过程中存在着局限性,结合贝叶斯公式和相关图模型理论等,建立了在P-B-P最优准则下针对此类网络的新决策方法.该方法分为在线计算和离线计算两部分,前者主要任务是基于在线测量值获得类条件概率密度;后者主要任务是如何求取用于计算阈值所需的参数,参数的计算过程分别是由正序传递似然函数消息和逆序接收代价函数消息两部分组成.同时,还分析了新方法在调节集中式和近似分散式两种决策方法的计算量和能耗之间矛盾的能力,而其优点也通过计算机仿真结果进行了验证.
-
关键词
贝叶斯风险
集中式决策
近似分散式决策
消息传递算法
-
Keywords
Bayesian risk
centralized strategy
myopic decentralized strategy
message-passing algorithm
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-