期刊文献+
共找到188篇文章
< 1 2 10 >
每页显示 20 50 100
“竞合”理论的帕累托效应研究 被引量:5
1
作者 何庆明 戴丽萍 《华南农业大学学报(社会科学版)》 2004年第3期58-62,共5页
企业竞争战略理论已经进入了合作竞争时代。为了揭示竞合理论的形成及其特性 ,通过运用博弈理论的分析方法 ,文章剖析了竞合理论形成的博弈机制 ,并得出了这种博弈机制不仅能满足企业追求利润最大化的要求 。
关键词 竞合理论 帕累托法则 零和博弈 合作博弈
下载PDF
企业所有者与职业经理人如何走出“零和”博弈的误区 被引量:1
2
作者 韩秀兰 阚先学 《科技情报开发与经济》 2006年第4期198-199,共2页
分析了企业所有者和职业经理人走向“分手”局面的原因,提出使两者走出误区的途径:一是所有者既要让出剩余权力,同时又要对职业经理人实行严格的激励和约束机制;二是职业经理人应加强自身的职业道德修养;三是完善社会环境;四是双方要有... 分析了企业所有者和职业经理人走向“分手”局面的原因,提出使两者走出误区的途径:一是所有者既要让出剩余权力,同时又要对职业经理人实行严格的激励和约束机制;二是职业经理人应加强自身的职业道德修养;三是完善社会环境;四是双方要有共同的价值观。 展开更多
关键词 企业所有者 职业经理人 “零和”博弈
下载PDF
美国图书馆超联盟的形成机制——非零和合作博弈 被引量:12
3
作者 蒋丽艳 蒋丽红 《新世纪图书馆》 2004年第3期73-75,共3页
文章论述了美国图书馆超联盟的形成机制及其潜在的驱动力量。
关键词 美国 图书馆超联盟 合作博弈 资源共享 创新 经济利益
下载PDF
Adaptive dynamic programming for online solution of a zero-sum differential game 被引量:10
4
作者 Draguna VRABIE Frank LEWIS 《控制理论与应用(英文版)》 EI 2011年第3期353-360,共8页
This paper will present an approximate/adaptive dynamic programming(ADP) algorithm,that uses the idea of integral reinforcement learning(IRL),to determine online the Nash equilibrium solution for the two-player zerosu... This paper will present an approximate/adaptive dynamic programming(ADP) algorithm,that uses the idea of integral reinforcement learning(IRL),to determine online the Nash equilibrium solution for the two-player zerosum differential game with linear dynamics and infinite horizon quadratic cost.The algorithm is built around an iterative method that has been developed in the control engineering community for solving the continuous-time game algebraic Riccati equation(CT-GARE),which underlies the game problem.We here show how the ADP techniques will enhance the capabilities of the offline method allowing an online solution without the requirement of complete knowledge of the system dynamics.The feasibility of the ADP scheme is demonstrated in simulation for a power system control application.The adaptation goal is the best control policy that will face in an optimal manner the highest load disturbance. 展开更多
关键词 Approximate/Adaptive dynamic programming game algebraic Riccati equation zero-sum differential game Nash equilibrium
原文传递
基于Markov对策的多智能体协调方法及其在Robot Soccer中的应用 被引量:5
5
作者 范波 潘泉 张洪才 《机器人》 EI CSCD 北大核心 2005年第1期46-51,共6页
提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 .通过在RobotSoccer中的应用和实验 ,说明了基于... 提出了一种分层的基于Markov对策的多智能体协调方法 ,根据多智能体之间的竞争和合作的关系 ,高层采用零和Markov对策解决与对手之间的竞争 ,低层采用团队Markov对策完成与团队内部的合作 .通过在RobotSoccer中的应用和实验 ,说明了基于Markov对策的多智能体协调方法优于传统的多智能体学习 . 展开更多
关键词 多智能体 MARKOV对策 零和Markov对策 团队Markov对策 ROBOT SOCCER
下载PDF
协同创新:我国研究生教育的价值转向与人文关怀 被引量:7
6
作者 李伟 易小芳 韩习祥 《高校教育管理》 CSSCI 2013年第3期95-99,22,共5页
协同创新作为一种新型的非零和合作博弈,倡导的是"2+2>5"的整体状态,是一种追求资源匹配、互补共享和功能耦合的谐调文化。研究生"政产学研用"合作教育的本质是政府、产业(企业)部门与高校、科研机构结合目标用... 协同创新作为一种新型的非零和合作博弈,倡导的是"2+2>5"的整体状态,是一种追求资源匹配、互补共享和功能耦合的谐调文化。研究生"政产学研用"合作教育的本质是政府、产业(企业)部门与高校、科研机构结合目标用户的需求,利用各自的比较优势协同创新,实现教育、科技与经济的协调发展。在创新型国家与人力资源强国建设的历史背景下,充分考量研究生教育的现实特征,从"政产学研用"五位一体、协同创新的角度,进一步深化对研究生教育发展的全新理念研究,着力构思需求导向、全面开放、深度融合、创新引领的制度安排,以期为我国新时期研究生教育的发展提供可资借鉴的思路。 展开更多
关键词 研究生教育 协同创新 非零和合作博弈 合作教育 文化转型
下载PDF
多无人机系统在线强化学习最优安全跟踪控制
7
作者 弓镇宇 杨飞生 《航空科学技术》 2024年第4期25-30,共6页
在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参... 在无人机(UAV)编队跟踪任务中,虚假数据注入(FDI)攻击者可向控制指令注入误导性数据,导致无人机无法形成指定的编队构型,故需设计安全编队跟踪控制器。为此,本文利用零和图博弈对攻防过程进行建模,其中FDI攻击者和安全控制器是博弈的参与者,攻击者的目标是最大化设定的成本函数,而安全控制器的目标与之相反,求解博弈并获得最优安全控制策略依赖于求取Hamilton-Jacobi-Isaacs(HJI)方程的解。而HJI方程是耦合偏微分方程,难以直接求解,因此结合经验回放机制引入了有限时间收敛的在线强化学习算法,设计了单评价神经网络近似值函数并获得了最优安全控制策略。最终利用仿真验证了算法的有效性。 展开更多
关键词 FDI攻击 多无人机 在线强化学习 优化控制 零和图博弈
下载PDF
基于零和微分博弈的航天器相对位置容错控制
8
作者 孟庆媛 姜斌 +1 位作者 马亚杰 任好 《中国科学:技术科学》 EI CSCD 北大核心 2024年第3期391-401,共11页
针对带有执行器偏置故障和失效故障的航天器相对位置控制系统,本文提出了一种基于零和微分博弈的最优容错控制方法.首先,利用线性二次调节设计反馈控制器以保证无故障时系统的渐近稳定性能;其次,将航天器相对位置容错控制问题转换为零... 针对带有执行器偏置故障和失效故障的航天器相对位置控制系统,本文提出了一种基于零和微分博弈的最优容错控制方法.首先,利用线性二次调节设计反馈控制器以保证无故障时系统的渐近稳定性能;其次,将航天器相对位置容错控制问题转换为零和微分博弈问题,结合Hamilton-Jacobi-Issac(HJI)方程和极小极大原则设计最优控制律;最后,利用自适应动态规划方法设计评判网络对最优性能函数进行估计,构成自适应控制信号,保证了系统稳定性和状态最终一致有界.仿真结果表明了本文设计的容错控制律的有效性. 展开更多
关键词 执行器故障 容错控制 相对位置控制 航天器 零和微分博弈
原文传递
两方零和马尔科夫博弈策略梯度算法及收敛性分析
9
作者 王卓 李永强 +1 位作者 冯宇 冯远静 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2024年第3期480-491,共12页
为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定... 为了解决基于策略的强化学习方法在两方零和马尔科夫博弈中学习效率低下的问题,提出同时更新双方玩家策略的近似纳什均衡策略优化算法.将两方零和马尔科夫博弈问题描述为最大最小优化问题,针对参数化策略,给出马尔科夫博弈的策略梯度定理,并通过近似随机策略梯度的推导,为算法实施提供可行性基础.通过比较分析不同的最大最小问题梯度更新方法,发现额外梯度相较于其他方法具有更好的收敛性能.基于这一发现,提出基于额外梯度的近似纳什均衡策略优化算法,并给出算法的收敛性证明.在Oshi-Zumo游戏上,使用表格式softmax参数化策略以及神经网络作为参数化策略,验证不同游戏规模场景下算法的有效性.通过对比实验,验证算法相对于其他方法的收敛性和优越性. 展开更多
关键词 两方零和马尔科夫博弈 强化学习 策略优化 额外梯度 纳什均衡 神经网络
下载PDF
基于零和微分对策的非仿射导弹拦截系统制导律设计
10
作者 田辈辈 刘奇 袁斐然 《弹箭与制导学报》 北大核心 2023年第4期39-45,共7页
文中基于零和微分对策理论研究了非仿射导弹拦截系统制导律设计问题。首先构建辅助系统,将系统转化为仿射非线性增广形式;其次将导弹与目标视为对抗双方,根据极大极小值原理,设计最优微分对策制导策略,使得拦截系统能够满足预设的性能指... 文中基于零和微分对策理论研究了非仿射导弹拦截系统制导律设计问题。首先构建辅助系统,将系统转化为仿射非线性增广形式;其次将导弹与目标视为对抗双方,根据极大极小值原理,设计最优微分对策制导策略,使得拦截系统能够满足预设的性能指标;接着为了获得HJI(Hamilton-Jacobi-Isaacs)方程解析解,利用积分自适应动态规划技术构建神经网络;然后设计积分型自适应权值更新律,在线学习最优微分对策制导律,通过Lyapunov方法证明了闭环系统的有界性;最后将所提算法应用于非仿射导弹拦截系统。仿真结果表明,导弹视线角速率和相对速率满足目标成功捕获必要条件且脱靶量为1 m左右,导弹能够成功拦截目标。 展开更多
关键词 零和微分对策 非仿射导弹拦截系统 积分自适应动态规划 神经网络
下载PDF
随机奇异系统的零和微分博弈 被引量:4
11
作者 周海英 张成科 朱怀念 《控制工程》 CSCD 北大核心 2016年第10期1562-1565,共4页
针对噪声依赖于状态的It?型随机奇异系统,分别讨论有限时域和无限时域下的零和微分博弈问题。首先,基于线性二次最优控制,分别建立了有限时域和无限时域随机奇异系统零和微分博弈模型,在此基础上,通过配方法,得到了有限时域随机奇异系... 针对噪声依赖于状态的It?型随机奇异系统,分别讨论有限时域和无限时域下的零和微分博弈问题。首先,基于线性二次最优控制,分别建立了有限时域和无限时域随机奇异系统零和微分博弈模型,在此基础上,通过配方法,得到了有限时域随机奇异系统零和微分博弈问题的均衡解等价于相应的耦合Riccati微分方程存在解,无限时域随机奇异系统零和微分博弈问题的均衡解等价于相应的耦合Riccati代数方程存在解,并给出了鞍点均衡策略,最后给出了数值算例。 展开更多
关键词 随机奇异系统 零和微分博弈 耦合Riccati方程 鞍点均衡策略
下载PDF
基于安全博弈的SDN数据包抽检策略 被引量:2
12
作者 张伟丽 王兴伟 +1 位作者 张爽 黄敏 《郑州大学学报(理学版)》 CAS 北大核心 2018年第1期15-19,共5页
设计并仿真实现了一种基于安全博弈的SDN数据包抽检策略,以优化SDN数据包抽检问题中的网络安全资源配置.将SDN数据包抽检问题建模成攻防双方参与的零和安全博弈;根据网络节点重要性量化网络节点收益值以确定攻防双方收益;通过对上述安... 设计并仿真实现了一种基于安全博弈的SDN数据包抽检策略,以优化SDN数据包抽检问题中的网络安全资源配置.将SDN数据包抽检问题建模成攻防双方参与的零和安全博弈;根据网络节点重要性量化网络节点收益值以确定攻防双方收益;通过对上述安全博弈模型求解得到防御者的均衡策略,即为有限安全资源约束下最优的SDN数据包抽检策略.仿真结果表明,提出的基于安全博弈的SDN数据包抽检策略是有效的. 展开更多
关键词 软件定义网络 数据包抽检 零和安全博弈 网络安全
下载PDF
自适应动态规划算法在飞行器追逃中的应用 被引量:2
13
作者 刘念 刘春生 孙景亮 《飞行力学》 CSCD 北大核心 2016年第6期45-48,62,共5页
针对飞行器追逃对抗的二人零和微分对策问题,提出基于数据的积分策略迭代自适应动态规划算法,以求解数学模型未知系统的控制律。该算法利用固定时段内有效的状态和输入信息,建立数据模型,并对其进行基于值函数和控制策略的算法迭代,在... 针对飞行器追逃对抗的二人零和微分对策问题,提出基于数据的积分策略迭代自适应动态规划算法,以求解数学模型未知系统的控制律。该算法利用固定时段内有效的状态和输入信息,建立数据模型,并对其进行基于值函数和控制策略的算法迭代,在平面拦截系统完全未知的情况下得到追逃双方的近似最优策略。仿真结果表明,所得到的双方控制策略能在有限界内无限接近最优解,验证了所提出算法的有效性。 展开更多
关键词 追逃问题 零和微分对策 策略迭代 自适应动态规划
原文传递
具有混合策略的二人有限零和灰色博弈 被引量:1
14
作者 罗党 吴顺祥 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第3期318-321,共4页
基于灰色系统理论的思想和方法,探讨了具有混合策略的二人有限零和博弈问题.提出了具有混合策略的二人有限零和灰色博弈的概念,以及相应的平衡解、上、下临界平衡解、理想平衡解、θ定位平衡解、均值定位平衡解等概念.证明了具有混合策... 基于灰色系统理论的思想和方法,探讨了具有混合策略的二人有限零和博弈问题.提出了具有混合策略的二人有限零和灰色博弈的概念,以及相应的平衡解、上、下临界平衡解、理想平衡解、θ定位平衡解、均值定位平衡解等概念.证明了具有混合策略的二人有限零和灰色博弈问题平衡解的存在性,并且推证过程也提供了求解上、下临界平衡解、θ定位平衡解和均值定位平衡解的方法.指出了灰色博弈问题的最优值与其上、下临界博弈问题最优值之间的关系,以及理想平衡解存在的一个充分条件.文中的实例说明了有关概念及结论的合理性与求解方法的有效性. 展开更多
关键词 混合策略 有限 博弈问题 灰色系统理论 平衡解 解的存在性 求解方法 充分条件 最优值 定位 临界 合理性 理想 均值
下载PDF
特许经营中的非零和博弈分析
15
作者 钱昇 于亮 《杭州电子科技大学学报(社会科学版)》 2006年第1期27-31,共5页
特许经营中特许商和加盟商之间的多种博弈关系可以概括为非零和博弈与零和博弈两类。通过建立完全信息静态博弈模型,结合三个案例的讨论主要对其中的非零和博弈进行分析,最后给出当前我国发展特许经营业的若干建议,以增强正和博弈,尽可... 特许经营中特许商和加盟商之间的多种博弈关系可以概括为非零和博弈与零和博弈两类。通过建立完全信息静态博弈模型,结合三个案例的讨论主要对其中的非零和博弈进行分析,最后给出当前我国发展特许经营业的若干建议,以增强正和博弈,尽可能地减弱或消除负和博弈。 展开更多
关键词 特许经营 特许商 加盟商 非零和博弈 博弈模型
下载PDF
基于零和博弈的级联非线性系统的跟踪控制
16
作者 杨雪静 李庆奎 易军凯 《北京信息科技大学学报(自然科学版)》 2020年第2期43-51,共9页
针对带有不确定干扰的级联非线性系统的跟踪控制问题,将控制和干扰视为博弈的双方,在跟踪过程中将跟踪轨迹的最优性考虑在内,利用反推技术设计前馈控制器,将严格反馈系统的跟踪控制问题转化成等价的仿射系统的零和微分博弈问题;采用自... 针对带有不确定干扰的级联非线性系统的跟踪控制问题,将控制和干扰视为博弈的双方,在跟踪过程中将跟踪轨迹的最优性考虑在内,利用反推技术设计前馈控制器,将严格反馈系统的跟踪控制问题转化成等价的仿射系统的零和微分博弈问题;采用自适应动态规划(adaptive dynamic programming,ADP)技术,构建评价网络、控制网络和干扰网络实时在线学习,近似求解非线性零和微分博弈产生的HJI(hamilton-jacobi-isaacs)方程,进而得到值函数、控制策略和干扰策略。利用Lyapunov理论,证明了基于反推技术的零和微分博弈的收敛性和闭环系统的稳定性。仿真实例验证了该方法的有效性。 展开更多
关键词 级联 非线性 零和微分博弈 反推技术 跟踪控制
下载PDF
连续初始状态下带不对称信息的微分博弈
17
作者 宋敏 洪世煌 《杭州电子科技大学学报(自然科学版)》 2019年第5期90-93,共4页
研究了关于初始状态的带不对称信息的二人零和微分博弈。在其不对称信息类型不是有限的情形下,讨论了上、下值函数关于Wasserstein距离的Lipschitz连续性,并证明了在Isaacs条件下,此博弈值函数的存在性。
关键词 零和微分博弈 不对称信息 Isaacs条件 Wasserstein距离
下载PDF
基于自适应博弈的不确定非线性系统跟踪控制
18
作者 陈静 《长江信息通信》 2021年第10期53-57,共5页
基于自适应迭代算法、两人零和微分博弈和神经网络,文章研究了不确定扰动的级联非线性系统的跟踪控制问题。利用零和博弈算法,将控制和扰动作为博弈的双方,博弈的纳什均衡解将提供有界L2增益问题的解决方案,因此对于鲁棒控制非常重要。... 基于自适应迭代算法、两人零和微分博弈和神经网络,文章研究了不确定扰动的级联非线性系统的跟踪控制问题。利用零和博弈算法,将控制和扰动作为博弈的双方,博弈的纳什均衡解将提供有界L2增益问题的解决方案,因此对于鲁棒控制非常重要。但其解决方案取决于求解设计Hamilton-Jacobi-Isaacs(HJI)方程。所以文章利用了一种基于策略迭代的在线自适应学习算法,用于解决具有已知动态的非线性系统的连续时间两人无限时延零和博弈问题。给出了针对RBF神经网络的新型优化算法,证明了最佳鞍点解的收敛性,并且还保证了系统的稳定性。仿真实例表明,该新算法在线求解线性系统和复杂非线性系统的HJI方程是有效的。 展开更多
关键词 中值定理 零和微分博弈 HJL方程 RBF神经网络 纳什均衡解
下载PDF
协同创新:我国研究生教育的价值转向与人文关怀
19
作者 李伟 易小芳 韩习祥 《评价与管理》 2013年第3期1-4,22,共5页
协同创新作为一种新型的非零和合作博弈,倡导的是"2+2>5"的整体状态,是一种追求资源匹配、互补共享和功能耦合的谐调文化。研究生"政产学研用"合作教育的本质是政府、产业(企业)部门与高校、科研机构结合目标用... 协同创新作为一种新型的非零和合作博弈,倡导的是"2+2>5"的整体状态,是一种追求资源匹配、互补共享和功能耦合的谐调文化。研究生"政产学研用"合作教育的本质是政府、产业(企业)部门与高校、科研机构结合目标用户的需求,利用各自的比较优势协同创新,实现教育、科技与经济的协调发展。在创新型国家与人力资源强国建设的历史背景下,充分考量研究生教育的现实特征,从"政产学研用"五位一体、协同创新的角度,进一步深化对研究生教育发展的全新理念研究,着力构思需求导向、全面开放、深度融合、创新引领的制度安排,以期为我国新时期研究生教育的发展提供可资借鉴的思路。 展开更多
关键词 研究生教育 协同创新 非零和合作博弈 合作教育 文化转型
下载PDF
一类微分博弈上值函数的上共轭的等价形式
20
作者 贺乐 洪世煌 《杭州电子科技大学学报(自然科学版)》 2019年第4期88-91,共4页
证明了带不对称信息和相关信息的二人零和微分博弈上值函数的上共轭等价形式。通过定义博弈者带延迟的非预测随机策略,定义了博弈的值函数,根据上共轭的定义,得到上值函数的上共轭函数,最后证明了其等价形式。
关键词 不完全信息 二人零和微分博弈 上值函数 上共轭
下载PDF
上一页 1 2 10 下一页 到第
使用帮助 返回顶部