期刊文献+
共找到202篇文章
< 1 2 11 >
每页显示 20 50 100
生成式对抗网络GAN的研究进展与展望 被引量:320
1
作者 王坤峰 苟超 +3 位作者 段艳杰 林懿伦 郑心湖 王飞跃 《自动化学报》 EI CSCD 北大核心 2017年第3期321-332,共12页
生成式对抗网络GAN(Generative adversarial networks)目前已经成为人工智能学界一个热门的研究方向.GAN的基本思想源自博弈论的二人零和博弈,由一个生成器和一个判别器构成,通过对抗学习的方式来训练.目的是估测数据样本的潜在分布并... 生成式对抗网络GAN(Generative adversarial networks)目前已经成为人工智能学界一个热门的研究方向.GAN的基本思想源自博弈论的二人零和博弈,由一个生成器和一个判别器构成,通过对抗学习的方式来训练.目的是估测数据样本的潜在分布并生成新的数据样本.在图像和视觉计算、语音和语言处理、信息安全、棋类比赛等领域,GAN正在被广泛研究,具有巨大的应用前景.本文概括了GAN的研究进展,并进行展望.在总结了GAN的背景、理论与实现模型、应用领域、优缺点及发展趋势之后,本文还讨论了GAN与平行智能的关系,认为GAN可以深化平行系统的虚实互动、交互一体的理念,特别是计算实验的思想,为ACP(Artificial societies,computational experiments,and parallel execution)理论提供了十分具体和丰富的算法支持. 展开更多
关键词 生成式对抗网络 生成式模型 零和博弈 对抗学习 平行智能 ACP方法
下载PDF
Generative Adversarial Networks:Introduction and Outlook 被引量:46
2
作者 Kunfeng Wang Chao Gou +3 位作者 Yanjie Duan Yilun Lin Xinhu Zheng Fei-Yue Wang 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2017年第4期588-598,共11页
Recently, generative adversarial networks(GANs)have become a research focus of artificial intelligence. Inspired by two-player zero-sum game, GANs comprise a generator and a discriminator, both trained under the adver... Recently, generative adversarial networks(GANs)have become a research focus of artificial intelligence. Inspired by two-player zero-sum game, GANs comprise a generator and a discriminator, both trained under the adversarial learning idea.The goal of GANs is to estimate the potential distribution of real data samples and generate new samples from that distribution.Since their initiation, GANs have been widely studied due to their enormous prospect for applications, including image and vision computing, speech and language processing, etc. In this review paper, we summarize the state of the art of GANs and look into the future. Firstly, we survey GANs' proposal background,theoretic and implementation models, and application fields.Then, we discuss GANs' advantages and disadvantages, and their development trends. In particular, we investigate the relation between GANs and parallel intelligence,with the conclusion that GANs have a great potential in parallel systems research in terms of virtual-real interaction and integration. Clearly, GANs can provide substantial algorithmic support for parallel intelligence. 展开更多
关键词 ACP approach adversarial learning generative adversarial networks(GANs) generative models parallel intelligence zero-sum game
下载PDF
跨越零和:思考当代中国的中央地方关系 被引量:31
3
作者 李芝兰 《华中师范大学学报(人文社会科学版)》 CSSCI 北大核心 2004年第6期117-124,共8页
省政府在中国政治体制内拥有多大的权力 ,该权力的性质又是什么 ?该问题贯穿了海外研究当代中国中央与省政府关系的文献。为了理解这种权力关系 ,考察重心通常放在省级领导人的角色 ,以及政治体制的性质。本文认为 ,现有文献大体上都未... 省政府在中国政治体制内拥有多大的权力 ,该权力的性质又是什么 ?该问题贯穿了海外研究当代中国中央与省政府关系的文献。为了理解这种权力关系 ,考察重心通常放在省级领导人的角色 ,以及政治体制的性质。本文认为 ,现有文献大体上都未能解释清楚以下两个看似相互矛盾的现象何以能够在现实生活中共存 :即一方面中央和省政府之间存在错综复杂的关系 ,很多时候中央与地方会互相适应及让步 ;另一方面 ,每当中央偶尔实施强制性管理 ,中央政府又展示出至高无上的权力。出现中央时强时弱这高度不确定的结论 ,是由于文献中的分析往往未能恰切地解释权力这概念 ,其中核心问题是 展开更多
关键词 中央与地方关系 权力 零和博弈 非零和博弈
下载PDF
生成对抗网络在各领域应用研究进展 被引量:33
4
作者 刘建伟 谢浩杰 罗雄麟 《自动化学报》 EI CSCD 北大核心 2020年第12期2500-2536,共37页
随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的.GAN具有一个生成器网络和一个判别器网络,并通过对抗学... 随着深度学习的快速发展,生成式模型领域也取得了显著进展.生成对抗网络(Generative adversarial network,GAN)是一种无监督的学习方法,它是根据博弈论中的二人零和博弈理论提出的.GAN具有一个生成器网络和一个判别器网络,并通过对抗学习进行训练.近年来,GAN成为一个炙手可热的研究方向.GAN不仅在图像领域取得了不错的成绩,还在自然语言处理(Natural language processing,NLP)以及其他领域崭露头角.本文对GAN的基本原理、训练过程和传统GAN存在的问题进行了阐述,进一步详细介绍了通过损失函数的修改、网络结构的变化以及两者结合的手段提出的GAN变种模型的原理结构,其中包括:条件生成对抗网络(Conditional GAN,CGAN)、基于Wasserstein距离的生成对抗网络(Wasserstein-GAN,WGAN)及其基于梯度策略的WGAN(WGAN-gradient penalty,WGAN-GP)、基于互信息理论的生成对抗网络(Informational-GAN,InfoGAN)、序列生成对抗网络(Sequence GAN,SeqGAN)、Pix2Pix、循环一致生成对抗网络(Cycle-consistent GAN,Cycle GAN)及其增强Cycle-GAN(Augmented CycleGAN).概述了在计算机视觉、语音与NLP领域中基于GAN和相应GAN变种模型的基本原理结构,其中包括:基于CGAN的脸部老化应用(Face aging CGAN,Age-cGAN)、双路径生成对抗网络(Two-pathway GAN,TP-GAN)、表示解析学习生成对抗网络(Disentangled representation learning GAN,DR-GAN)、对偶学习生成对抗网络(DualGAN)、GeneGAN、语音增强生成对抗网络(Speech enhancement GAN,SEGAN)等.介绍了GAN在医学、数据增强等领域的应用情况,其中包括:数据增强生成对抗网络(Data augmentation GAN,DAGAN)、医学生成对抗网络(Medical GAN,MedGAN)、无监督像素级域自适应方法(Unsupervised pixel-level domain adaptation method,PixelDA).最后对GAN未来发展趋势及方向进行了展望. 展开更多
关键词 生成对抗网络 对抗学习 自然语言处理 计算机视觉 零和博弈 语音合成与分析
下载PDF
中美竞合关系——从零和博弈到正和博弈何以可能? 被引量:21
5
作者 胡键 《国际观察》 CSSCI 北大核心 2022年第1期54-75,共22页
拜登政府以"竞合关系"来重新定义中美关系,加上新冠肺炎疫情的冲击,中美关系更是一路向下,引起众多学者对中美关系作出"回不去了"的判断。国际政治的无政府状态决定了主权国家总是把国家利益放在优先的位置,因而,... 拜登政府以"竞合关系"来重新定义中美关系,加上新冠肺炎疫情的冲击,中美关系更是一路向下,引起众多学者对中美关系作出"回不去了"的判断。国际政治的无政府状态决定了主权国家总是把国家利益放在优先的位置,因而,国家间关系就必然存在着竞争。竞合关系并非是一种纯粹的矛盾分歧与利益竞争,实际上是合作中有竞争、竞争中有合作,这才是国家间关系的常态。中美无论是否存在社会制度、意识形态、价值观念差异,竞合关系始终存在。因此,当前中美关系的困境并不是这些差异的问题,而是在具体利益上的分歧导致的认知紧张,而这些差异则在利益矛盾下强化了双方的认知紧张,甚至导致信任赤字。不过,看待中美关系也不能过于悲观,双方若重新回到彼此尊重对方利益、地位、国际声望的状态,中美竞合关系的零和博弈完全可以走向正和博弈。 展开更多
关键词 中美关系 无政府状态 竞合关系 零和博弈 正和博弈
原文传递
基于多阶段博弈的电力CPS虚假数据注入攻击防御方法 被引量:19
6
作者 蔡星浦 王琦 +1 位作者 邰伟 刘科研 《电力建设》 北大核心 2019年第5期48-54,共7页
信息通信技术的快速发展使电力系统成为典型的信息物理系统(cyber physical system, CPS)。在电网侧控制日趋智能化的同时,电力CPS也面临潜在的网络攻击风险。文章首先分析了针对电力CPS的虚假数据注入攻击(false data injection attack... 信息通信技术的快速发展使电力系统成为典型的信息物理系统(cyber physical system, CPS)。在电网侧控制日趋智能化的同时,电力CPS也面临潜在的网络攻击风险。文章首先分析了针对电力CPS的虚假数据注入攻击(false data injection attack,FDIA)的可行性,然后针对攻击方和防御方的多阶段动态交互过程,提出了一种基于博弈论的关键测量设备的分阶段动态防御方法,通过IEEE标准系统算例验证了所提方法的可行性和有效性。 展开更多
关键词 电力信息物理系统 网络攻击 零和博弈 虚假数据注入攻击(FDIA)
原文传递
基于GAN技术的自能源混合建模与参数辨识方法 被引量:17
7
作者 孙秋野 胡旌伟 +1 位作者 杨凌霄 张化光 《自动化学报》 EI CSCD 北大核心 2018年第5期901-914,共14页
自能源(We-energy,WE)作为能源互联网的子单元旨在实现能量间的双向传输及灵活转换.由于自能源在不同工况下运行特性存在很大差异,现有方法还不能对其参数精确地辨识.为了解决上述问题,本文根据自能源网络结构提出了一种基于GAN技术的... 自能源(We-energy,WE)作为能源互联网的子单元旨在实现能量间的双向传输及灵活转换.由于自能源在不同工况下运行特性存在很大差异,现有方法还不能对其参数精确地辨识.为了解决上述问题,本文根据自能源网络结构提出了一种基于GAN技术的数据–机理混合驱动方法对自能源模型参数辨识.将GAN(Generative adversarial networks)模型中训练数据与专家经验结合进行模糊分类,解决了自能源在不同运行工况下的模型切换问题.通过应用含策略梯度反馈的改进GAN技术对模型进行训练,解决了自能源中输出序列离散的问题.仿真结果表明,提出的模型具有较高的辨识精度和更好的推广性,能有效地拟合系统不同工况下各节点的状态变化. 展开更多
关键词 能源互联网 自能源 生成式对抗网络 生成式模型 对抗学习 零和博弈
下载PDF
发达与欠发达地区耕地保护行为中的利益机制分析 被引量:12
8
作者 俞文华 《中国人口·资源与环境》 CSSCI 北大核心 1997年第4期22-27,共6页
本文从当前发达与欠发达地区耕地保护上的利益矛盾入手,以它们之间的内在经济关系为基础,运用局部均衡分析方法,构建了一个简单的经济模型,对上述矛盾“零和博弈”的长期效应进行了揭示,并讨论了消除这种不良影响的政策或制度安排。
关键词 发达地区 欠发达地区 耕地保护 利益矛盾 零和博弈
下载PDF
可持续发展中的经济利益博奕研究 被引量:8
9
作者 徐惠平 王继青 《复旦学报(社会科学版)》 CSSCI 北大核心 2000年第3期119-124,共6页
经济利益在可持续发展进程中具有举足轻重的作用。在环境问题中,研究经济利益主体的出发点和动机,有利于寻求经济利益主体行为的协调机制。发展的不可持续性是缘于人类对经济利益的过分追求,阻碍可持续发展进程的根本原因是各国(包... 经济利益在可持续发展进程中具有举足轻重的作用。在环境问题中,研究经济利益主体的出发点和动机,有利于寻求经济利益主体行为的协调机制。发展的不可持续性是缘于人类对经济利益的过分追求,阻碍可持续发展进程的根本原因是各国(包括南北双方、特别是北方)基于经济利益的“零和博弈”。“人类只有一个地球”,并且人类的“生存权高于一切”,在通向可持续发展道路上,每个国家都肩负着责任和义务。因此,必须以经济利益为基点、以合作为核心,建立一套完善的国际环保制度,实现可持续发展的经济利益,这是全球皆赢的博弈。 展开更多
关键词 可持续发展 经济利益 零和博弈 合作博弈 制度
下载PDF
“竞合”理论的帕累托效应研究 被引量:5
10
作者 何庆明 戴丽萍 《华南农业大学学报(社会科学版)》 2004年第3期58-62,共5页
企业竞争战略理论已经进入了合作竞争时代。为了揭示竞合理论的形成及其特性 ,通过运用博弈理论的分析方法 ,文章剖析了竞合理论形成的博弈机制 ,并得出了这种博弈机制不仅能满足企业追求利润最大化的要求 。
关键词 竞合理论 帕累托法则 零和博弈 合作博弈
下载PDF
证券市场零和博弈与监管有效性的法经济学分析 被引量:13
11
作者 郑彧 《法制与社会发展》 CSSCI 北大核心 2011年第5期30-40,共11页
为避免"股市赌场论",我国主流学界一直否认证券市场的零和博弈特点,只是强调证券市场对优化资源配置的良好属性。然而在现实生活中,在"证券市场优化配置"的理论框架下我们却无法回避为什么证券市场会存在内幕交易... 为避免"股市赌场论",我国主流学界一直否认证券市场的零和博弈特点,只是强调证券市场对优化资源配置的良好属性。然而在现实生活中,在"证券市场优化配置"的理论框架下我们却无法回避为什么证券市场会存在内幕交易、虚假陈述、操纵市场等私利性行为,我们在现有理论框架下也无法解释为什么现有的监管制度不足以有效监管市场。基于学界与监管层在观点上并不接受证券市场为"彼之所得为我之所失"的零和博弈观点,因此我们的监管实践并不是根据零和博弈的特点"对症下药",这是导致目前我国证券市场处于"监管不足"与"监管过度"两难境地的根本原因。为此,我们试图从证券市场博弈的零和性分析出发,对我国证券市场监管的制度诉求、有效监管的制约因素及制度选择的有效性在法经济学层面作番讨论,以期对我国证券监管的制度重塑提供相应的理论依据。 展开更多
关键词 证券监管 有效性 零和博弈 制度选择
原文传递
大国中亚地区外交新态势 被引量:11
12
作者 王术森 曾向红 《现代国际关系》 CSSCI 北大核心 2020年第10期44-52,62,共10页
近年来,传统地缘竞争思维出现回归趋势,大国在全球和地区层面的地缘政治竞争明显加剧,大国在中亚地区的竞争和对抗是其典型表现之一。近年来,世界主要大国纷纷调整中亚政策,加大介入中亚事务的力度,导致中亚地区外交形势生变。大国相互... 近年来,传统地缘竞争思维出现回归趋势,大国在全球和地区层面的地缘政治竞争明显加剧,大国在中亚地区的竞争和对抗是其典型表现之一。近年来,世界主要大国纷纷调整中亚政策,加大介入中亚事务的力度,导致中亚地区外交形势生变。大国相互之间在中亚地区的互动呈现更浓的零和博弈色彩,大国介入中亚事务刺激中亚国家寻求团结,大国在机制上热衷于建立“小多边”合作机制,纷纷致力于与中亚国家推进于己有利的互联互通。这一切对中国来说既有挑战,也有机遇。一方面,大国加大对中亚地区的关注和投入,要求中国谨慎行事,避免激化地区矛盾。另一方面,中国可充分发挥自身的经济优势,借助与中亚交往的已有基础和“中国+中亚五国”外长会晤机制,推动中国与中亚国家的互信与合作迈上新的台阶。 展开更多
关键词 中亚地区 外交动向 零和博弈 “C5+1” 互联互通
原文传递
转变发展方式——由工业文明迈向生态文明 被引量:9
13
作者 张捷 《中国人口·资源与环境》 CSSCI 北大核心 2012年第S2期287-290,共4页
本文提出根据文明演化的自然逻辑和自然界对工业文明不堪重负的现状,生态文明必将取代工业文明成为未来的主流文明。生态文明将更多着眼于满足人类的非物质需求尤其是精神需求,精神享受型的服务业将成为生态文明阶段的主导产业;市场经... 本文提出根据文明演化的自然逻辑和自然界对工业文明不堪重负的现状,生态文明必将取代工业文明成为未来的主流文明。生态文明将更多着眼于满足人类的非物质需求尤其是精神需求,精神享受型的服务业将成为生态文明阶段的主导产业;市场经济体制虽然在生态文明阶段仍然存在,但其重要性已经远远不如工业文明时期。文章进一步分析国家向生态文明转型的博弈选择,认为要求所有国家同步实现向生态文明转型,对发展中国家是不公平的,但非同步转型也是一个冒险的策略,可能带来满盘皆输的结果。这种悖论造成了气候谈判的僵局。只有将减排视为对自然资本的长期投资,零和博弈才能转变为正和博弈。最后,基于中国国情,本文提出,中国转变发展方式的根本目标是由工业文明转向生态文明,应把转变发展方式放到转换文明范式的历史坐标下去推进。 展开更多
关键词 发展方式 工业文明 生态文明 主导产业 零和博弈
下载PDF
基于零和博弈的电力系统鲁棒优化调度研究 被引量:7
14
作者 董燕 杨俊林 +3 位作者 朱永胜 李秋燕 陈斌 聂彩静 《电力系统保护与控制》 EI CSCD 北大核心 2022年第5期55-64,共10页
随着多种分布式能源的规模化接入,其固有的随机特性及多方利益冲突问题给电力系统调度决策带来了新的挑战。为此,深度融合鲁棒优化与零和博弈机制,分别将大自然与电力调度人员作为博弈参与方,提出了一种考虑调度人员与大自然博弈的电力... 随着多种分布式能源的规模化接入,其固有的随机特性及多方利益冲突问题给电力系统调度决策带来了新的挑战。为此,深度融合鲁棒优化与零和博弈机制,分别将大自然与电力调度人员作为博弈参与方,提出了一种考虑调度人员与大自然博弈的电力系统鲁棒调度协同规划方法。其中,针对电动汽车移动与储能属性耦合的不确定性,将其交通行为进行集群化处理。进而基于电动汽车、风电、火电机组的出力及运行费用特性,建立含多种能源形式的min-max调度博弈模型,并采用两阶段松弛算法进行求解。实验结果验证了所提调度模型及相关调度策略在不依赖准确风电预测的同时,能实现风、车等能源的协同增效经济运行,为解决不确定分布式能源接入电力系统的优化决策问题提供了新的研究思路。 展开更多
关键词 电力调度 零和博弈 鲁棒优化 min-max模型 分布式能源
下载PDF
Data-based Optimal Control for Discrete-time Zero-sum Games of 2-D Systems Using Adaptive Critic Designs 被引量:8
15
作者 WEI Qing-Lai ZHANG Hua-Guang CUI Li-Li 《自动化学报》 EI CSCD 北大核心 2009年第6期682-692,共11页
关键词 自适应系统 最优控制 离散时间 自动化系统
下载PDF
基于博弈论的无人机战场攻防策略求解模型 被引量:7
16
作者 李迎春 程建博 于尧 《兵器装备工程学报》 CAS 2017年第6期70-72,103,共4页
提出基于博弈论的无人机战场攻防策略求解模型;利用零和博弈求解方法,找出当目标平均定位时间变化时的不同纳什均衡点;案例结果表明:该纳什均衡点即为攻守双方一定条件下的最佳策略集合;该模型可为实际战场决策提供参考。
关键词 无人机 博弈论 最优决策 零和博弈 纳什均衡
下载PDF
基于双人零和博弈的孤岛微电网有界L2增益负荷频率控制 被引量:1
17
作者 李寅生 王冰 +1 位作者 陈玉全 黄浩乾 《电力系统自动化》 EI CSCD 北大核心 2024年第3期93-102,共10页
针对含不确定建模误差和新能源接入的孤岛微电网,提出了一种结合有界L2增益基线控制和扰动补偿的综合负荷频率控制(LFC)方法。首先,推导了微电网的全驱模型,将建模误差和新能源的影响总结成一个综合扰动。为提高系统的鲁棒性,该综合扰... 针对含不确定建模误差和新能源接入的孤岛微电网,提出了一种结合有界L2增益基线控制和扰动补偿的综合负荷频率控制(LFC)方法。首先,推导了微电网的全驱模型,将建模误差和新能源的影响总结成一个综合扰动。为提高系统的鲁棒性,该综合扰动被定义成控制信号的对手玩家。进一步,关于扰动抑制的有界L2增益问题被等价成求解综合扰动和控制信号的零和博弈Nash均衡,由此推导出有界L2增益基线控制器。为改善频率的二次控制,设计了基于五阶广义积分观测器的扰动补偿控制,并在此基础上引入了一种针对发电速率约束(GRC)的新型抗发电速率约束(anti-GRC)措施。最后,搭建了16 MW的新能源-柴油混合微电网仿真模型,并在多种工况下对所提出的综合LFC方法进行测试,验证了其有效性。 展开更多
关键词 孤岛微电网 负荷频率控制 零和博弈 有界L2增益 扰动补偿控制 发电速率约束
下载PDF
基于非零和信号博弈的主动防御模型 被引量:6
18
作者 黄万伟 袁博 +1 位作者 王苏南 张校辉 《郑州大学学报(工学版)》 CAS 北大核心 2022年第1期90-96,共7页
近几年以APT为代表的网络攻击危害日趋严重,现有的基于信号博弈理论的研究虽然可以在一定程度上模拟APT攻防过程,但忽略了攻防过程中双方收益不对等的现象以及多阶段的对抗过程,导致模型和方法缺乏普适性。为此提出一个基于非零和信号... 近几年以APT为代表的网络攻击危害日趋严重,现有的基于信号博弈理论的研究虽然可以在一定程度上模拟APT攻防过程,但忽略了攻防过程中双方收益不对等的现象以及多阶段的对抗过程,导致模型和方法缺乏普适性。为此提出一个基于非零和信号博弈的主动防御模型,依据信号博弈理论,结合分析网络攻防多阶段的对抗过程建立攻防博弈树;收益量化过程中基于收益不对等的情况,采用非零和方法与贴现因子对攻防过程中多阶段的收益情况进行建模;提出了符合网络攻防特征的量化方法,并通过分析模型中存在的纳什均衡和精炼贝叶斯均衡,得出当前最优防御策略算法。通过仿真实验对该模型和方法进行验证,结果证实了所提模型和方法的可行性和有效性。 展开更多
关键词 非零和 信号博弈 贴现因子 最优防御策略
下载PDF
面向6G的生成对抗网络研究进展综述 被引量:1
19
作者 孟婵媛 熊轲 +2 位作者 高博 张煜 樊平毅 《物联网学报》 2024年第1期1-16,共16页
人工智能(AI,artificial intelligence)与通信技术的深度融合是6G网络的典型特征。一方面,AI为6G网络发展注入了新动力,能够有效利用网络运行产生的历史数据,使网络具备自维护、自优化的功能,加速了网络智能化进程。另一方面,6G网络丰... 人工智能(AI,artificial intelligence)与通信技术的深度融合是6G网络的典型特征。一方面,AI为6G网络发展注入了新动力,能够有效利用网络运行产生的历史数据,使网络具备自维护、自优化的功能,加速了网络智能化进程。另一方面,6G网络丰富的场景和大规模的物联设备入网应用为AI提供了广阔的应用渠道和海量的训练数据,使AI能够更好地训练和部署,充分发挥AI的内在优势,为用户提供更加优质的智能服务。尽管如此,在一些实际应用中,受复杂环境的影响,存在数据样本收集困难、收集成本高和样本普适性不足等问题,难以充分发挥AI的性能优势。为此,学术界和工业界将生成对抗网络(GAN,generative adversarial network)引入无线网络的设计中,利用GAN强大的特征学习和特征表达能力产生大量模拟实际的生成样本,实现无线数据库的扩充,从而有效提升面向无线网络的AI模型的泛化能力。由于其优秀的性能表现,以GAN为代表的生成式模型在无线网络领域受到越来越多的关注,并迅速发展成为6G网络新的研究热点。首先,综述了GAN的原理及其改进衍生模型,对各种衍生模型的框架及优缺点进行了分析归纳;然后,综述了这些模型在无线网络领域的研究及应用现状;最后,面向6G网络的需求展望了GAN在6G网络中的研究趋势,为未来的研究提供了一些有价值的探索。 展开更多
关键词 生成对抗网络 无线网络 信道估计 物理层安全 无线感知 零和博弈
下载PDF
基于Nash-Q的网络信息体系对抗仿真技术 被引量:7
20
作者 闫雪飞 李新明 +1 位作者 刘东 王寿彪 《系统工程与电子技术》 EI CSCD 北大核心 2018年第1期217-224,共8页
武器装备体系作战仿真研究隶属于复杂系统研究范畴,首次对基于Nash-Q的网络信息体系(network information system-of-systems,NISoS)对抗认知决策行为进行探索研究。Nash-Q算法与联合Q-learning算法具有类似的形式,其区别在于联合策略... 武器装备体系作战仿真研究隶属于复杂系统研究范畴,首次对基于Nash-Q的网络信息体系(network information system-of-systems,NISoS)对抗认知决策行为进行探索研究。Nash-Q算法与联合Q-learning算法具有类似的形式,其区别在于联合策略的计算,对于零和博弈体系作战模型,由于Nash-Q不需要其他Agent的历史信息即可通过Nash均衡的求解而获得混合策略,因此更易于实现也更加高效。建立了战役层次零和作战动态博弈模型,在不需要其他Agent的完全信息时,给出了Nash均衡的求解方法。此外,采用高斯径向基神经网络对Q表进行离散,使得算法具有更好的离散效果以及泛化能力。最后,通过NISoS作战仿真实验验证了算法的有效性以及相比基于Q-learning算法以及Rule-based决策算法具有更高的收益,并且在离线决策中表现优异。 展开更多
关键词 网络信息体系 零和博弈 Q-LEARNING NASH均衡
下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部