-
题名人机对抗智能技术
被引量:27
- 1
-
-
作者
黄凯奇
兴军亮
张俊格
倪晚成
徐博
-
机构
中国科学院自动化研究所智能系统与工程研究中心
-
出处
《中国科学:信息科学》
CSCD
北大核心
2020年第4期540-550,共11页
-
文摘
人机对抗作为人工智能研究的前沿方向,已成为国内外智能领域研究的热点,并为探寻机器智能内在生长机制和关键技术验证提供有效试验环境和途径.本文针对巨复杂、高动态、不确定的强对抗环境对智能认知和决策带来的巨大挑战,分析了人机对抗智能技术研究现状,梳理了其内涵和机理,提出了以博弈学习为核心的人机对抗智能理论研究框架;并在此基础上论述了其关键模型:对抗空间表示与建模、态势评估与推理、策略生成与优化、行动协同与控制;为复杂认知与决策问题的可建模、可计算、可解释求解奠定了基础.最后,本文总结了当前应用现状并对未来发展方向进行了展望.
-
关键词
人工智能
人机对抗
机器学习
智能博弈
认知决策
-
Keywords
artificial intelligence
human-computer gaming
machine learning
autonomous intelligent gaming
command and decision making
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向遥感图像目标感知的群目标检测框架
- 2
-
-
作者
张鸿伟
金磊
邹学超
方宇强
尹璐
赵健
兴军亮
-
机构
北京邮电大学电子工程学院
青海大学计算机技术与应用学院
航天工程大学研究生院
北京遥感信息研究所
北方电子设备研究所
清华大学计算机学院
-
出处
《遥感学报》
EI
CSCD
北大核心
2024年第7期1802-1811,共10页
-
基金
卫星信息智能处理与应用技术实验室基金(编号:2022-ZZKY-JJ-06-01)。
-
文摘
光学遥感是航天侦察和地质勘测中的常用技术,拍摄得到的可见光图像能够提供非常丰富的信息,在目标监视、态势预判等方面都具有重要应用。近年来以轮船、飞机等物体检测为代表的光学遥感图像目标感知取得了显著进展,但对于目标尺度变化大,目标数量多而小的遥感图像目标感知场景中还存在巨大技术挑战,也就是在当前的光学遥感图像目标感知场景存在很多目标小并且多目标集中的情况,容易导致误检和漏检。为了解决现有遥感图像目标检测算法不同目标独立检测的内在低效性,本文提出了一种新的检测框架,即群目标检测,以期通过检测群目标的状态信息来缓解单一目标感知信息不足、可靠性差等问题,进而得到更为可靠的多目标检测结果。本文首先对群目标的概念进行定义,然后基于该定义提出了一种群目标自动化标注方案,在公开数据集上对原有标签进行分析,无需任何手动标注,就能得到含有群目标标注的注释信息。基于群目标自动化标注,本文提出了群目标检测算法,即在检测群目标的同时,利用群目标的空间约束提升单一目标检测结果。实验证明,与近年来的遥感图像检测算法相比,本文提出的群目标检测在最热门的大型遥感目标检测数据集DOTA上验证时,性能最佳。
-
关键词
遥感图像
目标检测
边界框
群目标
自动化标注
DOTA
目标感知
多目标
-
Keywords
remote sensing image
image object
group object detection
automatic annotation
DOTA
object sensing
multi object
-
分类号
P2
[天文地球—测绘科学与技术]
-
-
题名一种针对德州扑克AI的对手建模与策略集成框架
被引量:6
- 3
-
-
作者
张蒙
李凯
吴哲
臧一凡
徐航
兴军亮
-
机构
中国科学院自动化研究所
中国科学院大学
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第4期1004-1017,共14页
-
基金
国家自然科学基金(62076238,61902402)
国家重点研发计划(2020AAA0103401)
+1 种基金
中国科学院战略性先导研究项目(XDA27000000)
CCF-腾讯犀牛鸟基金(RAGR20200104)资助。
-
文摘
以德州扑克游戏为代表的大规模不完美信息博弈是现实世界中常见的一种博弈类型.现有以求解纳什均衡策略为目标的主流德州扑克求解算法存在依赖博弈树模型、算力消耗大、策略过于保守等问题,导致智能体在面对不同对手时无法最大化自身收益.为解决上述问题,提出一种轻量高效且能快速适应对手策略变化进而剥削对手的不完美信息博弈求解框架.本框架分为智能体离线训练和在线博弈两个阶段.第1阶段基于演化学习思想训练智能体,得到能够剥削不同博弈风格对手的策略神经网络.在第2博弈阶段中,智能体在线建模并适应未知风格对手,利用种群策略集成的方法最大化剥削对手.在两人无限注德州扑克环境中的实验结果表明,本框架在面对动态对手策略时,相比已有方法能够大幅提升博弈性能.
-
关键词
不完美信息博弈
德州扑克
演化学习
在线对手建模
种群策略集成
-
Keywords
Imperfect information game
Texas Hold'em
evolutionary learning
online opponent modeling
population strategy integration
-
分类号
O225
[理学—运筹学与控制论]
TP18
[理学—数学]
-
-
题名一种用于两人零和博弈对手适应的元策略演化学习算法
被引量:1
- 4
-
-
作者
吴哲
李凯
徐航
兴军亮
-
机构
中国科学院自动化研究所智能系统与工程研究中心
中国科学院大学人工智能学院
清华大学计算机科学与技术系
-
出处
《自动化学报》
EI
CAS
CSCD
北大核心
2022年第10期2462-2473,共12页
-
基金
国家重点研发计划(2020AAA0103401)
国家自然科学基金(62076238,61902402)
+1 种基金
中国科学院战略性先导研究项目(XDA27000000)
CCF-腾讯犀牛鸟基金(RAGR20200104)资助。
-
文摘
围绕两人零和博弈所开展的一系列研究,近年来在围棋、德州扑克等问题中取得了里程碑式的突破.现有的两人零和博弈求解方案大多在理性对手的假设下围绕纳什均衡解开展,是一种力求不败的保守型策略,但在实际博弈中由于对手非理性等原因并不能保证收益最大化.对手建模为最大化博弈收益提供了一种新途径,但仍存在建模困难等问题.结合元学习的思想提出了一种能够快速适应对手策略的元策略演化学习求解框架.在训练阶段,首先通过种群演化的方法不断生成风格多样化的博弈对手作为训练数据,然后利用元策略更新方法来调整元模型的网络权重,使其获得快速适应的能力.在Leduc扑克、两人有限注德州扑克(Heads-up limit Texas Hold’em, LHE)和RoboSumo上的大量实验结果表明,该算法能够有效克服现有方法的弊端,实现针对未知风格对手的快速适应,从而为两人零和博弈收益最大化求解提供了一种新思路.
-
关键词
两人零和博弈
纳什均衡
对手建模
元学习
种群演化
-
Keywords
Two-player zero-sum games
Nash equilibrium
opponent modeling
meta learning
population evolution
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
O225
[自动化与计算机技术—控制科学与工程]
-