-
题名基于点格棋的UCT算法研究与分析
被引量:3
- 1
-
-
作者
张宜放
孟坤
-
机构
北京信息科技大学计算机学院
北京信息科技大学感知与计算智能联合实验室
-
出处
《智能计算机与应用》
2020年第4期27-31,共5页
-
基金
北京信息科技大学2019年促进高校内涵发展-大学生科研训练项目(5101923400)
科技计划一般项目(KM201911232002)资助
-
文摘
以博弈树搜索为核心的α-β剪枝算法,受限于估值函数对设计者棋力水平的依赖,难以实现更进一步的提升。论文提出的UCT(Upper Confidence Bound Apply to Tree)算法结合了UCB公式和蒙特卡洛树搜索算法,弱化了算法本身对估值函数的依赖性,最大化利用计算机的算力优势,提升算法的整体效率,并利用其并行化优势优化算法,基于点格棋进行了算法的实现。
-
关键词
UCT算法
估值函数
点格棋
-
Keywords
UCT algorithm
evaluation function
dots and boxes
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名面向搜索时间受限的完全信息博弈UCT算法改进研究
被引量:1
- 2
-
-
作者
张宜放
孟坤
蒋志文
高世静
张蕴瀚
-
机构
北京信息科技大学计算机学院
北京信息科技大学感知与计算智能联合实验室
-
出处
《电脑知识与技术》
2021年第4期195-200,共6页
-
基金
北京信息科技大学2020年促进高校内涵发展——大学生科研训练项目(5102010805)
科技计划一般项目(KM201911232002)资助。
-
文摘
针对完全信息博弈中搜索时间受限的算法设计问题,在考虑博弈模型不同特点及对结局影响程度的基础上,提出了分阶段的算法模型,给出了三阶段博弈算法设计方法。通过改造影响搜索策略的目标函数,使得在时间受限的前提下,能够方便控制每一阶段均更有效地搜索出较好策略,并给出相应的算法实现与分析。以点格棋为对象,给出了通过改造UCT算法中UCB公式的实现思路,设计了方向引导控制策略、多种算法混合、二进制压缩和并行化处理等技巧,有效提升了算法的效率和稳定性,并通过试验验证了所给出方法的有效性和效率。
-
关键词
UCT算法优化
三阶段模型
点格棋
-
Keywords
Optimization of UCT algorithm
Three-stage model
Dots and boxes
-
分类号
TP301.6
[自动化与计算机技术—计算机系统结构]
-
-
题名面向中小学生的智能优化算法机理探索课程
- 3
-
-
作者
王胜灵
陈安琳
沈瑾
张宜放
魏锐
傅骞
-
机构
北京师范大学
-
出处
《中国科技教育》
2021年第11期64-65,共2页
-
文摘
对知识的前向解释力直接影响后向生发的创造力,因此人工智能的算法思想对于青少年学习人工智能更为重要。我们的课程旨在引导中小学生探索人工智能算法的内生机理,其主要面临以下两大挑战:挑战一来自于学习者,低龄学生低认知水平、弱分析问题能力引发了与复杂算法机理理解的矛盾;挑战二来自于学习对象,算法编程实践的复杂性引发了与低龄学生零代码基础的矛盾与复杂算法编程实践的矛盾。
-
关键词
中小学生
人工智能
编程实践
智能优化算法
分析问题能力
复杂算法
算法思想
学习对象
-
分类号
G63
[文化科学—教育学]
-
-
题名基于抽样向量扰动的对抗样本生成方法
- 4
-
-
作者
蒋志文
郑怡亭
邓娇
张宜放
-
机构
北京信息科技大学
-
出处
《电脑知识与技术》
2021年第5期191-193,共3页
-
基金
北京信息科技大学2020年促进高校内涵发展-大学生科研训练项目(5102010815)
科技计划一般项目(KM201911232002)资助。
-
文摘
深度学习算法在很多领域取得了卓越的成就,但同时也容易受到对抗样本的攻击。使用对抗样本训练模型是抵御模型被攻击的有效手段,但这需要大量对抗样本的支持。为了提升对抗样本的生成效率,本文提出了一种基于抽样向量扰动的对抗样本生成方法(SPVT)。实验结果表明,该方法可以在短时间内生成大量有效对抗样本,并且能够自适应计算出FGSM算法的扰动幅度,并且和人为设定参数的FGSM算法相比对抗成功率提升了0.77%;生成相同数量的对抗样本,SPVT方法与DeepFool算法相比能够节约1/6的时间,解决了对抗样本生成效率不高的问题。
-
关键词
对抗样本
深度学习
白盒攻击
-
Keywords
adversarial example
deep learning
robustness of model
-
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
-