检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

高级检索
期刊导航

共找到32篇文章

< 1 2 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

	题名	作者	出处	发文年	被引量	操作
1	深度强化学习理论及其应用综述	万里鹏兰旭光张翰博郑南宁	《模式识别与人工智能》 EI CSCD 北大核心	2019	67	下载PDF 职称材料
2	深度强化学习中稀疏奖励问题研究综述	杨惟轶白辰甲蔡超赵英男刘鹏	《计算机科学》 CSCD 北大核心	2020	36	下载PDF 职称材料
3	基于近端策略优化的作战实体博弈对抗算法	张振黄炎焱张永亮陈天德	《南京理工大学学报》 EI CAS CSCD 北大核心	2021	18	下载PDF 职称材料
4	基于改进深度强化学习的移动机器人路径规划	王军杨云霄李莉	《电子测量技术》北大核心	2021	18	下载PDF 职称材料
5	强化学习稀疏奖励算法研究——理论与实验	杨瑞严江鹏李秀	《智能系统学报》 CSCD 北大核心	2020	17	下载PDF 职称材料
6	基于深度强化学习的智能空战决策与仿真	周攀黄江涛章胜刘刚舒博文唐骥罡	《航空学报》 EI CAS CSCD 北大核心	2023	12	原文传递
7	深度确定性策略梯度算法用于无人飞行器控制	黄旭柳嘉润贾晨辉王昭磊张隽	《航空学报》 EI CAS CSCD 北大核心	2021	9	原文传递
8	稀疏奖励下基于强化学习的无人集群自主决策与智能协同	李超王瑞星黄建忠江飞龙魏雪梅孙延鑫	《兵工学报》 EI CAS CSCD 北大核心	2023	4	下载PDF 职称材料
9	稀疏奖励场景下基于状态空间探索的多智能体强化学习算法	方宝富余婷婷王浩王在俊	《模式识别与人工智能》 EI CSCD 北大核心	2024	0	下载PDF 职称材料
10	带有惩罚措施的自竞争事后经验重播算法	王子豪钱雪忠宋威	《计算机科学与探索》 CSCD 北大核心	2024	0	下载PDF 职称材料
11	基于改进好奇心的深度强化学习方法	乔和李增辉刘春胡嗣栋	《计算机应用研究》 CSCD 北大核心	2024	0	下载PDF 职称材料
12	基于自适应增强随机搜索的航天器追逃博弈策略研究	焦杰苟永杰吴文博泮斌峰	《西北工业大学学报》 EI CAS CSCD 北大核心	2024	0	下载PDF 职称材料
13	面向稀疏奖励的机器人操作技能学习	吴培良张彦毛秉毅陈雯柏高国伟	《控制理论与应用》 EI CAS CSCD 北大核心	2024	0	下载PDF 职称材料
14	结合先验知识的SAC神经纤维追踪算法及应用	林佳俐李永强赵硕冯远静	《小型微型计算机系统》 CSCD 北大核心	2024	0	下载PDF 职称材料
15	规则耦合下的多异构子网络MADDPG博弈对抗算法	张钰欣赵恩娇赵玉新	《智能系统学报》 CSCD 北大核心	2024	0	下载PDF 职称材料
16	稀疏奖励下基于课程学习的无人机空战仿真	祝靖宇张宏立匡敏驰史恒朱纪洪乔直周文卿	《系统仿真学报》 CAS CSCD 北大核心	2024	0	下载PDF 职称材料
17	稀疏奖励下基于情感的异构多智能体强化学习	方宝富马云婷王在俊王浩	《模式识别与人工智能》 EI CSCD 北大核心	2021	5	下载PDF 职称材料
18	基于元生成内在奖励的机器人操作技能学习方法	吴培良渠有源李瑶陈雯柏高国伟	《计量学报》 CSCD 北大核心	2023	1	下载PDF 职称材料
19	稀疏奖励下多航天器规避决策自学习仿真	赵毓郭继峰颜鹏白成超	《系统仿真学报》 CAS CSCD 北大核心	2021	5	下载PDF 职称材料
20	多智能体深度确定性策略梯度算法研究与改进	劳天成刘义范文慧	《新疆大学学报（自然科学版）（中英文）》 CAS	2023	1	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部