期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于安全深度强化学习的电网有功频率协同优化控制
1
作者
周毅
周良才
+2 位作者
史迪
赵小英
闪鑫
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2024年第5期682-692,共11页
可再生能源占比不断增加给互联电网频率控制带来严峻考验.由于常规的自动发电控制(AGC)策略没有考虑电网潮流安全约束,所以传统方法根据专家知识和经验进行尝试性发电机功率调整,需耗费较多时间;基于最优电力潮流的互联电网AGC优化模型...
可再生能源占比不断增加给互联电网频率控制带来严峻考验.由于常规的自动发电控制(AGC)策略没有考虑电网潮流安全约束,所以传统方法根据专家知识和经验进行尝试性发电机功率调整,需耗费较多时间;基于最优电力潮流的互联电网AGC优化模型由于非凸性和大规模性,求解时间较长且存在收敛性问题.鉴于常规深度强化学习具有“离线训练、在线端对端形成策略”的优点,但在动作探索过程中无法保证系统安全性,提出一种基于安全深度强化学习的电网有功频率协同优化控制方法.首先,将电网频率控制建模为约束马尔可夫决策过程,对决策过程添加相关安全约束进行智能体设计;然后,基于华东电网实际系统算例对智能体进行训练和性能提升;最后,对比智能体决策与常规AGC策略效果.结果表明:所提方法在多种运行方式下可快速生成有功频率控制策略,且保证系统频率恢复过程中电网的安全性,可辅助调度员在线决策.
展开更多
关键词
有功频率协同控制
人工智能
深度强化学习
约束
马尔可夫
决策过程
智能体
下载PDF
职称材料
安全强化学习及其在机器人系统中的应用综述
被引量:
2
2
作者
张昌昕
张兴龙
+1 位作者
徐昕
陆阳
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023年第12期2090-2103,共14页
强化学习是一类通过与环境交互实现序贯优化决策的机器学习方法,已经在游戏、推荐系统及自然语言处理等任务中得到了应用.然而,强化学习算法应用于真实世界中的机器人系统时,如何保证安全性仍然面临挑战.近年来,针对机器人系统的安全强...
强化学习是一类通过与环境交互实现序贯优化决策的机器学习方法,已经在游戏、推荐系统及自然语言处理等任务中得到了应用.然而,强化学习算法应用于真实世界中的机器人系统时,如何保证安全性仍然面临挑战.近年来,针对机器人系统的安全强化学习方法研究已经成为热点方向,获得了机器人和强化学习领域的广泛关注.本文结合现有的工作,综述了安全强化学习理论和方法的重要成果和发展趋势,并重点关注了现有方法在机器人领域的适用性.本文首先给出了安全强化学习的一般问题描述.其次,从方法和性能的角度重点介绍了该领域的最新重要进展,包括约束策略优化、控制障碍函数、安全过滤器和对抗性博弈训练等方法,以及安全强化学习方法在地面移动机器人系统、无人飞行器和其他机器人系统中的应用情况.最后,对该领域的未来研究方向进行了展望和探讨.
展开更多
关键词
机器人
安全强化学习
约束
马尔可夫
决策过程
鲁棒性
下载PDF
职称材料
一种基于认知无线电技术的能效传输控制方案
3
作者
朱江
黄海洋
李少谦
《计算机工程与应用》
CSCD
北大核心
2008年第31期28-32,共5页
提出了一种基于认知无线电(CR)技术的跨层传输控制方案,该方案在满足与主用户冲突率约束及缓存器状态约束的前提下,最小化系统平均功率消耗。该方案被建模为约束马尔可夫决策过程(CMDP),并采用线性规划(LP)求解此CMDP。引入状态聚合来解...
提出了一种基于认知无线电(CR)技术的跨层传输控制方案,该方案在满足与主用户冲突率约束及缓存器状态约束的前提下,最小化系统平均功率消耗。该方案被建模为约束马尔可夫决策过程(CMDP),并采用线性规划(LP)求解此CMDP。引入状态聚合来解决CR网络中信道状态信息在某些情况下不可获取的问题。为降低LP的求解复杂度,通过状态聚合和行动集缩减解决CMDP的维灾问题。仿真结果表明,方案能够在满足约束的条件下最小化功率消耗,而且低复杂度的求解方法对该方案性能的影响很小。
展开更多
关键词
认知无线电
能效
跨层设计
传输控制
约束
马尔可夫
决策过程
下载PDF
职称材料
题名
基于安全深度强化学习的电网有功频率协同优化控制
1
作者
周毅
周良才
史迪
赵小英
闪鑫
机构
国家电网有限公司华东分部
AINERGY
国电南瑞科技股份有限公司
出处
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2024年第5期682-692,共11页
基金
国家电网有限公司华东分部科技项目(SGHD0000DKJS2100235)。
文摘
可再生能源占比不断增加给互联电网频率控制带来严峻考验.由于常规的自动发电控制(AGC)策略没有考虑电网潮流安全约束,所以传统方法根据专家知识和经验进行尝试性发电机功率调整,需耗费较多时间;基于最优电力潮流的互联电网AGC优化模型由于非凸性和大规模性,求解时间较长且存在收敛性问题.鉴于常规深度强化学习具有“离线训练、在线端对端形成策略”的优点,但在动作探索过程中无法保证系统安全性,提出一种基于安全深度强化学习的电网有功频率协同优化控制方法.首先,将电网频率控制建模为约束马尔可夫决策过程,对决策过程添加相关安全约束进行智能体设计;然后,基于华东电网实际系统算例对智能体进行训练和性能提升;最后,对比智能体决策与常规AGC策略效果.结果表明:所提方法在多种运行方式下可快速生成有功频率控制策略,且保证系统频率恢复过程中电网的安全性,可辅助调度员在线决策.
关键词
有功频率协同控制
人工智能
深度强化学习
约束
马尔可夫
决策过程
智能体
Keywords
coordinated power and frequency control
artificial intelligence(AI)
safe deep reinforcement learning
constrained Markov decision process
agent
分类号
TM711 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
安全强化学习及其在机器人系统中的应用综述
被引量:
2
2
作者
张昌昕
张兴龙
徐昕
陆阳
机构
国防科技大学智能科学学院
出处
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023年第12期2090-2103,共14页
基金
国家自然科学基金项目(62003361,U21A20518)资助。
文摘
强化学习是一类通过与环境交互实现序贯优化决策的机器学习方法,已经在游戏、推荐系统及自然语言处理等任务中得到了应用.然而,强化学习算法应用于真实世界中的机器人系统时,如何保证安全性仍然面临挑战.近年来,针对机器人系统的安全强化学习方法研究已经成为热点方向,获得了机器人和强化学习领域的广泛关注.本文结合现有的工作,综述了安全强化学习理论和方法的重要成果和发展趋势,并重点关注了现有方法在机器人领域的适用性.本文首先给出了安全强化学习的一般问题描述.其次,从方法和性能的角度重点介绍了该领域的最新重要进展,包括约束策略优化、控制障碍函数、安全过滤器和对抗性博弈训练等方法,以及安全强化学习方法在地面移动机器人系统、无人飞行器和其他机器人系统中的应用情况.最后,对该领域的未来研究方向进行了展望和探讨.
关键词
机器人
安全强化学习
约束
马尔可夫
决策过程
鲁棒性
Keywords
robotics
safe reinforcement learning
constrained Markov decision process
robustness
分类号
TP242 [自动化与计算机技术—检测技术与自动化装置]
TP18 [自动化与计算机技术—控制科学与工程]
下载PDF
职称材料
题名
一种基于认知无线电技术的能效传输控制方案
3
作者
朱江
黄海洋
李少谦
机构
电子科技大学通信抗干扰国家级重点实验室
出处
《计算机工程与应用》
CSCD
北大核心
2008年第31期28-32,共5页
基金
国家自然科学基金No.60496313
国家高技术研究发展计划(863)No.2005AA123910
No.2007AA01Z209~~
文摘
提出了一种基于认知无线电(CR)技术的跨层传输控制方案,该方案在满足与主用户冲突率约束及缓存器状态约束的前提下,最小化系统平均功率消耗。该方案被建模为约束马尔可夫决策过程(CMDP),并采用线性规划(LP)求解此CMDP。引入状态聚合来解决CR网络中信道状态信息在某些情况下不可获取的问题。为降低LP的求解复杂度,通过状态聚合和行动集缩减解决CMDP的维灾问题。仿真结果表明,方案能够在满足约束的条件下最小化功率消耗,而且低复杂度的求解方法对该方案性能的影响很小。
关键词
认知无线电
能效
跨层设计
传输控制
约束
马尔可夫
决策过程
Keywords
Cognitive Radio(CR)
energy-efficient
cross-layer design
transmission control
Constrained Markov Decision Process (CMDP)
分类号
TN915.65 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于安全深度强化学习的电网有功频率协同优化控制
周毅
周良才
史迪
赵小英
闪鑫
《上海交通大学学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
2
安全强化学习及其在机器人系统中的应用综述
张昌昕
张兴龙
徐昕
陆阳
《控制理论与应用》
EI
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
3
一种基于认知无线电技术的能效传输控制方案
朱江
黄海洋
李少谦
《计算机工程与应用》
CSCD
北大核心
2008
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部