期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于优势演员-评论家算法的强化自动摘要模型
被引量:
5
1
作者
杜嘻嘻
程华
房一泉
《计算机应用》
CSCD
北大核心
2021年第3期699-705,共7页
针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)...
针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)和循环神经网络(RNN)的混合神经网络的抽取器(extractor)来提取原文关键句;然后,用基于拷贝机制和注意力机制的重写器(rewriter)来精炼关键句;最后,使用强化学习的优势演员-评论家(A2C)算法训练整个网络,把重写摘要和参考摘要的语义相似性(BERTScore值)作为奖励(reward)来指导抽取过程,从而提高抽取器提取句子的质量。在CNN/Daily Mail数据集上的实验结果表明,与基于强化学习的抽取式摘要(Refresh)模型、基于循环神经网络的抽取式摘要序列模型(SummaRuNNer)和分布语义奖励(DSR)模型等模型相比,A2C-RLAS的最终摘要内容更加准确、语言更加流畅,冗余的内容有效减少,且A2C-RLAS的ROUGE和BERTScore指标均有提升。相较于Refresh模型和SummaRuNNer模型,A2C-RLAS模型的ROUGE-L值分别提高了6.3%和10.2%;相较于DSR模型,A2C-RLAS模型的F1值提高了30.5%。
展开更多
关键词
自动摘要模型
抽取式摘要模型
生成式摘要模型
编码器-解码器
强化学习
优势演员-评论家算法
下载PDF
职称材料
深度强化学习驱动下的智能电网通信网业务路由分配方法研究
2
作者
胡楠
张维
《通信电源技术》
2024年第10期43-45,共3页
在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析...
在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析,以提高通信资源利用率,提升业务路由方法的稳定性和可靠性。
展开更多
关键词
智能电网
通信网
深度Q网络(DQN)算法
异步优势演员-评论家(A3
c
)算法
深度学习
下载PDF
职称材料
基于自适应多目标强化学习的服务集成方法
3
作者
郭潇
李春山
+1 位作者
张宇跃
初佃辉
《计算机应用》
CSCD
北大核心
2022年第11期3500-3505,共6页
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性...
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性。针对上述问题,提出一种基于自适应多目标强化学习的服务集成方法,该方法在异步优势演员评论家(A3C)算法的框架下引入多目标优化策略,从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整,改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证,实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快;相较于权重固定的强化学习(RL),各目标的求解质量更均衡。
展开更多
关键词
服务集成
强化学习
异步优势演员评论家算法
多目标优化
自适应权重
下载PDF
职称材料
利用A2C-ac的城轨车车通信资源分配算法
4
作者
王瑞峰
张明
+1 位作者
黄子恒
何涛
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第4期1306-1313,共8页
在城市轨道交通列车控制系统中,车车(T2T)通信作为新一代列车通信模式,利用列车间直接通信来降低通信时延,提高列车运行效率。在T2T通信与车地(T2G)通信并存场景下,针对复用T2G链路产生的干扰问题,在保证用户通信质量的前提下,该文提出...
在城市轨道交通列车控制系统中,车车(T2T)通信作为新一代列车通信模式,利用列车间直接通信来降低通信时延,提高列车运行效率。在T2T通信与车地(T2G)通信并存场景下,针对复用T2G链路产生的干扰问题,在保证用户通信质量的前提下,该文提出一种基于多智能体深度强化学习(MADRL)的改进优势演员-评论家(A2C-ac)资源分配算法。首先以系统吞吐量为优化目标,以T2T通信发送端为智能体,策略网络采用分层输出结构指导智能体选择需复用的频谱资源和功率水平,然后智能体做出相应动作并与T2T通信环境交互,得到该时隙下T2G用户和T2T用户吞吐量,价值网络对两者分别评价,利用权重因子β为每个智能体定制化加权时序差分(TD)误差,以此来灵活优化神经网络参数。最后,智能体根据训练好的模型联合选出最佳的频谱资源和功率水平。仿真结果表明,该算法相较于A2C算法和深度Q网络(DQN)算法,在收敛速度、T2T成功接入率、吞吐量等方面均有明显提升。
展开更多
关键词
城市轨道交通
资源分配
T
2
T通信
多智能体深度强化学习
A
2
c
-a
c
算法
下载PDF
职称材料
题名
基于优势演员-评论家算法的强化自动摘要模型
被引量:
5
1
作者
杜嘻嘻
程华
房一泉
机构
华东理工大学信息科学与工程学院
出处
《计算机应用》
CSCD
北大核心
2021年第3期699-705,共7页
基金
赛尔网络下一代互联网技术创新项目(NGII20170520)。
文摘
针对长文本自动摘要任务中抽取式模型摘要较为冗余,而生成式摘要模型时常有关键信息丢失、摘要不准确和生成内容重复等问题,提出一种面向长文本的基于优势演员-评论家算法的强化自动摘要模型(A2C-RLAS)。首先,用基于卷积神经网络(CNN)和循环神经网络(RNN)的混合神经网络的抽取器(extractor)来提取原文关键句;然后,用基于拷贝机制和注意力机制的重写器(rewriter)来精炼关键句;最后,使用强化学习的优势演员-评论家(A2C)算法训练整个网络,把重写摘要和参考摘要的语义相似性(BERTScore值)作为奖励(reward)来指导抽取过程,从而提高抽取器提取句子的质量。在CNN/Daily Mail数据集上的实验结果表明,与基于强化学习的抽取式摘要(Refresh)模型、基于循环神经网络的抽取式摘要序列模型(SummaRuNNer)和分布语义奖励(DSR)模型等模型相比,A2C-RLAS的最终摘要内容更加准确、语言更加流畅,冗余的内容有效减少,且A2C-RLAS的ROUGE和BERTScore指标均有提升。相较于Refresh模型和SummaRuNNer模型,A2C-RLAS模型的ROUGE-L值分别提高了6.3%和10.2%;相较于DSR模型,A2C-RLAS模型的F1值提高了30.5%。
关键词
自动摘要模型
抽取式摘要模型
生成式摘要模型
编码器-解码器
强化学习
优势演员-评论家算法
Keywords
automati
c
summary
model
extra
c
tive
summary
model
abstra
c
tive
summary
model
en
c
oder-de
c
oder
reinfor
c
ement
learning
advantage
actor
-
critic
(A2
c
)
algorithm
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
深度强化学习驱动下的智能电网通信网业务路由分配方法研究
2
作者
胡楠
张维
机构
国网汉中供电公司
出处
《通信电源技术》
2024年第10期43-45,共3页
文摘
在现代化背景下,为确保电力系统的稳定运行,相关人员需要结合实际情况逐步推进智能电网的构建。智能电网以各项数据的获取、处理、保护为核心,建立了集成通信系统。文章针对深度强化学习驱动下的智能电网通信网业务路由分配方法展开分析,以提高通信资源利用率,提升业务路由方法的稳定性和可靠性。
关键词
智能电网
通信网
深度Q网络(DQN)算法
异步优势演员-评论家(A3
c
)算法
深度学习
Keywords
smart
grid
c
ommuni
c
ation
network
Deep
Q
Network(DQN)
algorithm
Asyn
c
hronous
advantage
actor
-
critic
(A3
c
)
algorithm
deep
learning
分类号
TM73 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
基于自适应多目标强化学习的服务集成方法
3
作者
郭潇
李春山
张宇跃
初佃辉
机构
哈尔滨工业大学(威海)计算机科学与技术学院
出处
《计算机应用》
CSCD
北大核心
2022年第11期3500-3505,共6页
基金
国家重点研发计划项目(2018YFB1402500)
国家自然科学基金资助项目(61902090,61832004)
山东省自然科学基金资助项目(ZR2020KF019)。
文摘
当前服务互联网(IoS)中的服务资源呈现精细化、专业化的趋势,功能单一的服务无法满足用户复杂多变的需求,服务集成调度方法已经成为服务计算领域的热点。现有的服务集成调度方法大都只考虑用户需求的满足,未考虑IoS生态系统的可持续性。针对上述问题,提出一种基于自适应多目标强化学习的服务集成方法,该方法在异步优势演员评论家(A3C)算法的框架下引入多目标优化策略,从而在满足用户需求的同时保证IoS生态系统的健康发展。所提方法可以根据遗憾值对多目标值集成权重进行动态调整,改善多目标强化学习中子目标值不平衡的现象。在真实大规模服务环境下进行了服务集成验证,实验结果表明所提方法相对于传统机器学习方法在大规模服务环境下求解速度更快;相较于权重固定的强化学习(RL),各目标的求解质量更均衡。
关键词
服务集成
强化学习
异步优势演员评论家算法
多目标优化
自适应权重
Keywords
servi
c
e
integration
Reinfor
c
ement
Learning(RL)
Asyn
c
hronous
advantage
actor
‑
critic
(A3
c
)
algorithm
multi‑obje
c
tive
optimization
adaptive
weight
分类号
TP315 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
利用A2C-ac的城轨车车通信资源分配算法
4
作者
王瑞峰
张明
黄子恒
何涛
机构
兰州交通大学自动化与电气工程学院
兰州交通大学自动控制研究所
出处
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024年第4期1306-1313,共8页
基金
国家自然科学基金铁路基础研究联合基金(U2268206)。
文摘
在城市轨道交通列车控制系统中,车车(T2T)通信作为新一代列车通信模式,利用列车间直接通信来降低通信时延,提高列车运行效率。在T2T通信与车地(T2G)通信并存场景下,针对复用T2G链路产生的干扰问题,在保证用户通信质量的前提下,该文提出一种基于多智能体深度强化学习(MADRL)的改进优势演员-评论家(A2C-ac)资源分配算法。首先以系统吞吐量为优化目标,以T2T通信发送端为智能体,策略网络采用分层输出结构指导智能体选择需复用的频谱资源和功率水平,然后智能体做出相应动作并与T2T通信环境交互,得到该时隙下T2G用户和T2T用户吞吐量,价值网络对两者分别评价,利用权重因子β为每个智能体定制化加权时序差分(TD)误差,以此来灵活优化神经网络参数。最后,智能体根据训练好的模型联合选出最佳的频谱资源和功率水平。仿真结果表明,该算法相较于A2C算法和深度Q网络(DQN)算法,在收敛速度、T2T成功接入率、吞吐量等方面均有明显提升。
关键词
城市轨道交通
资源分配
T
2
T通信
多智能体深度强化学习
A
2
c
-a
c
算法
Keywords
Urban
rail
transit
system
Resour
c
e
allo
c
ation
Train-to-Train(T
2
T)
Multi-Agent
Deep
Reinfor
c
ement
Learning(MADRL)
advantage
actor
-
critic
-a
c
(A2
c
-a
c
)
algorithm
分类号
TN929.5 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于优势演员-评论家算法的强化自动摘要模型
杜嘻嘻
程华
房一泉
《计算机应用》
CSCD
北大核心
2021
5
下载PDF
职称材料
2
深度强化学习驱动下的智能电网通信网业务路由分配方法研究
胡楠
张维
《通信电源技术》
2024
0
下载PDF
职称材料
3
基于自适应多目标强化学习的服务集成方法
郭潇
李春山
张宇跃
初佃辉
《计算机应用》
CSCD
北大核心
2022
0
下载PDF
职称材料
4
利用A2C-ac的城轨车车通信资源分配算法
王瑞峰
张明
黄子恒
何涛
《电子与信息学报》
EI
CAS
CSCD
北大核心
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部