期刊文献+
共找到151篇文章
< 1 2 8 >
每页显示 20 50 100
基于seq2seq和Attention机制的居民用户非侵入式负荷分解 被引量:79
1
作者 王轲 钟海旺 +1 位作者 余南鹏 夏清 《中国电机工程学报》 EI CSCD 北大核心 2019年第1期75-83,共9页
非侵入式负荷分解(nonintrusiveloadmonitoring,NILM)是大数据分析在智能配电系统中为终端用户提供的重要应用之一,能够提升对负荷的认知水平,显著提升需求侧响应的潜力。长期以来,传统的NILM算法存在误判率高,功率分解值准确度低等问... 非侵入式负荷分解(nonintrusiveloadmonitoring,NILM)是大数据分析在智能配电系统中为终端用户提供的重要应用之一,能够提升对负荷的认知水平,显著提升需求侧响应的潜力。长期以来,传统的NILM算法存在误判率高,功率分解值准确度低等问题。为此,采用深度学习的框架,提出一种基于序列到序列和Attention机制的NILM模型。该模型首先将输入的有功功率时间序列通过词嵌入映射到高维向量,并利用基于长短时记忆模型的编码器进行信息提取;然后通过引入Attention机制的解码器,从提取的信息中选取与当前时刻相关度最高的信息,用于解码并最终得到负荷分解结果。提出的深度学习网络模型能够显著提升对信息的提取与利用能力。基于REFITPowerData数据集的测试结果验证了方法的有效性。 展开更多
关键词 非侵入式负荷分解 深度学习 序列序列 Attention机制
下载PDF
基于序列到序列和注意力机制的超短期风速预测 被引量:13
2
作者 刘擘龙 张宏立 +1 位作者 王聪 范文慧 《太阳能学报》 EI CAS CSCD 北大核心 2021年第9期286-294,共9页
风速具有较大的波动性,给风速预测带来较大难度。为解决以上问题,该文提出基于序列到序列和注意力机制的深度学习模型来进行超短期风速预测,首先采用1维卷积神经网络和门控循环单元对风速序列数据做编码处理,得到语义向量,然后使用注意... 风速具有较大的波动性,给风速预测带来较大难度。为解决以上问题,该文提出基于序列到序列和注意力机制的深度学习模型来进行超短期风速预测,首先采用1维卷积神经网络和门控循环单元对风速序列数据做编码处理,得到语义向量,然后使用注意力机制和门控循环单元对语义向量做动态解码,最后输出预测值,通过反向传播算法和梯度下降算法训练模型参数。在实际采集的风速数据上对模型的预测精度和性能做评估,实验结果表明:相较于其他模型,该模型提高了超短期风速预测精度和鲁棒性,具有较好的泛化能力,验证了所提模型的有效性。 展开更多
关键词 风速预测 深度学习 注意力机制 序列序列
下载PDF
基于Attention机制优化CNN-seq2seq模型的非侵入式负荷监测 被引量:9
3
作者 王琪凯 熊永康 +3 位作者 陈瑛 夏永洪 叶宗阳 余礼苏 《电力系统及其自动化学报》 CSCD 北大核心 2022年第12期27-34,42,共9页
非侵入式负荷监测是智能用电的一个关键环节。本文提出了一种基于注意力机制优化的卷积神经网络-序列到序列模型,用于提高非侵入式负荷监测的分解精度。首先,通过K-means++算法对各设备进行聚类操作,并将其转换成对应的独热码;其次,通... 非侵入式负荷监测是智能用电的一个关键环节。本文提出了一种基于注意力机制优化的卷积神经网络-序列到序列模型,用于提高非侵入式负荷监测的分解精度。首先,通过K-means++算法对各设备进行聚类操作,并将其转换成对应的独热码;其次,通过卷积神经网络结构提取总负荷数据的特征,并利用序列到序列结构捕捉负荷特征的时序依赖关系;最后,使用注意力机制优化卷积神经网络-序列到序列模型的整体结构。该模型通过将时间序列数据与设备状态编码之间形成一一映射关系,简化了模型结构。借助于能关注负荷重要特征的注意力机制,提升了模型的分解精度,并使用AMPds2开源数据集验证了模型的有效性。 展开更多
关键词 非侵入式负荷监测 卷积神经网络 序列序列 注意力机制
下载PDF
应用CNN-Seq2seq的PM2.5未来一小时浓度预测模型 被引量:10
4
作者 刘旭林 赵文芳 唐伟 《小型微型计算机系统》 CSCD 北大核心 2020年第5期1000-1006,共7页
为了提高PM2.5未来一小时浓度预测的准确率,提出了一种基于卷积神经网络和序列到序列(Sequence-to-Sequence,简称Seq2Seq)的深度学习预报测型.首先,综合分析PM2.5浓度随季节的变化趋势、PM2.5浓度在不同季节逐小时变化趋势、站点PM2.5... 为了提高PM2.5未来一小时浓度预测的准确率,提出了一种基于卷积神经网络和序列到序列(Sequence-to-Sequence,简称Seq2Seq)的深度学习预报测型.首先,综合分析PM2.5浓度随季节的变化趋势、PM2.5浓度在不同季节逐小时变化趋势、站点PM2.5浓度与最近邻站点相关性以及PM2.5浓度和气象要素相关性.其次,利用PM2.5浓度数据、气象站点观测数据和气象要素网格数据进行融合处理,生成用于训练和测试的时空序列数据,并使用卷积神经网络和Seq2Seq网络获取时空特征.最后,使用模型对PM2.5未来24小时逐时浓度进行预测,并与支持向量机和其他深度学习模型作对比.实验结果表明,相比其他机器学习方法和深度学习,卷积神经网络和长短时记忆相结合的预测方法能有效提高PM2.5浓度未来一小时预测精度,并具有较高的泛化能力. 展开更多
关键词 PM2.5浓度预测 机器学习 序列序列 深度学习 卷积神经网络
下载PDF
基于改进Transformer的生成式文本摘要模型 被引量:5
5
作者 赵伟 王文娟 +3 位作者 任彦凝 刘群 胥钟予 彭露 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2023年第1期185-192,共8页
基于循环神经网络(recurrent neural network,RNN)注意力机制的序列到序列模型在摘要信息提取服务中已经取得了较好的应用,但RNN不能较好地捕捉长时序信息,这使现有模型受限。为此,提出了基于改进Transformer的生成式文本摘要模型。该... 基于循环神经网络(recurrent neural network,RNN)注意力机制的序列到序列模型在摘要信息提取服务中已经取得了较好的应用,但RNN不能较好地捕捉长时序信息,这使现有模型受限。为此,提出了基于改进Transformer的生成式文本摘要模型。该模型利用Transformer提取全局语义,使用局部卷积提取器提取原文细粒度特征,并设计全局门控单元以防止信息冗余和弥补语义不足,筛选出利于摘要生成的文本关键信息。实验结果表明,所提模型在大规模中文短文本摘要数据集(large scale Chinese short text summarization,LCSTS)上的效果有明显的提升,在电力运维摘要数据集上,也有良好效果,具有可扩展性。 展开更多
关键词 生成式摘要 序列序列 改进Transformer 局部卷积
下载PDF
基于注意力机制的评论摘要生成 被引量:9
6
作者 苏放 王晓宇 张治 《北京邮电大学学报》 EI CAS CSCD 北大核心 2018年第3期7-13,共7页
为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模... 为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模型,使其对评论原文的句首具有更高的注意力权重,并可端到端地生成评论摘要的每一个词.实验结果表明,该模型在对英文同类别全文长度小于200的评论摘要提取上有更高的准确率. 展开更多
关键词 评论摘要 注意力机制 序列序列 循环神经网络
原文传递
基于循环神经网络的Modbus/TCP模糊测试算法 被引量:9
7
作者 黄河 陈君 邓浩江 《计算机工程》 CAS CSCD 北大核心 2019年第7期164-169,共6页
Modbus/TCP安全漏洞挖掘的相关协议包常采用随机方式生成,易产生过多无效包,降低漏洞挖掘效率。为此,基于循环神经网络(RNN)提出结构性模糊算法Fuzzy-RNN。从Modbus/TCP训练集中学习协议包各部分的概率分布,并考虑极端参数条件,实现针... Modbus/TCP安全漏洞挖掘的相关协议包常采用随机方式生成,易产生过多无效包,降低漏洞挖掘效率。为此,基于循环神经网络(RNN)提出结构性模糊算法Fuzzy-RNN。从Modbus/TCP训练集中学习协议包各部分的概率分布,并考虑极端参数条件,实现针对性的模糊生成。实验结果表明,与通用模糊测试器GPF相比,Fuzzy-RNN算法在Modbus Slave、xMasterSlave等多种仿真软件上能以更高概率实现合法协议包的模糊生成,测试时间缩减50 %以上,测试效率明显提高。 展开更多
关键词 工业控制协议 漏洞挖掘 模糊测试 网络安全 循环神经网络 序列序列
下载PDF
较短的长序列时间序列预测模型 被引量:1
8
作者 徐泽鑫 杨磊 李康顺 《计算机应用》 CSCD 北大核心 2024年第6期1824-1831,共8页
针对现有的研究大多将短序列时间序列预测和长序列时间序列预测分开研究而导致模型在较短的长序列时序预测时精度较低的问题,提出一种较短的长序列时间序列预测模型(SLTSFM)。首先,利用卷积神经网络(CNN)和PBUSM(Probsparse Based on Un... 针对现有的研究大多将短序列时间序列预测和长序列时间序列预测分开研究而导致模型在较短的长序列时序预测时精度较低的问题,提出一种较短的长序列时间序列预测模型(SLTSFM)。首先,利用卷积神经网络(CNN)和PBUSM(Probsparse Based on Uniform Selection Mechanism)自注意力机制搭建一个序列到序列(Seq2Seq)结构,用于提取长序列输入的特征;其次,设计“远轻近重”策略将多个短序列输入特征提取能力较强的长短时记忆(LSTM)模块提取的各时段数据特征进行重分配;最后,用重分配的特征增强提取的长序列输入特征,提高预测精度并实现时序预测。利用4个公开的时间序列数据集验证模型的有效性。实验结果表明,与综合表现次优的对比模型循环门单元(GRU)相比,SLTSFM的平均绝对误差(MAE)指标在4个数据集上的单变量时序预测分别减小了61.54%、13.48%、0.92%和19.58%,多变量时序预测分别减小了17.01%、18.13%、3.24%和6.73%。由此可见SLTSFM在提升较短的长序列时序预测精度方面的有效性。 展开更多
关键词 较短的长序列时间序列预测 序列序列 长短期记忆 自注意力机制 特征重分配
下载PDF
融合BERT和卷积门控的生成式文本摘要方法 被引量:4
9
作者 邓维斌 李云波 +2 位作者 张一明 王国胤 朱坤 《控制与决策》 EI CSCD 北大核心 2023年第1期152-160,共9页
结合注意力机制的循环神经网络(RNN)模型是目前主流的生成式文本摘要方法,采用基于深度学习的序列到序列框架,但存在并行能力不足或效率低的缺陷,并且在生成摘要的过程中存在准确率低和重复率高的问题.为解决上述问题,提出一种融合BERT... 结合注意力机制的循环神经网络(RNN)模型是目前主流的生成式文本摘要方法,采用基于深度学习的序列到序列框架,但存在并行能力不足或效率低的缺陷,并且在生成摘要的过程中存在准确率低和重复率高的问题.为解决上述问题,提出一种融合BERT预训练模型和卷积门控单元的生成式摘要方法.该方法基于改进Transformer模型,在编码器阶段充分利用BERT预先训练的大规模语料,代替RNN提取文本的上下文表征,结合卷积门控单元对编码器输出进行信息筛选,筛选出源文本的关键内容;在解码器阶段,设计3种不同的Transformer,旨在探讨BERT预训练模型和卷积门控单元更为有效的融合方式,以此提升文本摘要生成性能.实验采用ROUGE值作为评价指标,在LCSTS中文数据集和CNN/Daily Mail英文数据集上与目前主流的生成式摘要方法进行对比的实验,结果表明所提出方法能够提高摘要的准确性和可读性. 展开更多
关键词 生成式文本摘要 序列序列 预训练模型 卷积门控单元 信息筛选 Transformer模型
原文传递
基于序列到序列神经网络模型的古诗自动生成方法 被引量:8
10
作者 黄文明 卫万成 邓珍荣 《计算机应用研究》 CSCD 北大核心 2019年第12期3539-3543,共5页
计算机写诗是实现计算机写作的第一步。目前计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题。为改善这些问题,效仿古人写诗的过程,提出了一种两个阶段生成古诗的方法。第一阶段获取写诗大纲,采用TextRank算法对用户输... 计算机写诗是实现计算机写作的第一步。目前计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题。为改善这些问题,效仿古人写诗的过程,提出了一种两个阶段生成古诗的方法。第一阶段获取写诗大纲,采用TextRank算法对用户输入文本提取关键词,并提出一种基于注意力机制的序列到序列神经网络模型用于关键词扩展;第二阶段根据写诗大纲生成每一行诗句,并提出一种包含双编码器和注意力机制的序列到序列神经网络模型用于古诗生成。最后通过对实验结果的评估验证了提出方法的有效性。与基准方法相比,该方法生成的古诗的主题意义更加明确,诗所表现的内容和写作意图更加一致。 展开更多
关键词 关键词扩展 注意力机制 序列序列 神经网络模型 古诗生成
下载PDF
基于语义相关性分析的多模态摘要模型 被引量:1
11
作者 林于翔 吴运兵 +1 位作者 阴爱英 廖祥文 《计算机应用》 CSCD 北大核心 2024年第1期65-72,共8页
多模态生成式摘要往往采用序列到序列(Seq2Seq)框架,目标函数在字符级别优化模型,根据局部最优解生成单词,忽略了摘要样本全局语义信息,使得摘要与多模态信息产生语义偏差,容易造成事实性错误。针对上述问题,提出一种基于语义相关性分... 多模态生成式摘要往往采用序列到序列(Seq2Seq)框架,目标函数在字符级别优化模型,根据局部最优解生成单词,忽略了摘要样本全局语义信息,使得摘要与多模态信息产生语义偏差,容易造成事实性错误。针对上述问题,提出一种基于语义相关性分析的多模态摘要模型。首先,在Seq2Seq框架基础上对多模态摘要进行训练,生成语义多样性的候选摘要;其次,构建基于语义相关性分析的摘要评估器,从全局的角度学习候选摘要之间的语义差异性和真实评价指标ROUGE(Recall-Oriented Understudy for Gisting Evaluation)的排序模式,从而在摘要样本层面优化模型;最后,不依赖参考摘要,利用摘要评估器对候选摘要进行评价,使得选出的摘要与源文本在语义空间中尽可能相似。实验结果表明,在公开数据集MMSS上,相较于MPMSE(Multimodal Pointer-generator via Multimodal Selective Encoding)模型,所提模型在ROUGE-1、ROUGE-2、ROUGE-L评价指标上分别提升了3.17、1.21和2.24个百分点。 展开更多
关键词 多模态 生成式摘要 序列序列 事实性错误 语义相关性
下载PDF
基于CEEMDAN-Transformer的灌浆流量混合预测模型 被引量:3
12
作者 李凯 任炳昱 +2 位作者 王佳俊 关涛 余佳 《水利学报》 EI CSCD 北大核心 2023年第7期806-817,共12页
灌浆流量是最重要的水利工程灌浆参数之一,通过对灌浆流量的有效预测,可以实现对异常工况的提前响应,以保障施工质量与工程安全。然而由于灌浆过程面临的复杂地质情况,灌浆流量数据存在强非线性与波动性的特点,难以获得令人满意的计算... 灌浆流量是最重要的水利工程灌浆参数之一,通过对灌浆流量的有效预测,可以实现对异常工况的提前响应,以保障施工质量与工程安全。然而由于灌浆过程面临的复杂地质情况,灌浆流量数据存在强非线性与波动性的特点,难以获得令人满意的计算精度。现有灌浆流量预测存在的不足如下:传统神经网络模型对时间序列特征提取和加工处理不足,导致预测精度有限;传统神经网络模型测试集进行一次计算仅能输出一个结果,进行多个时间步预测需要繁杂的多次计算;单测点预测结果预测时间短并且无法反映灌浆流量序列变化的整体趋势,不利于控制灌浆流量和保障施工质量。针对上述问题,本研究提出基于CEEMDAN-Transformer的灌浆流量混合预测模型。基于完全自适应噪声集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)方法将灌浆流量分解为本征模函数与残差信号,解决灌浆流量数据的非线性与强波动的问题;采用多头注意力Transformer实现多个本征模函数(Intrinsic Mode Function,IMF)序列到序列的预测,采用多头注意力机制来构建输入和输出的全局依赖关系,提升时间序列参数特征提取水平;最后,建立时序测点多输入多输出模型实现灌浆流量预测,提升多输出序列计算效率,反映整体趋势的多输出序列能够为灌浆流量控制提供参考。工程应用结果表明,本研究提出的基于CEEMDAN-Transformer的灌浆流量混合预测模型具有较好的计算精度和计算效率。 展开更多
关键词 灌浆流量预测 完全自适应噪声集合经验模态分解 Transformer算法 注意力机制 序列序列
下载PDF
基于全局与滑动窗口结合的Attention机制的非侵入式负荷分解算法 被引量:3
13
作者 董哲 陈玉梁 +1 位作者 薛同来 邵若琦 《电测与仪表》 北大核心 2023年第11期74-80,共7页
非侵入式负荷监测(non-intrusive load monitoring,NILM)是指在电力入口处安装监测设备,利用总用电负荷得到用电侧单个用电设备状态的方法。由此可以准确地刻画用户用电画像,故NILM是电网智能配电和给予用户侧精细化管理的关键技术之一... 非侵入式负荷监测(non-intrusive load monitoring,NILM)是指在电力入口处安装监测设备,利用总用电负荷得到用电侧单个用电设备状态的方法。由此可以准确地刻画用户用电画像,故NILM是电网智能配电和给予用户侧精细化管理的关键技术之一。随着深度学习在NILM的应用,对于负荷的识别与功率分解能力有所提升,但在训练模型的速率与模型的预测准确率上依旧不高,为此,文章提出基于全局与滑动窗口相结合的注意力机制的负荷分解模型。该模型首先将输入总负荷功率序列通过功率嵌入矩阵映射到高维向量,并利用基于双向LSTM的编码器进行信息提取;通过引入全局与滑动窗口相结合的Attention机制,从提取的信息中选取与当前时刻相关度高的信息,用于解码并最终得到负荷分解结果。在数据集REFIT上验证了所提算法在速率和准确率上有更好的效果。 展开更多
关键词 非侵入式负荷监测 深度学习 序列序列 注意力机制
下载PDF
基于Seq2Seq和Attention的时序卫星云图台风等级预测 被引量:6
14
作者 郑宗生 刘敏 +3 位作者 胡晨雨 傅泽平 卢鹏 姜晓轶 《遥感信息》 CSCD 北大核心 2020年第4期16-22,共7页
台风预测可为台风预警预报提供先验信息,辅助相关部门进行科学决策,以减少灾害损失。利用时间序列台风卫星云图,提出一种新的台风等级预测模型SeqTyphoon,将注意力机制和序列到序列引入模型预测未来时刻台风图像,然后利用卷积神经网络... 台风预测可为台风预警预报提供先验信息,辅助相关部门进行科学决策,以减少灾害损失。利用时间序列台风卫星云图,提出一种新的台风等级预测模型SeqTyphoon,将注意力机制和序列到序列引入模型预测未来时刻台风图像,然后利用卷积神经网络对预测的台风图像进行台风等级预测。通过日本气象厅发布的1981—2017年3万多张时序台风卫星云图,构建了训练集、验证集和测试集,分别对应29519、3804、1995张台风图像。针对SeqTyphoon模型,分别进行了台风云图的不同时间间隔、不同预测时长及不同空间分辨率对台风图像预测精度影响的对比实验。实验结果表明,台风云图均为32像素×32像素,时间间隔为6 h比时间间隔为12 h的训练集和验证集的均方根误差分别降低5.41%、5.72%,前者训练集的均方根误差达到0.0922,验证集为0.0954,前者台风等级预测准确率为后者的2倍;台风云图为32像素×32像素,时间间隔为6 h时,预测未来6~48 h的台风图像,训练集和验证集的均方根误差均递增,台风等级预测准确率递减;时间间隔为6 h,图像为64像素×64像素的训练集的均方根误差为0.0896,验证集为0.0911,台风等级预测总体准确率为83.2%。综上,影响台风图像的最主要因素是相邻台风云图的时间间隔,其次是预测时长与空间分辨率大小。 展开更多
关键词 时间序列 台风卫星云图 注意力机制 序列序列 图像预测
下载PDF
深度学习法在黑河流域降雨径流预测中的应用
15
作者 翟志杰 《水利科技与经济》 2024年第7期115-118,共4页
随着计算硬件和算法的发展,长短期记忆网络(LSTM)和序列到序列(seq2seq)等深度学习方法在处理时间序列问题上显示出较大优势。针对连续降雨径流预测,提出一种基于LSTM和seq2seq结构的预测模型。研究表明,LSTM-seq2seq模型在连续降雨径... 随着计算硬件和算法的发展,长短期记忆网络(LSTM)和序列到序列(seq2seq)等深度学习方法在处理时间序列问题上显示出较大优势。针对连续降雨径流预测,提出一种基于LSTM和seq2seq结构的预测模型。研究表明,LSTM-seq2seq模型在连续降雨径流预测方面优于线性回归、Lasso回归、支持向量回归和LSTM模型,具有较强的预测能力,可用于提高短期洪水预报的精度。 展开更多
关键词 径流预测 长短期记忆网络 序列序列 深度学习
下载PDF
基于学习-推理的约束求解方法研究进展
16
作者 邹悦 赖家洋 张永刚 《软件学报》 EI CSCD 北大核心 2024年第1期220-235,共16页
机器学习与自动推理的融合是当前人工智能研究的新趋势.约束满足问题是人工智能研究的经典问题,现实世界中大量的调度、规划和配置等问题均可以建模为约束满足问题,高效的求解算法一直是研究热点.近年来涌现出众多将机器学习应用于约束... 机器学习与自动推理的融合是当前人工智能研究的新趋势.约束满足问题是人工智能研究的经典问题,现实世界中大量的调度、规划和配置等问题均可以建模为约束满足问题,高效的求解算法一直是研究热点.近年来涌现出众多将机器学习应用于约束满足问题求解的新方法,这些基于“学习-推理”的新方法为约束满足问题求解开辟了新方向并展示出巨大发展潜力,方法的突出优点是适应性强、可在线优化并具有更强的可扩展性.将当前的“学习-推理”方法分为基于消息传递神经网络、基于序列到序列和基于最优化等3类进行综述,详细分析各类方法的特点和在不同的问题集上求解效果,尤其对每类方法所涵盖的相关工作进行多角度的对比分析.最后,对基于“学习-推理”的约束求解方法进行总结和展望. 展开更多
关键词 约束满足问题 消息传递神经网络 序列序列 强化学习 最优化
下载PDF
基于标签交互Seq2Seq模型的多标签文本分类方法
17
作者 王嫄 胡鹏 +3 位作者 鄢艳玲 王佳帅 赵婷婷 杨巨成 《传感器与微系统》 CSCD 北大核心 2024年第8期155-159,共5页
多标签文本分类任务可被建模为文本序列到标签序列的映射任务。然而,现有的序列到序列(Seq2Seq)模型仅从嘈杂文本中提取粗粒度的文本级表示,忽略了标签与单词之间细粒度的交互线索,导致类别理解偏差。对此,提出基于编码器—解码器结构... 多标签文本分类任务可被建模为文本序列到标签序列的映射任务。然而,现有的序列到序列(Seq2Seq)模型仅从嘈杂文本中提取粗粒度的文本级表示,忽略了标签与单词之间细粒度的交互线索,导致类别理解偏差。对此,提出基于编码器—解码器结构的标签语义交互Seq2Seq模型。在文本语义提取阶段,使用门控机制融合粗粒度的文本级表示和细粒度的交互线索,最终得到类别理解纠正的文本表示。在2个标准数据集上,与LEAM,LSAN,SGM等6个算法进行对比实验,结果表明,本文模型在2个主要评价指标上均得到显著提升。 展开更多
关键词 多标签文本分类 序列序列 自适应门 多头注意力 标签嵌入
下载PDF
双路卷积神经网络和序列到序列的多步短期负荷预测
18
作者 袁建华 徐杰 +1 位作者 蒋文军 李洪强 《电力系统及其自动化学报》 CSCD 北大核心 2024年第9期96-104,共9页
为提高多步短期电力负荷预测精度,满足实际应用中对于不同时间长度的预测需求,提出一种双路卷积神经网络和序列到序列相结合的多步预测方法。首先,构造双支路并行结构的特征提取网络双路卷积神经网络对负荷输入数据进行不同尺度的深层... 为提高多步短期电力负荷预测精度,满足实际应用中对于不同时间长度的预测需求,提出一种双路卷积神经网络和序列到序列相结合的多步预测方法。首先,构造双支路并行结构的特征提取网络双路卷积神经网络对负荷输入数据进行不同尺度的深层次特征提取;其次,分别以双向门控循环单元和长短期记忆网络作为编码器和解码器构建序列到序列网络,利用编码器对双路卷积神经网络的输出特征进行编码,并引入注意力机制完成输入数据到动态变化的中间向量的信息转换;最后通过解码器解码实现未来多个时刻的负荷序列输出。实验结果表明,所提方法较其他方法具有更优的多步预测性能。 展开更多
关键词 负荷预测 多步预测 序列序列 深度学习 注意力机制
下载PDF
一种建立在GPT-2模型上的数据增强方法
19
作者 张小川 陈盼盼 +2 位作者 邢欣来 杨昌萌 滕达 《智能系统学报》 CSCD 北大核心 2024年第1期209-216,共8页
针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-train... 针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-trained transformer for data augmentation,PunishGPT-DA)。设计了惩罚项和超参数α,与负对数似然损失函数共同作用微调GPT-2(generative pre-training 2.0),鼓励模型关注那些预测概率较小但仍然合理的输出;使用基于双向编码器表征模型(bidirectional encoder representation from transformers,BERT)的过滤器过滤语义偏差较大的生成样本。本文方法实现了对训练集16倍扩充,与GPT-2相比,在意图识别、问题分类以及情感分析3个任务上的准确率分别提升了1.1%、4.9%和8.7%。实验结果表明,本文提出的方法能够同时有效地控制一致性和多样性需求,提升下游任务模型的训练性能。 展开更多
关键词 自然语言处理 人工智能 数据增强 句子分类 少样本 序列序列 生成式预训练语言模型 双向编码器表征模型
下载PDF
基于Seq2Seq-Att的船舶轨迹预测算法
20
作者 苗靖 李晓婷 《火力与指挥控制》 CSCD 北大核心 2024年第4期71-76,共6页
随着海上船舶日益增多,海情急剧复杂化,及时准确地预测船舶的下一步动向成为海事监管的迫切需求。针对现有船舶轨迹预测算法提取轨迹特征能力较差、预测精度不高的问题,提出了添加Attention注意力机制的序列到序列船舶轨迹预测算法(sequ... 随着海上船舶日益增多,海情急剧复杂化,及时准确地预测船舶的下一步动向成为海事监管的迫切需求。针对现有船舶轨迹预测算法提取轨迹特征能力较差、预测精度不高的问题,提出了添加Attention注意力机制的序列到序列船舶轨迹预测算法(sequence-to-sequence with attention,Seq2Seq-Att)。通过改进Seq2Seq的编码器结构和添加Attention机制,提高模型对轨迹特征的记忆能力,从而提升算法的预测精度。以东海海域的AIS数据为样本训练模型,预测船舶未来一段时间的经度、纬度、航速和航向。实验结果表明,相较于传统算法,该算法的预测精度更高,且均方根误差明显降低,可以为海事监管和智能航行提供依据。 展开更多
关键词 轨迹预测 注意力机制 序列序列 AIS数据
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部