期刊文献+
共找到284篇文章
< 1 2 15 >
每页显示 20 50 100
基于PyTorch的机器翻译算法的实现 被引量:15
1
作者 李梦洁 董峦 《计算机技术与发展》 2018年第10期160-163,167,共5页
当向机器翻译模型输入序列时,随着序列长度的不断增长,会出现长距离约束即输入输出序列的长度被限制在固定范围内的问题,因此所建模型的能力会受到约束。序列到序列模型(sequence to sequence model)可以解决长距离约束问题,但单纯的序... 当向机器翻译模型输入序列时,随着序列长度的不断增长,会出现长距离约束即输入输出序列的长度被限制在固定范围内的问题,因此所建模型的能力会受到约束。序列到序列模型(sequence to sequence model)可以解决长距离约束问题,但单纯的序列到序列模型无法对翻译中要参考词语前后或其他位置的内容来改善翻译质量的行为进行建模。为了弥补该缺陷,提出了注意力机制(attention mechanism)。针对以上问题,报告了机器翻译及部分模型的研究现状,简述了深度学习框架,分析了基于神经网络的机器翻译及注意力机制原理,并对使用PyTorch实现的序列到序列模型及注意力机制进行了研究,通过分析翻译的时间消耗和翻译后的词错率以及评价标准的值来评价模型。最终该模型在英法数据集上取得了一定的效果。 展开更多
关键词 机器翻译 序列对序列 注意力机制 词错率 循环神经网络
下载PDF
基于序列到序列和注意力机制的超短期风速预测 被引量:13
2
作者 刘擘龙 张宏立 +1 位作者 王聪 范文慧 《太阳能学报》 EI CAS CSCD 北大核心 2021年第9期286-294,共9页
风速具有较大的波动性,给风速预测带来较大难度。为解决以上问题,该文提出基于序列到序列和注意力机制的深度学习模型来进行超短期风速预测,首先采用1维卷积神经网络和门控循环单元对风速序列数据做编码处理,得到语义向量,然后使用注意... 风速具有较大的波动性,给风速预测带来较大难度。为解决以上问题,该文提出基于序列到序列和注意力机制的深度学习模型来进行超短期风速预测,首先采用1维卷积神经网络和门控循环单元对风速序列数据做编码处理,得到语义向量,然后使用注意力机制和门控循环单元对语义向量做动态解码,最后输出预测值,通过反向传播算法和梯度下降算法训练模型参数。在实际采集的风速数据上对模型的预测精度和性能做评估,实验结果表明:相较于其他模型,该模型提高了超短期风速预测精度和鲁棒性,具有较好的泛化能力,验证了所提模型的有效性。 展开更多
关键词 风速预测 深度学习 注意力机制 序列到序列
下载PDF
基于神经网络的藏语语音合成 被引量:10
3
作者 都格草 才让卓玛 +1 位作者 南措吉 算太本 《中文信息学报》 CSCD 北大核心 2019年第2期75-80,共6页
语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意... 语音合成是人机交互的核心技术之一,也是中文信息处理领域的一项前沿技术。随着神经网络理论的不断深入,基于神经网络的语音合成技术越来越引起人们的关注。该文通过分析藏文字结构与藏语拼读规则,融合Sequence to Sequence模型和注意力机制,研究了基于神经网络的藏语语音合成技术。实验数据表明,该文方法在藏语语音合成上具有良好的性能表现。 展开更多
关键词 藏语语音合成 神经网络 sequence to sequence模型 注意力机制
下载PDF
基于注意力机制的评论摘要生成 被引量:9
4
作者 苏放 王晓宇 张治 《北京邮电大学学报》 EI CAS CSCD 北大核心 2018年第3期7-13,共7页
为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模... 为了实现评论摘要的生成式提取,对序列到序列学习的神经网络模型进行分析,提出了一种改进的注意力机制应用模型,并用于评论摘要.挖掘评论摘要特征,使在摘要中出现的文字更多集中在原文首部;针对评论摘要的样本特征,通过改进局部注意力模型,使其对评论原文的句首具有更高的注意力权重,并可端到端地生成评论摘要的每一个词.实验结果表明,该模型在对英文同类别全文长度小于200的评论摘要提取上有更高的准确率. 展开更多
关键词 评论摘要 注意力机制 序列到序列 循环神经网络
原文传递
基于序列到序列神经网络模型的古诗自动生成方法 被引量:8
5
作者 黄文明 卫万成 邓珍荣 《计算机应用研究》 CSCD 北大核心 2019年第12期3539-3543,共5页
计算机写诗是实现计算机写作的第一步。目前计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题。为改善这些问题,效仿古人写诗的过程,提出了一种两个阶段生成古诗的方法。第一阶段获取写诗大纲,采用TextRank算法对用户输... 计算机写诗是实现计算机写作的第一步。目前计算机写诗普遍存在主题不明确、诗的内容与写作意图不一致的问题。为改善这些问题,效仿古人写诗的过程,提出了一种两个阶段生成古诗的方法。第一阶段获取写诗大纲,采用TextRank算法对用户输入文本提取关键词,并提出一种基于注意力机制的序列到序列神经网络模型用于关键词扩展;第二阶段根据写诗大纲生成每一行诗句,并提出一种包含双编码器和注意力机制的序列到序列神经网络模型用于古诗生成。最后通过对实验结果的评估验证了提出方法的有效性。与基准方法相比,该方法生成的古诗的主题意义更加明确,诗所表现的内容和写作意图更加一致。 展开更多
关键词 关键词扩展 注意力机制 序列到序列 神经网络模型 古诗生成
下载PDF
基于全局与滑动窗口结合的Attention机制的非侵入式负荷分解算法 被引量:3
6
作者 董哲 陈玉梁 +1 位作者 薛同来 邵若琦 《电测与仪表》 北大核心 2023年第11期74-80,共7页
非侵入式负荷监测(non-intrusive load monitoring,NILM)是指在电力入口处安装监测设备,利用总用电负荷得到用电侧单个用电设备状态的方法。由此可以准确地刻画用户用电画像,故NILM是电网智能配电和给予用户侧精细化管理的关键技术之一... 非侵入式负荷监测(non-intrusive load monitoring,NILM)是指在电力入口处安装监测设备,利用总用电负荷得到用电侧单个用电设备状态的方法。由此可以准确地刻画用户用电画像,故NILM是电网智能配电和给予用户侧精细化管理的关键技术之一。随着深度学习在NILM的应用,对于负荷的识别与功率分解能力有所提升,但在训练模型的速率与模型的预测准确率上依旧不高,为此,文章提出基于全局与滑动窗口相结合的注意力机制的负荷分解模型。该模型首先将输入总负荷功率序列通过功率嵌入矩阵映射到高维向量,并利用基于双向LSTM的编码器进行信息提取;通过引入全局与滑动窗口相结合的Attention机制,从提取的信息中选取与当前时刻相关度高的信息,用于解码并最终得到负荷分解结果。在数据集REFIT上验证了所提算法在速率和准确率上有更好的效果。 展开更多
关键词 非侵入式负荷监测 深度学习 序列到序列 注意力机制
下载PDF
基于CEEMDAN-Transformer的灌浆流量混合预测模型 被引量:3
7
作者 李凯 任炳昱 +2 位作者 王佳俊 关涛 余佳 《水利学报》 EI CSCD 北大核心 2023年第7期806-817,共12页
灌浆流量是最重要的水利工程灌浆参数之一,通过对灌浆流量的有效预测,可以实现对异常工况的提前响应,以保障施工质量与工程安全。然而由于灌浆过程面临的复杂地质情况,灌浆流量数据存在强非线性与波动性的特点,难以获得令人满意的计算... 灌浆流量是最重要的水利工程灌浆参数之一,通过对灌浆流量的有效预测,可以实现对异常工况的提前响应,以保障施工质量与工程安全。然而由于灌浆过程面临的复杂地质情况,灌浆流量数据存在强非线性与波动性的特点,难以获得令人满意的计算精度。现有灌浆流量预测存在的不足如下:传统神经网络模型对时间序列特征提取和加工处理不足,导致预测精度有限;传统神经网络模型测试集进行一次计算仅能输出一个结果,进行多个时间步预测需要繁杂的多次计算;单测点预测结果预测时间短并且无法反映灌浆流量序列变化的整体趋势,不利于控制灌浆流量和保障施工质量。针对上述问题,本研究提出基于CEEMDAN-Transformer的灌浆流量混合预测模型。基于完全自适应噪声集合经验模态分解(Complete Ensemble Empirical Mode Decomposition with Adaptive Noise,CEEMDAN)方法将灌浆流量分解为本征模函数与残差信号,解决灌浆流量数据的非线性与强波动的问题;采用多头注意力Transformer实现多个本征模函数(Intrinsic Mode Function,IMF)序列到序列的预测,采用多头注意力机制来构建输入和输出的全局依赖关系,提升时间序列参数特征提取水平;最后,建立时序测点多输入多输出模型实现灌浆流量预测,提升多输出序列计算效率,反映整体趋势的多输出序列能够为灌浆流量控制提供参考。工程应用结果表明,本研究提出的基于CEEMDAN-Transformer的灌浆流量混合预测模型具有较好的计算精度和计算效率。 展开更多
关键词 灌浆流量预测 完全自适应噪声集合经验模态分解 Transformer算法 注意力机制 序列到序列
下载PDF
基于深度学习的ENSO预报方法研究 被引量:4
8
作者 何丹丹 姜金荣 +1 位作者 郝卉群 林鹏飞 《科研信息化技术与应用》 2019年第1期38-47,共10页
El Nino-Southern Oscillation(ENSO)作为全球年际尺度气候中最强的现象,对人们的生产生活造成了重大的影响,每年相关领域的研究人员都会对来年的ENSO作出预报。本文提出基于深度学习的ENSO预报方法,通过预测区域海平面温度(SST)来反映E... El Nino-Southern Oscillation(ENSO)作为全球年际尺度气候中最强的现象,对人们的生产生活造成了重大的影响,每年相关领域的研究人员都会对来年的ENSO作出预报。本文提出基于深度学习的ENSO预报方法,通过预测区域海平面温度(SST)来反映ENSO现象。本文分别对特征工程与模型设计两个方面进行了研究,最终确定了基于相关性的特征选择方法、利用Prophet构建特征以及基于Attention机制的Sequence to Sequence预报模型。最后,本文以NCEP数据集的Nino3.4区域数据为例,分别使用本文提出的模型与集合预报、数值预报的中间耦合模型(ICM)、Sequence to Sequence模型和长短时记忆(LSTM)网络进行对比,结果表明,本文提出的基于Attention机制的Sequenceto Sequence预报模型在长期预测中的均方根误差(RMSE)比其他方法下降了0.3到0.4,短期预测与其他方法相当,并且区域的RMSE分布稳定。 展开更多
关键词 ENSO SST 特征工程 sequence to sequence Attention机制
原文传递
基于Seq2Seq和Attention的时序卫星云图台风等级预测 被引量:6
9
作者 郑宗生 刘敏 +3 位作者 胡晨雨 傅泽平 卢鹏 姜晓轶 《遥感信息》 CSCD 北大核心 2020年第4期16-22,共7页
台风预测可为台风预警预报提供先验信息,辅助相关部门进行科学决策,以减少灾害损失。利用时间序列台风卫星云图,提出一种新的台风等级预测模型SeqTyphoon,将注意力机制和序列到序列引入模型预测未来时刻台风图像,然后利用卷积神经网络... 台风预测可为台风预警预报提供先验信息,辅助相关部门进行科学决策,以减少灾害损失。利用时间序列台风卫星云图,提出一种新的台风等级预测模型SeqTyphoon,将注意力机制和序列到序列引入模型预测未来时刻台风图像,然后利用卷积神经网络对预测的台风图像进行台风等级预测。通过日本气象厅发布的1981—2017年3万多张时序台风卫星云图,构建了训练集、验证集和测试集,分别对应29519、3804、1995张台风图像。针对SeqTyphoon模型,分别进行了台风云图的不同时间间隔、不同预测时长及不同空间分辨率对台风图像预测精度影响的对比实验。实验结果表明,台风云图均为32像素×32像素,时间间隔为6 h比时间间隔为12 h的训练集和验证集的均方根误差分别降低5.41%、5.72%,前者训练集的均方根误差达到0.0922,验证集为0.0954,前者台风等级预测准确率为后者的2倍;台风云图为32像素×32像素,时间间隔为6 h时,预测未来6~48 h的台风图像,训练集和验证集的均方根误差均递增,台风等级预测准确率递减;时间间隔为6 h,图像为64像素×64像素的训练集的均方根误差为0.0896,验证集为0.0911,台风等级预测总体准确率为83.2%。综上,影响台风图像的最主要因素是相邻台风云图的时间间隔,其次是预测时长与空间分辨率大小。 展开更多
关键词 时间序列 台风卫星云图 注意力机制 序列到序列 图像预测
下载PDF
基于图卷积门控循环单元网络模型的交通速度预测
10
作者 谌贵辉 彭娇 +4 位作者 李忠兵 陈伍 刘会康 韩春阳 刘安东 《计算机应用与软件》 北大核心 2024年第2期109-116,共8页
准确的交通预测能够有效解决交通堵塞和环境污染等问题,然而现有预测方法无法充分表征交通数据的特征。针对以上问题,提出一种序列到序列图卷积门控循环单元(Seq2Seq-GCGRU)模型,用于提取交通速度的时空特性和预测。模型由三部分组成,... 准确的交通预测能够有效解决交通堵塞和环境污染等问题,然而现有预测方法无法充分表征交通数据的特征。针对以上问题,提出一种序列到序列图卷积门控循环单元(Seq2Seq-GCGRU)模型,用于提取交通速度的时空特性和预测。模型由三部分组成,分别用于建模带有时间偏移的交通速度周周期、日周期及临近期信息,还提出一种新的seq2seq训练方法以克服已有方法不适用于时间序列的缺陷。实验结果表明,对比其他常见的交通流预测模型,所提算法具有更高的预测精度,均方根误差(RMSE)与平均绝对误差(MAE)指标至少分别降低25%和24%。 展开更多
关键词 交通速度预测 图卷积 序列到序列 时空相关性
下载PDF
基于Seq2Seq-Att的船舶轨迹预测算法
11
作者 苗靖 李晓婷 《火力与指挥控制》 CSCD 北大核心 2024年第4期71-76,共6页
随着海上船舶日益增多,海情急剧复杂化,及时准确地预测船舶的下一步动向成为海事监管的迫切需求。针对现有船舶轨迹预测算法提取轨迹特征能力较差、预测精度不高的问题,提出了添加Attention注意力机制的序列到序列船舶轨迹预测算法(sequ... 随着海上船舶日益增多,海情急剧复杂化,及时准确地预测船舶的下一步动向成为海事监管的迫切需求。针对现有船舶轨迹预测算法提取轨迹特征能力较差、预测精度不高的问题,提出了添加Attention注意力机制的序列到序列船舶轨迹预测算法(sequence-to-sequence with attention,Seq2Seq-Att)。通过改进Seq2Seq的编码器结构和添加Attention机制,提高模型对轨迹特征的记忆能力,从而提升算法的预测精度。以东海海域的AIS数据为样本训练模型,预测船舶未来一段时间的经度、纬度、航速和航向。实验结果表明,相较于传统算法,该算法的预测精度更高,且均方根误差明显降低,可以为海事监管和智能航行提供依据。 展开更多
关键词 轨迹预测 注意力机制 序列到序列 AIS数据
下载PDF
一种建立在GPT-2模型上的数据增强方法
12
作者 张小川 陈盼盼 +2 位作者 邢欣来 杨昌萌 滕达 《智能系统学报》 CSCD 北大核心 2024年第1期209-216,共8页
针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-train... 针对句子分类任务常面临着训练数据不足,而且文本语言具有离散性,在语义保留的条件下进行数据增强具有一定困难,语义一致性和多样性难以平衡的问题,本文提出一种惩罚生成式预训练语言模型的数据增强方法(punishing generative pre-trained transformer for data augmentation,PunishGPT-DA)。设计了惩罚项和超参数α,与负对数似然损失函数共同作用微调GPT-2(generative pre-training 2.0),鼓励模型关注那些预测概率较小但仍然合理的输出;使用基于双向编码器表征模型(bidirectional encoder representation from transformers,BERT)的过滤器过滤语义偏差较大的生成样本。本文方法实现了对训练集16倍扩充,与GPT-2相比,在意图识别、问题分类以及情感分析3个任务上的准确率分别提升了1.1%、4.9%和8.7%。实验结果表明,本文提出的方法能够同时有效地控制一致性和多样性需求,提升下游任务模型的训练性能。 展开更多
关键词 自然语言处理 人工智能 数据增强 句子分类 少样本 序列到序列 生成式预训练语言模型 双向编码器表征模型
下载PDF
基于聚类特征及seq2seq深度CNN的家电负荷识别方法研究 被引量:1
13
作者 汪繁荣 向堃 吴铁洲 《电测与仪表》 北大核心 2023年第10期79-86,共8页
非侵入式负荷分解技术能够挖掘用户内部信息获取各用电设备负荷信息,使智能电网更加贴近日常生活,为泛在电力物联网感知层建立提供有效数据。为解决传统非侵入式负荷分解方法输入数据复杂,考虑因素较多,采样硬件要求高以及辨识准确率较... 非侵入式负荷分解技术能够挖掘用户内部信息获取各用电设备负荷信息,使智能电网更加贴近日常生活,为泛在电力物联网感知层建立提供有效数据。为解决传统非侵入式负荷分解方法输入数据复杂,考虑因素较多,采样硬件要求高以及辨识准确率较低等问题,文章首先利用改进迭代K均值聚类提取用电设备运行状态建立负荷特征集,之后将特征集输入构造的序列到序列的一维深层卷积神经网络模型以及序列到序列的单、双向长短时记忆网络等模型中进行负荷分解挖掘各设备运行状态。最后通过REFITPowerData数据集进行验证,一维深层卷积神经网络模型虽然耗时较大但负荷识别准确率达到93%以上,表明基于特征数据集及序列到序列的一维深层卷积神经网络非侵入式负荷分解方法与其他深度学习模型方法、人工神经网络方法相比表现出更显著的信息提取能力以及辨识能力。 展开更多
关键词 非侵入式负荷分解 深度学习 卷积神经网络 序列到序列 特征提取 数据挖掘
下载PDF
基于注意力机制的主题扩展情感对话生成 被引量:5
14
作者 杨丰瑞 霍娜 +1 位作者 张许红 韦巍 《计算机应用》 CSCD 北大核心 2021年第4期1078-1083,共6页
越来越多的研究开始聚焦于情感对话生成,然而现有的研究往往只关注情感因素,却忽视了对话中主题的相关性和多样性以及与主题密切相关的情感倾向,这可能导致生成响应的质量下降。因此提出一种融合主题信息和情感因素的主题扩展情感对话... 越来越多的研究开始聚焦于情感对话生成,然而现有的研究往往只关注情感因素,却忽视了对话中主题的相关性和多样性以及与主题密切相关的情感倾向,这可能导致生成响应的质量下降。因此提出一种融合主题信息和情感因素的主题扩展情感对话生成模型。该模型首先将对话上下文进行全局编码,引入主题模型以获得全局主题词,并使用外部情感词典获得全局情感词;其次在融合模块里利用语义相似度扩展主题词,并利用依存句法分析提取与主题相关的情感词;最后将上下文、主题词和情感词输入到一个基于注意力机制的解码器中,促使解码器生成主题相关的情感响应。实验结果表明,该模型能生成内容丰富且情感相关的回答。相较于主题增强情感对话生成模型(TE-ECG),所提出的模型在unigram多样性(distinct-1)和bigram多样性(distinct-2)上平均提高了16.3%和15.4%;相较于基于注意力机制的序列到序列模型(Seq2SeqA),所提出的模型在unigram多样性(distinct-1)和bigram多样性(distinct-2)上平均提高了26.7%和28.7%。 展开更多
关键词 情感对话生成 融合模块 主题模型 序列到序列 注意力机制
下载PDF
基于Aseq2seq-PF的实车锂离子动力电池剩余使用寿命预测 被引量:1
15
作者 兰凤崇 潘威 陈吉清 《汽车工程》 EI CSCD 北大核心 2023年第12期2348-2356,共9页
锂离子动力电池剩余使用寿命(RUL)预测可评估电池未来状态,实现指导电池维护和降低故障危害。实车工况中电池循环条件不受控制,动态运行条件下的RUL预测仍存在杂乱数据处理困难、预测结果精度较差且无法兼顾老化不确定性等问题,提出注... 锂离子动力电池剩余使用寿命(RUL)预测可评估电池未来状态,实现指导电池维护和降低故障危害。实车工况中电池循环条件不受控制,动态运行条件下的RUL预测仍存在杂乱数据处理困难、预测结果精度较差且无法兼顾老化不确定性等问题,提出注意力机制序列到序列-粒子滤波(Aseq2seq-PF)混合模型,选取公共荷电状态(SOC)充电区间获取归一化容量,采用迭代和直接的融合预测策略,Aseq2seq模型作为迭代部分实现容量序列精确预测,粒子滤波(PF)模型作为直接部分实现容量波动的不确定性预测,外推容量衰退趋势预测RUL。经实车动力电池数据验证,公共SOC充电区间有效获取了清晰容量衰退趋势,混合模型提高了容量衰退长期预测精度,具有良好鲁棒性,对比已有模型平均绝对误差下降56%以上,且输出满足不同应用需求的置信区间,实现老化不确定性描述。 展开更多
关键词 锂离子动力电池 剩余使用寿命(RUL) 实车数据 序列到序列 老化不确定性
下载PDF
基于机器学习的跨平台缓存划分方法研究 被引量:1
16
作者 邱杰凡 贾逸哲 +2 位作者 华宗汉 曹明生 范菁 《计算机学报》 EI CAS CSCD 北大核心 2023年第10期2097-2116,共20页
多核处理器的最后一级缓存(Last Level Cache,LLC)采用共享机制,当多个程序并行随机访问LLC时,可能引起访存冲突,进而导致系统整体性能的大幅下降.已有研究者试图通过引入缓存划分,合理安排不同程序对LLC的访问时机,解决访存冲突问题.然... 多核处理器的最后一级缓存(Last Level Cache,LLC)采用共享机制,当多个程序并行随机访问LLC时,可能引起访存冲突,进而导致系统整体性能的大幅下降.已有研究者试图通过引入缓存划分,合理安排不同程序对LLC的访问时机,解决访存冲突问题.然而,现有的缓存划分方法主要采用启发式算法,即通过不断“试错”寻找缓存划分最优方案,寻找过程具有不确定性.这种不确定性可能导致划分开销过大甚至出现无法收敛的问题.为此,我们提出了一种基于机器学习的跨平台缓存划分方法MLPart.该方法借助少量运行参数,利用决策树和序列到序列模型预测剩余各个划分方案的性能,直接找到最优的划分方案,从而保证划分开销相对稳定且有效避免了无法收敛的情况.此外,实验表明如果计算平台之间存在着微小配置差异,即使运行相同程序所产生的运行参数也存在较大差异,因此单一模型通常没有足够的泛化能力适应不同的平台.为解决该问题,我们分别利用迁移学习技术和微调技术优化决策树和序列到序列模型,使其能以较低的计算开销完成不同平台的模型快速迁移部署.我们以当前主流的Intel至强(Xeon)处理器平台展开实验,实验结果表明MLPart能够通过少量划分步骤找到性能最佳的缓存划分方案;并且,与采用启发式缓存划分方法KPart,采用基于贝叶斯优化的缓存划分方法CLITE以及采用机器学习的缓存划分方法C&A相比,MLPart对工作集的性能提升更高且更为稳定. 展开更多
关键词 缓存划分 递归神经网络 决策树 序列到序列模型 迁移学习
下载PDF
基于改进编解码器和情感词典的对话生成模型 被引量:1
17
作者 张顺香 李健 +2 位作者 朱广丽 李晓庆 魏苏波 《计算机工程与设计》 北大核心 2023年第2期570-575,共6页
针对现有对话模型生成的回复语句缺乏情感共鸣、拟人效果不够理想的问题,提出一种基于改进编解码器和情感词典的对话生成模型。利用AgSeq2Seq模型对语料库进行训练并构建高质量对话生成系统,结合情感词典识别输入语句的情绪特征并计算... 针对现有对话模型生成的回复语句缺乏情感共鸣、拟人效果不够理想的问题,提出一种基于改进编解码器和情感词典的对话生成模型。利用AgSeq2Seq模型对语料库进行训练并构建高质量对话生成系统,结合情感词典识别输入语句的情绪特征并计算回复语句的情感值,基于情绪对比机制根据不同的情感特征生成相应的拟人回复。实验结果表明,相对传统的对话生成模型,提出模型可以主动识别用户情绪,生成更加合乎逻辑、适应语境的回复,实现拟人程度更高的情感对话过程。 展开更多
关键词 自然语言处理 对话模型 文本生成 情感词典 深度学习 序列到序列 注意力机制
下载PDF
基于Seq2Seq的船舶轨迹变步长预测方法研究 被引量:1
18
作者 张扬 彭鹏菲 卢锐 《电光与控制》 CSCD 北大核心 2023年第4期74-77,110,共5页
针对船舶轨迹的历史轨迹相似性低、预测精度不高等问题,基于序列到序列(Seq2Seq)模型提出一种轨迹预测算法——vSeq2Seq。首先,用一阶差分法处理AIS数据,降低时间依赖性,减弱通信延迟产生的干扰,突出船只运动规律;然后,采用滑窗法处理数... 针对船舶轨迹的历史轨迹相似性低、预测精度不高等问题,基于序列到序列(Seq2Seq)模型提出一种轨迹预测算法——vSeq2Seq。首先,用一阶差分法处理AIS数据,降低时间依赖性,减弱通信延迟产生的干扰,突出船只运动规律;然后,采用滑窗法处理数据,构建模型数据集,通过Seq2Seq模型进行可变步长的轨迹预测。实验结果证明,vSeq2Seq算法能够从船只轨迹中提取出轨迹变化特征,针对船只不同运动状态改变预测步长、灵活地进行预测,对比传统LSTM模型和GRU模型,预测精度有显著提升。 展开更多
关键词 序列到序列 轨迹预测 可变步长 滑窗法
下载PDF
电动公交车电池荷电状态的Seq2Seq 预测方法
19
作者 董红召 王桢 +2 位作者 张楠 佘翊妮 林盈盈 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2023年第10期2051-2059,共9页
针对高维输入特征和长时预测需求下荷电状态预测困难的问题,提出一种电动公交车电池荷电状态的Seq2Seq预测方法.在电池状态的基础上引入车辆行驶状态和行驶工况,利用特征选择算法分析各因素对荷电状态的影响.以LSTM为基本单元结构,WN-Se... 针对高维输入特征和长时预测需求下荷电状态预测困难的问题,提出一种电动公交车电池荷电状态的Seq2Seq预测方法.在电池状态的基础上引入车辆行驶状态和行驶工况,利用特征选择算法分析各因素对荷电状态的影响.以LSTM为基本单元结构,WN-Seq2Seq算法融合Seq2Seq与WaveNet循环结构,可以强化高维输入特征与预测荷电状态的序列信息记忆与表征能力,从而提高模型的预测精度.通过2021—2022年杭州市4辆电动公交车实际行驶数据验证表明,在引入车辆行驶状态和行驶工况后,WN-Seq2Seq模型的评价指标均方误差(MSE)、平均绝对误差(MAE)、平均绝对百分比误差(MAPE)和模型计算时间(MCT)分别为0.505%、0.479%、0.656%和0.017 s.研究结果表明相比传统模型,预测精度及稳定性都有所提升,在不同温度区间下都具有良好的预测效果,为电动公交车能耗控制策略、安全管理提供合理且可靠的参数决策支持. 展开更多
关键词 电动公交车 荷电状态预测 深度学习 序列到序列 循环神经网络
下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部