期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
注意力增强的双向LSTM情感分析 被引量:44
1
作者 关鹏飞 李宝安 +1 位作者 吕学强 周建设 《中文信息学报》 CSCD 北大核心 2019年第2期105-111,共7页
在基于深度学习的情感分析工作中,传统的注意力机制主要以串行的方式作为其他模型的下一层,用于学习其他神经网络模型输出的权重分布。该文在探究使用深度学习进行句子级情感分析任务的基础上,提出一种注意力增强的双向LSTM模型。模型... 在基于深度学习的情感分析工作中,传统的注意力机制主要以串行的方式作为其他模型的下一层,用于学习其他神经网络模型输出的权重分布。该文在探究使用深度学习进行句子级情感分析任务的基础上,提出一种注意力增强的双向LSTM模型。模型使用注意力机制直接从词向量的基础上学习每个词对句子情感倾向的权重分布,从而学习到能增强分类效果的词语,使用双向LSTM学习文本的语义信息。最终,通过并行融合的方式提升分类效果。通过在NLPCC 2014情感分析语料上进行测试,该模型的结果优于其他句子级情感分类模型。 展开更多
关键词 注意力机制 双向lstm 情感分析
下载PDF
基于双向LSTM语义强化的主题建模 被引量:14
2
作者 彭敏 杨绍雄 朱佳晖 《中文信息学报》 CSCD 北大核心 2018年第4期40-49,共10页
当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主... 当前,双向LSTM神经网络等深度学习方法已经能有效地表达文本语义特征,为构建深层次的具有语义连贯性的主题模型提供了可能。但是,现有方法在文本的概率主题建模方面,提升的效果还比较有限。该文提出了一个基于双向LSTM语义强化的概率主题模型DGPU-LDA(double generalized polya Urn with LDA)。该模型一方面结合双向LSTM文档语义编码框架DS-Bi-LSTM(document semantic bi-directional LSTM)来实现文档宏观语义的嵌入表示,另一方面采用文档—主题和词汇—词汇双GPU(generalized polya Urn)语义强化机制以及LSTM来刻画参数推断过程中的吉布斯采样过程。在搜狗新闻数据集以及20新闻组数据集上的实验结果表明,相对于一些比较前沿的主题模型,DGPU-LDA模型在主题语义连贯性、文本分类准确率方面展现了一定的优势,同时该模型在文本语义特征表达方面的有效性也得到了证明。 展开更多
关键词 双向lstm 语义强化 主题模型
下载PDF
基于Bi-LSTM和自注意力机制的旋转机械故障诊断方法研究 被引量:12
3
作者 高玉才 付忠广 +1 位作者 王诗云 谢玉存 《中国工程机械学报》 北大核心 2022年第3期273-278,共6页
旋转机械因其特殊的功能要求,通常工作在恶劣的环境中,振动信号易受外界干扰。基于传统信号处理方法的故障诊断技术越来越不能满足故障诊断精度的需要,因此,利用大数据和人工智能技术进行旋转机械故障诊断成为目前的主要研究方向之一。... 旋转机械因其特殊的功能要求,通常工作在恶劣的环境中,振动信号易受外界干扰。基于传统信号处理方法的故障诊断技术越来越不能满足故障诊断精度的需要,因此,利用大数据和人工智能技术进行旋转机械故障诊断成为目前的主要研究方向之一。针对以上问题,提出一种基于双向长短时记忆网络(Bi-LSTM)和自注意力机制的旋转机械故障诊断方法。首先,利用转子实验台模拟旋转机械的各种运行状态,采集旋转机械在各种运行状态下的振动信号;然后,将振动信号输入Bi-LSTM网络,自注意力机制将Bi-LSTM各时间步的输出进行加权求和,获得振动信号的深层特征表示;最后,通过全连接层和Softmax层输出旋转机械各种运行状态的预测概率。实验结果表明:本文提出的方法能够有效地实现旋转机械的故障诊断,与其他方法相比,模型的训练稳定性、收敛速度和故障识别准确率均得到提高。 展开更多
关键词 旋转机械 人工智能 故障诊断 双向长短时记忆网络(bi-lstm) 自注意力机制
下载PDF
基于双向LSTM神经网络的可穿戴跌倒预警研究
4
作者 李玲艺 潘巨龙 +1 位作者 项睿涵 方堃 《传感技术学报》 CAS CSCD 北大核心 2024年第5期849-856,共8页
为了在老年人跌倒之前进行预判并及时触发跌倒防护气囊,防止跌倒对老年人身心造成严重伤害,提出了基于双向长短期记忆神经网络的轻量级跌倒预测算法,采用深度学习模型自动提取加速度计数据深层特征,省去因人工提取跌倒数据特征所消耗的... 为了在老年人跌倒之前进行预判并及时触发跌倒防护气囊,防止跌倒对老年人身心造成严重伤害,提出了基于双向长短期记忆神经网络的轻量级跌倒预测算法,采用深度学习模型自动提取加速度计数据深层特征,省去因人工提取跌倒数据特征所消耗的时间,提升了跌倒预测模型的泛化能力。首先根据跌倒落地时刻和前置时间截取数据窗口作为输入;其次设计轻量级双向长短期记忆神经网络提取加速度特征并预测跌倒;最后借助TensorFlow Lite框架对模型进行轻量化改造。实验结果表明所提算法在SisFall跌倒公开数据集中获得了96.92%的准确率,95.73%的敏感度,98.15%的特异度,跌倒前置反应时间达215 ms,足以触发跌倒防护气囊。对应的TensorFlow Lite模型所占空间大小仅为62.2 kB,算法运行时间为1.20 ms,有望部署在嵌入式可穿戴终端,进行实时跌倒预测。所提算法实现了更高的预测精度并具有较长的跌倒预警时间,更适于资源受限的嵌入式设备,为老年人跌倒预测和可穿戴式跌倒保护装置的开发提供了进一步的参考。 展开更多
关键词 跌倒预测 深度学习 双向lstm 前置时间 可穿戴设备 保护气囊
下载PDF
基于自注意力机制与双向LSTM的睡眠分期模型
5
作者 曹科研 王莹莹 陶杭波 《软件导刊》 2024年第5期24-32,共9页
针对现有模型无法充分捕捉样本中短暂、随机的波形及无法聚焦典型、重要波形,从而影响分期结果的问题,提出一种基于自注意力机制与双向长短时记忆网络的睡眠分期模型。首先,构建单流时频信息学习模块自动表达PSG信号的低级表征,挖掘EEG... 针对现有模型无法充分捕捉样本中短暂、随机的波形及无法聚焦典型、重要波形,从而影响分期结果的问题,提出一种基于自注意力机制与双向长短时记忆网络的睡眠分期模型。首先,构建单流时频信息学习模块自动表达PSG信号的低级表征,挖掘EEG数据的时不变信息、频率特征。然后,设计自适应特征重新校准学习模块,对30 s样本中出现的瞬时和重点波形特征进行校准训练,给予此类特征更多关注并分配更大权重。最后,将特征送至关联样本间的序列依赖学习模块,以学习各睡眠样本间的上下文关系,充分利用前后相邻样本判断当前样本类别。结果表明,该方法性能优于其他主流模型,在Sleep-edf-2013和Sleep-edf-2018两个公共睡眠数据集上的准确率分别为85.5%、84.3%,MF1值分别为82.1%、79.6%,可为睡眠分期任务提供技术参考。 展开更多
关键词 睡眠分期 TRANSFORMER 双向lstm 脑电信号 单通道
下载PDF
基于ATT-CNN-BiLSTM的虚拟编组列车时空轨迹预测
6
作者 柴铭 刘皓元 +2 位作者 苏浩翔 唐涛 刘宏杰 《铁道学报》 EI CAS CSCD 北大核心 2024年第6期80-89,共10页
保障虚拟编组平稳追踪运行的关键问题是实现对列车运行状态的精准预测。针对列车运行过程多变的特点,提出基于融合注意力机制的卷积双向长短期记忆神经网络(ATT-CNN-BiLSTM)的时空轨迹预测方法。针对列车历史运行数据中非正常运行场景... 保障虚拟编组平稳追踪运行的关键问题是实现对列车运行状态的精准预测。针对列车运行过程多变的特点,提出基于融合注意力机制的卷积双向长短期记忆神经网络(ATT-CNN-BiLSTM)的时空轨迹预测方法。针对列车历史运行数据中非正常运行场景稀少产生的数据非均衡问题,利用卷积神经网络和双向长短期记忆网络提取列车运行数据维度之间的特征关联,并增加注意力机制提升泛化能力。同时引入运行时验证方法在线监控预测结果,降低由预测错误造成的行车风险。以成都地铁8号线真实数据为例进行实验,设计5种评价指标,通过基线模型与消融实验对所提ATT-CNN-BiLSTM进行评价,该模型对于异常场景的预测误差至少减小9.626%。 展开更多
关键词 列车状态预测 虚拟编组 深度学习 注意力机制 双向长短期记忆神经网络
下载PDF
基于双向LSTM的误植域名滥用检测方法 被引量:5
7
作者 吕品 李全刚 +4 位作者 柳厅文 宁振虎 王玉斌 时金桥 方滨兴 《电子学报》 EI CAS CSCD 北大核心 2018年第9期2081-2086,共6页
当前,误植域名检测主要以计算域名对之间的编辑距离为基础,未能充分挖掘域名的上下文信息,且对短域名的检测易产生大量的假阳性结果。采集域名相关信息进行判定虽然有助于提高检测效果,却会引入较大的额外开销.本文采用了基于域名字符... 当前,误植域名检测主要以计算域名对之间的编辑距离为基础,未能充分挖掘域名的上下文信息,且对短域名的检测易产生大量的假阳性结果。采集域名相关信息进行判定虽然有助于提高检测效果,却会引入较大的额外开销.本文采用了基于域名字符串的轻量级检测策略,并引入双向长短时记忆模型(LSTM,Long Short-Term Memory)来充分利用域名上下文,提升检测效果.本文还设计了面向域名的局部敏感哈希函数,以提高在大规模域名集合上进行误植域名检测的速度.在大量真实数据集上的实验结果表明,本文的工作改进了基于编辑距离检测方法的不足,能够有效地进行误植域名滥用检测. 展开更多
关键词 误植域名 编辑距离 双向lstm 上下文信息 局部敏感哈希
下载PDF
采用双向LSTM自编码器的驾驶风格谱聚类识别研究
8
作者 梁科 陈华晟 +1 位作者 潘明章 叶宇 《重庆理工大学学报(自然科学)》 北大核心 2023年第10期28-37,共10页
不同驾驶风格的分类对驾驶安全、道路设计和燃油经济性具有深远的影响。考虑到驾驶风格受驾驶员即时操作和前后操作的影响,提出了一种采用双向LSTM自编码器的谱聚类模型对驾驶风格进行识别,以反映驾驶数据时序性对驾驶风格识别的影响。... 不同驾驶风格的分类对驾驶安全、道路设计和燃油经济性具有深远的影响。考虑到驾驶风格受驾驶员即时操作和前后操作的影响,提出了一种采用双向LSTM自编码器的谱聚类模型对驾驶风格进行识别,以反映驾驶数据时序性对驾驶风格识别的影响。首先利用鲸鱼优化算法对驾驶过程生成的自然驾驶数据进行特征选择,再利用基于双向LSTM的自编码器模型,获得用于谱嵌入的特征值和特征向量,并最终通过谱聚类对驾驶风格进行识别。应用本文中所提出的方法对真实驾驶数据进行比较分析。结果表明:该方法在聚类的精确性优于SOM和LSTM-谱聚类方法。此外,该方法还能在降低数据特征的情况下有效地识别驾驶员的驾驶风格,并反映驾驶员的操作策略。 展开更多
关键词 驾驶风格识别 双向lstm 自编码器 谱聚类
下载PDF
基于动态语义编码双向LSTM的中文语义相似度计算 被引量:4
9
作者 初雅莉 郑虹 侯秀萍 《计算机应用与软件》 北大核心 2020年第6期224-229,共6页
中文句子结构有较高的复杂性,导致计算语义相似度非常困难,准确率不高。针对这种情况,改进一种动态语义编码双向LSTM中文语义相似度计算模型。采用双向LSTM编码器解码器结构,提取由标准句子和自然句子组成的句子对的双向语义特征。在解... 中文句子结构有较高的复杂性,导致计算语义相似度非常困难,准确率不高。针对这种情况,改进一种动态语义编码双向LSTM中文语义相似度计算模型。采用双向LSTM编码器解码器结构,提取由标准句子和自然句子组成的句子对的双向语义特征。在解码器结构中加入动态语义编码规则,调整输入到解码器的语义编码信息,并把编码信息存储到LSTM神经元节点中,从而得到句子对更准确的相似度值。模型在汉字数据集、混合数据集和原始数据集三种中文句子对数据集中进行实验。实验结果表明,该模型在三种数据集中语义相似度的计算优于其他循环神经网络模型。 展开更多
关键词 中文语义 语义相似度 双向lstm 动态语义编码规则
下载PDF
基于深度学习框架SSA-BiLSTM网络的风速预测 被引量:4
10
作者 丁仁强 周武能 +1 位作者 程航洋 刘佳伦 《计算机与数字工程》 2020年第11期2578-2583,2594,共7页
在风电预测中,风速预测起着至关重要的作用,为了提高风速预测的精确性,论文提出了一种基于深度学习框架SSA-BiLSTM网络风速预测方法,采用直接式模式,利用历史风速数据进行风速预测。该方法在已有典型LSTM方法基础上进行改进,使用双向LST... 在风电预测中,风速预测起着至关重要的作用,为了提高风速预测的精确性,论文提出了一种基于深度学习框架SSA-BiLSTM网络风速预测方法,采用直接式模式,利用历史风速数据进行风速预测。该方法在已有典型LSTM方法基础上进行改进,使用双向LSTM网络,使得输出层不仅可以得到输入序列中每个数据点的过去信息,还可以获得输入序列中每个数据点的未来信息。同时,集成了奇异谱分析法对输入序列数据进行预处理,提取趋势信息和去除噪声。仿真及实验结果证明了论文所提方法的有效性,与支持向量机回归算法、K-最近邻算法及典型LSTM方法相比较,论文所提出的SSABiLSTM方法在风速预测上提高了预测的精确度。 展开更多
关键词 奇异谱分析法 循环神经网络 双向长短期记忆网络 风速预测
下载PDF
基于双向长短期记忆网络的共享单车流量预测 被引量:4
11
作者 刘耿耿 朱予涵 郭灿阳 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1871-1876,共6页
近年来,共享单车逐渐成为流行于城市的交通出行手段,过量投放是其目前面临的最大问题,准确预测共享单车流量能有效调节共享单车投放,且能维护城市的交通秩序和形象.考虑到共享单车流量是一种时间序列,当前流量与过去和将来的流量具有密... 近年来,共享单车逐渐成为流行于城市的交通出行手段,过量投放是其目前面临的最大问题,准确预测共享单车流量能有效调节共享单车投放,且能维护城市的交通秩序和形象.考虑到共享单车流量是一种时间序列,当前流量与过去和将来的流量具有密切的联系,本文提出一种基于双向长短期记忆的深度网络模型以预测未来的共享单车流量.该模型的时间步长设置为12,即以过去12个小时的数据作为输入,预测未来一个小时的共享单车流量数据,以此类推,每次向后推移一个小时,从而预测下一个数据.为了验证模型的性能,本文选取人工神经网络,循环神经网络以及长短期记忆网络作为对比模型.实验结果显示,所提出的模型在预测未来的共享单车流量的性能最佳. 展开更多
关键词 共享单车 流量预测 深度学习 双向长短期记忆 大数据
下载PDF
实体驱动的双向LSTM篇章连贯性建模 被引量:2
12
作者 杜舒静 徐凡 王明文 《中文信息学报》 CSCD 北大核心 2017年第6期67-74,共8页
篇章连贯性建模是自然语言处理研究领域的一个基础问题。主流的篇章连贯性模型分为两大类,分别是基于实体网格的连贯性模型和基于神经网络的篇章连贯性模型。其中,基于实体网格的篇章连贯性模型需要进行特征提取,而基于深度学习的模型... 篇章连贯性建模是自然语言处理研究领域的一个基础问题。主流的篇章连贯性模型分为两大类,分别是基于实体网格的连贯性模型和基于神经网络的篇章连贯性模型。其中,基于实体网格的篇章连贯性模型需要进行特征提取,而基于深度学习的模型没有充分考虑篇章中句子间的实体链接对连贯性建模的重要作用。基于此,该文首先抽取篇章中相邻句子的实体信息,将其进行分布式表示,然后将此信息通过多种简单且有效的向量操作融合至句子级的双向LSTM深度学习模型之中。在汉语和英语篇章语料上的句子排序和中英文机器翻译连贯性检测两种任务上的实验表明该文提出的模型性能和现有模型相比有所提升,尤其在中文上有显著提升。 展开更多
关键词 实体 篇章连贯性 双向lstm 分布式表示
下载PDF
结合知识图谱与双向长短时记忆网络的小麦条锈病预测 被引量:25
13
作者 张善文 王振 王祖良 《农业工程学报》 EI CAS CSCD 北大核心 2020年第12期172-178,共7页
针对现有小麦条锈病预测方法没有利用病害发生因素之间的语义信息,存在预测难度大、准确率低等问题,利用知识图谱(Knowledge Graph,KG)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)处理多源异构复杂数据的各... 针对现有小麦条锈病预测方法没有利用病害发生因素之间的语义信息,存在预测难度大、准确率低等问题,利用知识图谱(Knowledge Graph,KG)和双向长短时记忆网络(Bi-directional Long Short-Term Memory,Bi-LSTM)处理多源异构复杂数据的各自优势,提出一种基于KG与Bi-LSTM结合的小麦条锈病预测方法。首先,构建小麦条锈病知识图谱,将与小麦条锈病发生相关的环境信息转换为特征向量;其次,利用特征向量训练Bi-LSTM模型,得到基于Bi-LSTM的小麦条锈病预测模型;最后,利用小麦条锈病数据库数据进行试验。结果表明,KG丰富了进行病害预测所描述的语义信息,提升了Bi-LSTM提取高层病害预测特征的能力,从而提高了病害预测的准确率。在小麦条锈病数据库上的预测准确率达到93.21%,比基于Bi-LSTM的病害预测方法提高了4.5个百分点。该方法能较好预测小麦条锈病,为小麦条锈病的预报预警和综合防治提供科学依据。 展开更多
关键词 病害 预测 模型 小麦条锈病预测 知识图谱 长短时记忆 双向长短时记忆网络(bi-lstm)
下载PDF
基于深度学习的动态手势识别方法 被引量:8
14
作者 钟惠英 《电子测量技术》 2020年第2期128-132,共5页
为了提高动态手势的识别准确率,并避免动态手势的数据预分割和后输出处理过程,设计了一种融合卷积神经网络(CNN)和双向长短时记忆(BiLSTM),引入连接主义时间分类(CTC)作为损失函数的串联型网络模型。使用CTC训练网络来判断输入流中的类... 为了提高动态手势的识别准确率,并避免动态手势的数据预分割和后输出处理过程,设计了一种融合卷积神经网络(CNN)和双向长短时记忆(BiLSTM),引入连接主义时间分类(CTC)作为损失函数的串联型网络模型。使用CTC训练网络来判断输入流中的类标签,以完成动态手势的识别工作。在公开视频手势数据集Jester和通过Kinect自建的包含9个动态手势的数据集上进行了实验验证,结果表明提出的串联型融合网络模型在Jester上能得到较高的识别率,并且引入CTC算法用于手势识别领域是可行的,该方法高效且具有很高的识别率,对9个动态手势最好识别正确率可达98.11%。 展开更多
关键词 KINECT 手势识别 CTC(连接主义时间分类) bilstm(双向长短时记忆) 深度学习
下载PDF
结合注意力和双向LSTM的开放域问句分类研究 被引量:1
15
作者 苏雪峰 《办公自动化》 2023年第3期6-10,共5页
针对现有端对端模型没有对问句局部信息进行显式建模以及模型可解释性差等方面的不足,本文提出面向开放域的基于注意力机制和双向LSTM的问句分类方法。该法一方面使用注意力机制捕捉问句的局部信息;另一方面将注意力机制视为一种模型内... 针对现有端对端模型没有对问句局部信息进行显式建模以及模型可解释性差等方面的不足,本文提出面向开放域的基于注意力机制和双向LSTM的问句分类方法。该法一方面使用注意力机制捕捉问句的局部信息;另一方面将注意力机制视为一种模型内置的自解释机制,将其与双向LSTM结合完成对问句局部和全局信息的建模。在TREC、MSQC、Baidu-Zhidao、Baidu-Search四个公开的开放域问句分类数据集上的实验结果表明,本文提出的方法在分类性上优于现有的基准方法,而且该方法的注意力机制能捕捉到问句分类的关键局部信息,提高模型的可解释性,为下游任务提供除类别以外的关键信息。 展开更多
关键词 开放域 问句分类 注意力机制 可解释性 双向长短期记忆(lstm)网络
下载PDF
多神经网络协作的电力文本类型识别
16
作者 陈鹏 吴旻荣 +4 位作者 蔡冰 何晓勇 金兆轩 金志刚 侯瑞 《计算机系统应用》 2022年第7期149-157,共9页
电力企业为实现数字资产管理,提高行业运行效率,促进电力信息化的融合,需要实施有效的数据组织管理方法.针对电力行业中的数据,提出了基于字级别特征的高效文本类型识别模型.在该模型中,将字符通过BERT预训练模型生成电力客服文本动态... 电力企业为实现数字资产管理,提高行业运行效率,促进电力信息化的融合,需要实施有效的数据组织管理方法.针对电力行业中的数据,提出了基于字级别特征的高效文本类型识别模型.在该模型中,将字符通过BERT预训练模型生成电力客服文本动态的高效字向量,字向量序列输入利用融合注意力机制的双向长短期记忆网络(BiLSTM),通过注意力机制有效捕捉文本中帮助实现类型识别的潜在特征,最终利用Softmax层实现对电力文本的类型识别任务.本文提出的模型在电力客服文本数据集上达到了98.81%的准确率,优于CNN,BiLSTM等传统神经网络识别方法,增强了BERT模型的应用,并有效解决了电力文本类型识别任务中语义的长距离依赖问题. 展开更多
关键词 BERT模型 双向长短期记忆网络(bilstm) 注意力机制 深度学习 自然语言处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部