期刊文献+
共找到444篇文章
< 1 2 23 >
每页显示 20 50 100
基于word2vec和双向LSTM的情感分类深度模型 被引量:43
1
作者 黄贤英 刘广峰 +1 位作者 刘小洋 阳安志 《计算机应用研究》 CSCD 北大核心 2019年第12期3583-3587,3596,共6页
针对社交网络文本传统情感分类模型存在先验知识依赖以及语义理解不足的问题,提出一种基于word2vec和双向长短时记忆循环神经网络的情感分类模型--WEEF-BILSTM。采用基于CBOW (continuous bag-of-words)方式的word2vec模型针对语料训练... 针对社交网络文本传统情感分类模型存在先验知识依赖以及语义理解不足的问题,提出一种基于word2vec和双向长短时记忆循环神经网络的情感分类模型--WEEF-BILSTM。采用基于CBOW (continuous bag-of-words)方式的word2vec模型针对语料训练词向量,减小词向量间的稀疏度,通过双向LSTM神经网络获取更为完整的文本上下文信息从而提取出深度词向量特征,继而使用one-versus-one SVM对其进行情感分类。实验结果表明,提出的WEEF-BILSTM模型较其他模型分类效果更好,能达到更优的准确率和F值。 展开更多
关键词 文本分类 情感分析 双向长短时记忆循环神经网络 词向量 社交网络
下载PDF
基于双向LSTM神经网络模型的中文分词 被引量:39
2
作者 金宸 李维华 +2 位作者 姬晨 金绪泽 郭延哺 《中文信息学报》 CSCD 北大核心 2018年第2期29-37,共9页
中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长... 中文分词是中文自然语言处理的基础。分词质量的好坏直接影响之后的自然语言处理任务。目前主流的分词是基于传统的机器学习模型。近年来,随着人工智能大潮的又一次兴起,长短期记忆(LSTM)神经网络模型改进了普通循环神经网络模型无法长期依赖信息的缺点,被广泛应用于自然语言处理的各种任务中,并取得了不错的效果。对中文分词,该文在经典单向LSTM模型上进行改进,增加了自后向前的LSTM层,设计了双向LSTM模型,改进了单向LSTM对后文依赖性不足的缺点;并引入了贡献率α,对前传LSTM层和后传LSTM层的权重矩阵进行调节,并设计了四个实验,验证了所建模型的正确性和优越性。 展开更多
关键词 中文分词 自然语言处理 双向lstm 贡献率
下载PDF
基于双层注意力和Bi-LSTM的公共安全事件微博情感分析 被引量:31
3
作者 曾子明 万品玉 《情报科学》 CSSCI 北大核心 2019年第6期23-29,共7页
【目的/意义】微博情感分析对公共安全事件管控有着重要意义。现有研究将单条微博作为整体进行分析,情感分析最小单元局限于字或词,而对微博从词到句子,从句子到单条微博这种多层粒度文本结构产生的影响关注不足,基于此本文提出一种融... 【目的/意义】微博情感分析对公共安全事件管控有着重要意义。现有研究将单条微博作为整体进行分析,情感分析最小单元局限于字或词,而对微博从词到句子,从句子到单条微博这种多层粒度文本结构产生的影响关注不足,基于此本文提出一种融合双层注意力的Bi-LSTM模型提升情感分析性能。【方法/过程】以红黄蓝幼儿园涉嫌虐童事件为例,通过Bi-LSTM提取微博词级和句子级特征,结合双层注意力机制学习各级特征权重分布,以递进顺序综合局部情感得到整条微博的情感分类。【结果/结论】实验结果表明,本研究提出的微博情感分析模型F1值、准确率分别达到97.39%、97.62%,相比于SVM、RF、XGBOOST和LSTM,该模型能够在公共安全事件微博情感分析方面取得较好效果。 展开更多
关键词 注意力机制 bi-lstm 公共安全 微博舆情 情感分析
原文传递
基于双向LSTM模型的文本情感分类 被引量:32
4
作者 任勉 甘刚 《计算机工程与设计》 北大核心 2018年第7期2064-2068,共5页
为解决文本情感分类研究中传统循环神经网络模型存在梯度消失和爆炸问题,提出一种基于双向长短时记忆循环神经网络模型(Bi-LSTM)。通过双向传播机制获取文本中完整的上下文信息,采用CBOW模型训练词向量,减小词向量间的稀疏度,结合栈式... 为解决文本情感分类研究中传统循环神经网络模型存在梯度消失和爆炸问题,提出一种基于双向长短时记忆循环神经网络模型(Bi-LSTM)。通过双向传播机制获取文本中完整的上下文信息,采用CBOW模型训练词向量,减小词向量间的稀疏度,结合栈式自编码深度神经网络作为分类器。实验结果表明,Bi-LSTM模型比传统循环神经网络LSTM模型分类效果更好,对比实验中Bi-LSTM2能达到更优的召回率和准确率。 展开更多
关键词 双向长短时记忆循环神经网络 词向量 长短时记忆网络 循环神经网络 文本情感倾向性分析
下载PDF
基于BERT与Bi-LSTM融合注意力机制的中医病历文本的提取与自动分类 被引量:27
5
作者 杜琳 曹东 +2 位作者 林树元 瞿溢谦 叶辉 《计算机科学》 CSCD 北大核心 2020年第S02期416-420,共5页
中医逐渐成为热点,中医病历文本中包含着巨大而宝贵的医疗信息。而在中医病历文本挖掘和利用方面,一直面临中医病历文本利用率低、抽取有效信息并对信息文本进行分类的难度大的问题。针对这一问题,研究一种对中医病历文本的提取与自动... 中医逐渐成为热点,中医病历文本中包含着巨大而宝贵的医疗信息。而在中医病历文本挖掘和利用方面,一直面临中医病历文本利用率低、抽取有效信息并对信息文本进行分类的难度大的问题。针对这一问题,研究一种对中医病历文本的提取与自动分类的方法具有很大的临床价值。文中尝试提出一种基于BERT+Bi-LSTM+Attention融合的病历短文本分类模型。使用BERT预处理获取短文本向量作为模型输入,对比BERT与word2vec模型的预训练效果,对比Bi-LSTM+Attention和LSTM模型的效果。实验结果表明,BERT+Bi-LSTM+Attention融合模型在中医病历文本的提取和分类方面达到了最高的AverageF1值(即89.52%)。通过对比发现,BERT较word2vec模型的预训练效果有显著的提升,且Bi-LSTM+Attention模型较LSTM模型的效果有显著的提升,因此提出的BERT+Bi-LSTM+Attention融合模型在病历文本抽取与分类上有一定的医学价值。 展开更多
关键词 BERT bi-lstm ATTENTION lstm
下载PDF
基于深度主动学习的信息安全领域命名实体识别研究 被引量:25
6
作者 彭嘉毅 方勇 +2 位作者 黄诚 刘亮 姜政伟 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期457-462,共6页
针对通用领域模型不能很好地解决信息安全领域的命名实体识别问题,提出一种基于字符特性,双向长短时记忆网络(Bi-LSTM)与条件随机场(CRF)相结合的信息安全领域命名实体识别方法.该方法不依赖于人工选取特征,通过神经网络模型对序列进行... 针对通用领域模型不能很好地解决信息安全领域的命名实体识别问题,提出一种基于字符特性,双向长短时记忆网络(Bi-LSTM)与条件随机场(CRF)相结合的信息安全领域命名实体识别方法.该方法不依赖于人工选取特征,通过神经网络模型对序列进行标注,再利用CRF对序列标签的相关性进行约束,提高序列标注的准确性.而且,针对信息安全领域标注数据样本不足的问题,采用主动学习方法,使用少量标注样本达到较好的序列标注效果. 展开更多
关键词 信息安全 命名实体识别 主动学习 神经网络 双向长短时记忆网络 条件随机场
下载PDF
基于Bi-LSTM的医疗事件识别研究 被引量:22
7
作者 侯伟涛 姬东鸿 《计算机应用研究》 CSCD 北大核心 2018年第7期1974-1977,共4页
文本的信息抽取及属性识别是文本语义分析的一项重要任务。在已有工作基础上提出了双向LSTM与MLP集成的深度神经网络模型。在2016年Sem Eval的医疗事件抽取以及事件属性预测任务中,该模型将医疗文本的词性以及命名实体的描述信息当做附... 文本的信息抽取及属性识别是文本语义分析的一项重要任务。在已有工作基础上提出了双向LSTM与MLP集成的深度神经网络模型。在2016年Sem Eval的医疗事件抽取以及事件属性预测任务中,该模型将医疗文本的词性以及命名实体的描述信息当做附加属性,使用双向LSTM神经网络学习文本的隐藏特征,解决了传统方法通用性不强以及无法捕捉前后文隐含信息的缺点,再使用全连接的方式去判断候选词汇是否属于医疗事件以及识别其相关属性。实验结果表明,提出的神经网络模型对医疗文本的抽取效果优于以往学者的方法。 展开更多
关键词 信息抽取 医疗事件识别 深度学习 双向lstm
下载PDF
高速场景相邻前车驾驶行为识别及意图预测 被引量:20
8
作者 张海伦 付锐 《交通运输系统工程与信息》 EI CSCD 北大核心 2020年第1期40-46,共7页
相邻前车的驾驶行为会影响后车,因此先进的辅助驾驶系统需具备识别前车驾驶行为的能力.对高速场景下相邻前车换道行为进行研究,分别提出双层连续隐马尔可夫模型—贝叶斯生成分类器(CHMM-BGC),以及基于双向长短时记忆网络(Bi-LSTM)的行... 相邻前车的驾驶行为会影响后车,因此先进的辅助驾驶系统需具备识别前车驾驶行为的能力.对高速场景下相邻前车换道行为进行研究,分别提出双层连续隐马尔可夫模型—贝叶斯生成分类器(CHMM-BGC),以及基于双向长短时记忆网络(Bi-LSTM)的行为识别模型和意图预测模型.采用自然驾驶数据集对模型的有效性进行测试验证.实验分析表明:基于Bi-LSTM的行为识别模型相较于双层CHMM-BGC在平均识别率上提升了11.24%,两种行为识别模型均可在相邻前车换道过程的早期阶段识别换道行为;考虑相邻前车与周围环境车辆的交互作用,可使模型具有预测性,两种意图预测模型均可在车辆换道时刻前预测到驾驶人换道意图.模型仿真计算时间可满足系统的实时性需求,为本车驾驶人预留出反应时间,为预测周围车辆行驶轨迹研究提供支持. 展开更多
关键词 交通工程 行为识别 意图预测 连续隐马尔可夫模型 双向长短时记忆网络
下载PDF
基于双线性函数注意力Bi-LSTM模型的机器阅读理解 被引量:18
9
作者 刘飞龙 郝文宁 +2 位作者 陈刚 靳大尉 宋佳星 《计算机科学》 CSCD 北大核心 2017年第S1期92-96,122,共6页
近年来,随着深度学习(Deep Learning)在机器阅读理解(Machine Reading Comprehension)领域的广泛应用,机器阅读理解迅速发展。针对机器阅读理解中的语义理解和推理,提出一种双线性函数注意力(Attention)双向长短记忆网络(Bi directional... 近年来,随着深度学习(Deep Learning)在机器阅读理解(Machine Reading Comprehension)领域的广泛应用,机器阅读理解迅速发展。针对机器阅读理解中的语义理解和推理,提出一种双线性函数注意力(Attention)双向长短记忆网络(Bi directional-Long Short-Term Memory)模型,较好地完成了在机器阅读理解中抽取文章、问题、问题候选答案的语义并给出了正确答案的任务。将其应用到四六级(CET-4,CET-6)听力文本上测试,测试结果显示,以单词为单位的按序输入比以句子为单位的按序输入准确率高2%左右;此外,在基本的模型之上加入多层注意力转移的推理结构后准确率提升了8%左右。 展开更多
关键词 深度学习 机器阅读理解 注意力 bi-lstm
下载PDF
基于神经网络的文本表示模型新方法 被引量:18
10
作者 曾谁飞 张笑燕 +1 位作者 杜晓峰 陆天波 《通信学报》 EI CSCD 北大核心 2017年第4期86-98,共13页
提出了一种改进的文本表示模型提取文本特征词向量方法。首先构建基于词典索引和所对应的词性索引的double word-embedding列表的word-embedding词向量,其次,利用在此基础上Bi-LSTM循环神经网络对生成后的词向量进一步进行特征提取,最后... 提出了一种改进的文本表示模型提取文本特征词向量方法。首先构建基于词典索引和所对应的词性索引的double word-embedding列表的word-embedding词向量,其次,利用在此基础上Bi-LSTM循环神经网络对生成后的词向量进一步进行特征提取,最后,通过mean-pooling层处理句子向量后且使用了softmax层进行文本分类。实验验证了Bi-LSTM和double word-embedding神经网络相结合的模型训练效果与提取情况。实验结果表明,该模型不但能较好地处理高质量的文本特征向量提取和表达序列,而且比LSTM、LSTM+context window和Bi-LSTM这3种神经网络有较明显的表达效果。 展开更多
关键词 神经网络 词向量 bi-lstm 文本表示
下载PDF
基于CRF和BI-LSTM的命名实体识别方法 被引量:16
11
作者 柏兵 侯霞 石松 《北京信息科技大学学报(自然科学版)》 2018年第6期27-33,共7页
针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文... 针对传统命名实体识别需要大量人工及规则信息的问题,提出一种基于条件随机场(conditional random field, CRF)和双向长短时记忆(bi-directional long short-term memory, BI-LSTM)神经网络的命名实体识别方法。其中,CRF模型在进行中文分词的时候考虑到了未登录词的问题,具备较好的学习能力;双向长短期神经网络能够很好地保留上下文信息的特性。通过使用北京大学标注的1998年人民日报语料库对所提方法进行实验,结果表明:Dropout参数对命名实体识别的效果存在积极影响;同时当Dropout参数取不变时,双向LSTM模型比单向LSTM模型(long short-term memory, LSTM)在中文命名实体识别任务中取得了更好的识别效果。 展开更多
关键词 命名实体识别 条件随机场 bi-lstm
下载PDF
基于BI-LSTM的小样本滚动轴承故障诊断方法研究 被引量:16
12
作者 范宇雪 王江文 +2 位作者 梅桂明 邱江洋 刘晓龙 《噪声与振动控制》 CSCD 2020年第4期103-108,共6页
微弱故障特征的有效提取与判别模型的精确性是滚动轴承状态监测和故障诊断的关键。针对长短时记忆网络(LSTM)模型在少样本条件下存在故障诊断准确度较低的问题,提出一种基于双向长短时记忆网络(BI-LSTM)的小样本滚动轴承故障诊断方法:... 微弱故障特征的有效提取与判别模型的精确性是滚动轴承状态监测和故障诊断的关键。针对长短时记忆网络(LSTM)模型在少样本条件下存在故障诊断准确度较低的问题,提出一种基于双向长短时记忆网络(BI-LSTM)的小样本滚动轴承故障诊断方法:首先采用自适应白噪声的集合经验模态分解(CEEMDAN)与傅里叶变换对信号进行分解变换构成特征矩阵,然后采用BI-LSTM进行特征提取,获取每个样本序列的故障特征,最后采用逻辑回归(LR)将多个故障特征汇总学习。结果表明:所提出的方法在随机的小样本测试集上平均精确度相对传统LSTM模型提高30.8%,可为滚动轴承健康状态监测提供重要算法支撑。 展开更多
关键词 故障诊断 CEMMDAN bi-lstm LR 轴承 傅里叶变换
下载PDF
科技政策知识图谱构建研究 被引量:14
13
作者 张雨 吴俊 《数字图书馆论坛》 CSSCI 2021年第8期31-38,共8页
为助力广大中小企业快速查新,亟需使用人工智能手段对科技政策文本知识建模,构建基于知识图谱的结构化查询。本研究以采集到的全国26660条科技政策文本为数据源,首先构建科技政策知识本体,之后通过Bi-LSTM深度学习模型完成三元组抽取,... 为助力广大中小企业快速查新,亟需使用人工智能手段对科技政策文本知识建模,构建基于知识图谱的结构化查询。本研究以采集到的全国26660条科技政策文本为数据源,首先构建科技政策知识本体,之后通过Bi-LSTM深度学习模型完成三元组抽取,最后应用Neo4j图数据库完成知识存储与图谱化检索。所构建的科技政策知识图谱共有4万余个实体节点、15万余条关系,能够实现不同细粒度政策实体和关系的关联查询与可视化。这种基于科技政策本体构建政策知识图谱的方法既拓展了垂直领域知识图谱的新思路,也为开拓基于互联网的科技政策智能问答奠定基础。 展开更多
关键词 知识图谱 科技政策 本体 bi-lstm
下载PDF
基于多元因素的Bi-LSTM高速公路交通流预测 被引量:12
14
作者 张维 袁绍欣 +2 位作者 陶建军 周晨蓉 阿合提·杰恩斯 《计算机系统应用》 2021年第6期184-190,共7页
针对影响高速公路交通流量因素多样而复杂的问题,提出了一种基于多元因素的Bi-LSTM (双向长短期记忆网络)高速公路交通流预测模型.首先对原始数据进行清理和相关性分析,提高研究准确性,降低数据维度;其次,基于时间滑动窗口,构建多元因... 针对影响高速公路交通流量因素多样而复杂的问题,提出了一种基于多元因素的Bi-LSTM (双向长短期记忆网络)高速公路交通流预测模型.首先对原始数据进行清理和相关性分析,提高研究准确性,降低数据维度;其次,基于时间滑动窗口,构建多元因素交通流时序矩阵,并以MAE与RMSE为评估指标,训练优化Bi-LSTM交通流预测模型.本模型同时考虑了天气状况、节假日、收费情况等高相关度影响因素,及交通流前序、后序变化的影响.以陕西省高速公路收费数据为实验对象,结果表明:与GRU和LSTM两种神经网络相比较,本模型在高速公路短期交通流预测中的适用性更强、精确度更高. 展开更多
关键词 lstm GRU bi-lstm 交通流 多元因素
下载PDF
基于深度学习的情报分析方法识别研究——以安全情报领域为例 被引量:15
15
作者 肖连杰 孟涛 +1 位作者 王伟 吴志祥 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第10期20-28,共9页
【目的】对安全情报领域情报分析方法进行识别、归纳与总结,为构建安全情报领域情报分析方法体系提供参考。【方法】以安全情报领域文献为数据来源,对文献全文本进行汉字级的语料标注,构建安全情报领域情报分析方法语料库,在此基础上利... 【目的】对安全情报领域情报分析方法进行识别、归纳与总结,为构建安全情报领域情报分析方法体系提供参考。【方法】以安全情报领域文献为数据来源,对文献全文本进行汉字级的语料标注,构建安全情报领域情报分析方法语料库,在此基础上利用深度学习模型对情报分析方法实体进行识别。【结果】在安全情报领域情报分析方法语料库上进行实体识别对比实验,BiLSTM模型的情报分析方法实体识别准确率81.71%,召回率77.26%,F1值79.36%;BiLSTM-CRF模型的情报分析方法实体识别准确率84.71%,召回率79.25%,F1值81.83%。【局限】未考虑句子中包含情报分析方法的指代名词,可能会对统计结果产生一定的影响。【结论】利用深度学习方法对安全情报领域情报分析方法实体进行识别是可行且有效的。 展开更多
关键词 安全情报 情报分析方法 实体识别 双向长短时记忆网络 条件随机场
原文传递
基于BERT的文本情感分析方法的研究 被引量:14
16
作者 方英兰 孙吉祥 韩兵 《信息技术与信息化》 2020年第2期108-111,共4页
情感分析是自然语言处理的热门研究内容之一。文本情感分析方法主要分为三类:基于情感词典的情感分析、基于机器学习的情感分析及基于深度学习的情感分析。其中,基于深度学习的情感分析步骤为:文本预处理、生成词向量、送入深度模型进... 情感分析是自然语言处理的热门研究内容之一。文本情感分析方法主要分为三类:基于情感词典的情感分析、基于机器学习的情感分析及基于深度学习的情感分析。其中,基于深度学习的情感分析步骤为:文本预处理、生成词向量、送入深度模型进行训练。针对传统的词向量生成方式不能很好地捕捉文本的双向语义特征,BERT预训练模型通过真正的双向模型可以捕捉到文本的更完整的特征。本文在此基础上设计并建立BERT+Bi-LSTM+Attention情感分析模型,在商品评论数据集上对其情感倾向性进行分析。与传统的情感词典、Bi-LSTM+Attention深度学习算法在同一应用场景下从精度和召回率两个评价标准进行了对比。实验结果表明本文采用的BERT+Bi-LSTM+Attention模型在所有测试模型中具有较高的精度。 展开更多
关键词 情感分析 BERT bi-lstm 注意力机制
下载PDF
基于空间特征的BI-LSTM人体行为识别 被引量:12
17
作者 付仔蓉 吴胜昔 +1 位作者 吴潇颖 顾幸生 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2021年第2期225-232,共8页
随着微软Kinect等深度相机的出现,使用具有简洁性、鲁棒性和视图无关表示的3D骨架节点数据来识别人体行为的方法获得了很好的效果,但现有的针对骨骼序列数据的大多数学习方法缺少空间结构信息和详细的时空动态信息。利用双向长短期记忆... 随着微软Kinect等深度相机的出现,使用具有简洁性、鲁棒性和视图无关表示的3D骨架节点数据来识别人体行为的方法获得了很好的效果,但现有的针对骨骼序列数据的大多数学习方法缺少空间结构信息和详细的时空动态信息。利用双向长短期记忆网络(BI-LSTM)模型能长时间存储骨骼序列的特点获得丰富的双向时间信息对动作的顺序进行建模,同时从3D骨骼关节点坐标中提取关节点之间的相对距离特征和相对角度特征来加强空间结构特征,完成从骨骼数据中实现人体行为识别。该方法有效地进行了人体行为动作分类,提高了识别准确性。 展开更多
关键词 行为识别 骨骼数据 距离特征 角度特征 bi-lstm
下载PDF
基于Multi-head Attention和Bi-LSTM的实体关系分类 被引量:12
18
作者 刘峰 高赛 +1 位作者 于碧辉 郭放达 《计算机系统应用》 2019年第6期118-124,共7页
关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采... 关系分类是自然语言处理领域的一项重要任务,能够为知识图谱的构建、问答系统和信息检索等提供技术支持.与传统关系分类方法相比较,基于神经网络和注意力机制的关系分类模型在各种关系分类任务中都获得了更出色的表现.以往的模型大多采用单层注意力机制,特征表达相对单一.因此本文在已有研究基础上,引入多头注意力机制(Multi-head attention),旨在让模型从不同表示空间上获取关于句子更多层面的信息,提高模型的特征表达能力.同时在现有的词向量和位置向量作为网络输入的基础上,进一步引入依存句法特征和相对核心谓词依赖特征,其中依存句法特征包括当前词的依存关系值和所依赖的父节点位置,从而使模型进一步获取更多的文本句法信息.在SemEval-2010 任务8 数据集上的实验结果证明,该方法相较之前的深度学习模型,性能有进一步提高. 展开更多
关键词 关系分类 bi-lstm 句法特征 self-attention multi-head ATTENTION
下载PDF
新时代人民日报分词语料库构建、性能及应用(二)——深度学习自动分词模型构建 被引量:9
19
作者 黄水清 王东波 《图书情报工作》 CSSCI 北大核心 2019年第23期5-12,共8页
[目的/意义]在新时代人民日报分词语料库的基础上构建的深度学习自动分词模型,不仅有助于为高性能分词模型的构建提供经验,也可以借助具体的自然语言处理研究任务验证深度学习相应模型的性能。[方法/过程]在介绍双向长短时记忆模型(Bi-L... [目的/意义]在新时代人民日报分词语料库的基础上构建的深度学习自动分词模型,不仅有助于为高性能分词模型的构建提供经验,也可以借助具体的自然语言处理研究任务验证深度学习相应模型的性能。[方法/过程]在介绍双向长短时记忆模型(Bi-LSTM)和双向长短时记忆与条件随机场融合模型(Bi-LSTM-CRF)的基础上,阐明汉语分词语料预处理、评价指标和参数与硬件平台的过程、种类和情况,分别构建Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型,并对模型的整体性能进行分析。[结果/结论]从精准率、召回率和调和平均值3个指标上看,所构建的Bi-LSTM和Bi-LSTM-CRF汉语自动分词模型的整体性能相对较为合理。在具体性能上,Bi-LSTM分词模型优于Bi-LSTM-CRF分词模型,但这一差距非常细微。 展开更多
关键词 新时代人民日报分词语料 语料库 自动分词 深度学习 bi-lstm bi-lstm-CRF
原文传递
融合关键对象识别与深层自注意力的Bi-LSTM情感分析模型 被引量:11
20
作者 李磊 吴旭辉 刘继 《小型微型计算机系统》 CSCD 北大核心 2021年第3期504-509,共6页
在线评论文本通常涉及多个评价对象,对象的表达方式有显式和隐式之分,针对不同对象的情感倾向可能不会完全一致.关键评价对象是评论中最受关注的对象,其相应的情感语义对整条评论的情感观点起主导作用.本文构建了融合关键对象识别与深... 在线评论文本通常涉及多个评价对象,对象的表达方式有显式和隐式之分,针对不同对象的情感倾向可能不会完全一致.关键评价对象是评论中最受关注的对象,其相应的情感语义对整条评论的情感观点起主导作用.本文构建了融合关键对象识别与深层自注意力机制的Bi-LSTM模型,以提升短文本情感分类的效果.使用CNN处理文本,基于卷积层输出结果识别关键评价对象,并在此基础上完成深层自注意力的学习.将对象信息与文本信息进行融合,利用注意力机制强化的Bi-LSTM模型得到评论文本的情感分类结果.在酒店评论数据集上进行实验,与之前基于深度学习的模型相比,本文方法在精确率、召回率和F-score评价指标方面均有更好的表现. 展开更多
关键词 关键评价对象 自注意力机制 bi-lstm 情感分析
下载PDF
上一页 1 2 23 下一页 到第
使用帮助 返回顶部