期刊文献+
共找到4篇文章
< 1 >
每页显示 20 50 100
基于ELMo和Transformer混合模型的情感分析 被引量:16
1
作者 赵亚欧 张家重 +1 位作者 李贻斌 王玉奎 《中文信息学报》 CSCD 北大核心 2021年第3期115-124,共10页
针对循环神经网络模型无法直接提取句子的双向语义特征,以及传统的词嵌入方法无法有效表示一词多义的问题,该文提出了基于ELMo和Transformer的混合模型用于情感分类。首先,该模型利用ELMo模型生成词向量。基于双向LSTM模型,ELMo能够在... 针对循环神经网络模型无法直接提取句子的双向语义特征,以及传统的词嵌入方法无法有效表示一词多义的问题,该文提出了基于ELMo和Transformer的混合模型用于情感分类。首先,该模型利用ELMo模型生成词向量。基于双向LSTM模型,ELMo能够在词向量中进一步融入词语所在句子的上下文特征,并能针对多义词的不同语义生成不同的语义向量。然后,将得到的ELMo词向量输入Transformer模型进行情感分类。为了实现分类,该文修改了Transformer的Encoder和Decoder结构。ELMo和Transformer的混合模型是循环神经网络和自注意力的组合,两种结构可从不同侧面提取句子的语义特征,得到的语义信息更加全面、丰富。实验结果表明,该方法与当前主流方法相比,在NLPCC2014 Task2数据集上分类正确率提高了3.52%;在酒店评论的4个子数据集上分类正确率分别提高了0.7%、2%、1.98%和1.36%。 展开更多
关键词 情感分析 elmo模型 Transformer模型 多头自注意力机制 自然语言处理
下载PDF
基于ELMo-TextCNN的网络欺凌检测模型 被引量:2
2
作者 叶水欢 葛寅辉 +1 位作者 陈波 于泠 《信息安全研究》 CSCD 2023年第9期868-876,共9页
网络欺凌检测是网络空间信息内容安全的重要研究内容,也关乎青少年在线安全.针对目前网络欺凌检测方案存在的训练样本少、难以处理多义词、分类性能不太理想等问题,提出一种ELMo-TextCNN检测模型.该模型首先采用迁移学习思想,利用预训练... 网络欺凌检测是网络空间信息内容安全的重要研究内容,也关乎青少年在线安全.针对目前网络欺凌检测方案存在的训练样本少、难以处理多义词、分类性能不太理想等问题,提出一种ELMo-TextCNN检测模型.该模型首先采用迁移学习思想,利用预训练的ELMo(embeddings from language models)生成动态词向量,不仅解决了网络欺凌样本规模小的问题,而且由于ELMo采用了双向长短期记忆(bi-directional long short-term memory,BiLSTM)网络结构,会根据上下文推断每个词对应的词向量,能够根据语境理解多义词.该模型再通过擅长处理短文本数据的TextCNN(text convolutional neural network)提取文本特征,最后经过全连接层输出分类结果.实验结果证明,提出的ELMo-TextCNN检测方法能够处理一词多义,并获得更好的分类检测效果. 展开更多
关键词 网络欺凌检测 深度学习 迁移学习 elmo模型 TextCNN模型
下载PDF
基于联合向量和神经网络的事件因果关系抽取
3
作者 廖涛 王旭 《安徽理工大学学报(自然科学版)》 CAS 2022年第1期85-92,共8页
事件关系抽取是自然语言处理领域中一项重要的语义处理任务。针对当前事件因果关系抽取研究中存在词汇特征不符合上下文语境、语义特征不足等问题,提出了基于联合词向量和Attention-BiGRU网络的事件因果关系抽取方法。该方法把因果关系... 事件关系抽取是自然语言处理领域中一项重要的语义处理任务。针对当前事件因果关系抽取研究中存在词汇特征不符合上下文语境、语义特征不足等问题,提出了基于联合词向量和Attention-BiGRU网络的事件因果关系抽取方法。该方法把因果关系抽取转化为分类问题,首先利用word2vec和ELMO模型对CEC语料进行表示,形成事件关系对的文本表示模型,以获取词向量矩阵及考虑文本语境的动态词特征,从而构成联合向量;然后利用Attention-BiGRU网络,深层提取语义特征信息,并对特征进行权重调整,突出重要词汇对因果关系抽取的贡献;最后将加权特征输入softmax分类器进而完成事件因果关系的抽取。在数据集上进行对比实验,该方法取得了88.56%的F1值,结果表明所提出方法的有效性。 展开更多
关键词 事件关系 因果关系抽取 BiGRU网络 注意力机制 elmo模型
下载PDF
一种基于改进ELMO模型的组织机构名识别方法
4
作者 胡万亭 郭建英 张继永 《计算机技术与发展》 2020年第11期25-29,共5页
组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对... 组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对这一问题,改进ELMO(embedding from language models)预训练模型,结合双向LSTM神经网络模型和条件随机场模型,去识别组织机构名。对于ELMO的改进,主要通过筛选高频机构词,然后将高频机构词加入中文字典,通过ELMO模型训练生成机构词向量和普通字向量。字向量不用考虑未登录词的问题,机构词向量引入了先验知识,结合起来可以使得生成的字词向量能够更好地表征组织机构名。实验结果表明,预训练模型的数据集相对较小时,该方法比字向量嵌入的方法有更好的效果,F1值提高了1.3%。 展开更多
关键词 elmo模型 LSTM模型 机构词 条件随机场 组织机构名识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部