为提高新能源汽车领域术语抽取准确率,面向新能源汽车专利文本提出一种领域术语抽取模型。传统的领域术语抽取方法过度依赖人工定义特征和领域知识,无法自动挖掘隐含特征,其识别性能过度依赖所选特征的质量。从深度学习的角度出发,提出...为提高新能源汽车领域术语抽取准确率,面向新能源汽车专利文本提出一种领域术语抽取模型。传统的领域术语抽取方法过度依赖人工定义特征和领域知识,无法自动挖掘隐含特征,其识别性能过度依赖所选特征的质量。从深度学习的角度出发,提出了一种基于attention的双向长短时记忆网络(bidirectional long short-term memory,BLSTM)与条件随机场(conditional random fields,CRF)相结合的领域术语抽取模型(BLSTM_attention_CRF模型),并使用基于词典与规则相结合的方法对结果进行校正,准确率可达到86%以上,方法切实可行。展开更多
为了给数控机床故障的精准诊断提供保障,延长数控机床使用周期,以数控机床历史维修记录为研究对象,对数控机床设备故障领域的命名实体识别进行了研究.在分析历史维修记录中的故障描述特点后,提出了一种基于双向长短期记忆网络(Bidirecti...为了给数控机床故障的精准诊断提供保障,延长数控机床使用周期,以数控机床历史维修记录为研究对象,对数控机床设备故障领域的命名实体识别进行了研究.在分析历史维修记录中的故障描述特点后,提出了一种基于双向长短期记忆网络(Bidirectional long short-term memory, BLSTM)与具有回路的条件随机场(Conditional random field with loop, L-CRF)相结合的命名实体识别方法.首先,对输入语句进行分词和标注,使用Word2vec中的Skip-gram模型对标注语料进行预训练,将其生成的字向量通过词嵌入层转化为字向量序列;然后,将字向量序列输入BLSTM学习长期依赖信息;最后将句子表达输入L-CRF获取全局最优序列.实验结果表明,该方法明显优于其他命名实体识别方法,为数控机床设备的智能检修与实时诊断任务打下了坚实的基础.展开更多
为了减少文本情感分析方法中对分词准确性的依赖程度,同时,也为了解决一词多义的问题,提出了一种基于BERT和双向长短时记忆网络(BiLSTM)的文本情感分类模型.首先,该模型采用BERT(Bidirectional Encode,Representation from Transformers...为了减少文本情感分析方法中对分词准确性的依赖程度,同时,也为了解决一词多义的问题,提出了一种基于BERT和双向长短时记忆网络(BiLSTM)的文本情感分类模型.首先,该模型采用BERT(Bidirectional Encode,Representation from Transformers,BERT)预训练的字向量替代传统方式训练的词向量,然后利用BiLSTM对文本上下文进行关系特征提取,最后再利用Softmax分类器获得文本所属情感类别.实验证明,与LSTM、BiLSTM、TextCNN和BERT-LSTM模型相比,该模型在综合评价指标F1上分别提高了6.78%、6.74%、2.52%和1.01%;测试集正确率分别提升了6.66%、6.31%、1.95%和0.85%.展开更多
文摘为提高新能源汽车领域术语抽取准确率,面向新能源汽车专利文本提出一种领域术语抽取模型。传统的领域术语抽取方法过度依赖人工定义特征和领域知识,无法自动挖掘隐含特征,其识别性能过度依赖所选特征的质量。从深度学习的角度出发,提出了一种基于attention的双向长短时记忆网络(bidirectional long short-term memory,BLSTM)与条件随机场(conditional random fields,CRF)相结合的领域术语抽取模型(BLSTM_attention_CRF模型),并使用基于词典与规则相结合的方法对结果进行校正,准确率可达到86%以上,方法切实可行。
文摘为了给数控机床故障的精准诊断提供保障,延长数控机床使用周期,以数控机床历史维修记录为研究对象,对数控机床设备故障领域的命名实体识别进行了研究.在分析历史维修记录中的故障描述特点后,提出了一种基于双向长短期记忆网络(Bidirectional long short-term memory, BLSTM)与具有回路的条件随机场(Conditional random field with loop, L-CRF)相结合的命名实体识别方法.首先,对输入语句进行分词和标注,使用Word2vec中的Skip-gram模型对标注语料进行预训练,将其生成的字向量通过词嵌入层转化为字向量序列;然后,将字向量序列输入BLSTM学习长期依赖信息;最后将句子表达输入L-CRF获取全局最优序列.实验结果表明,该方法明显优于其他命名实体识别方法,为数控机床设备的智能检修与实时诊断任务打下了坚实的基础.
文摘为了减少文本情感分析方法中对分词准确性的依赖程度,同时,也为了解决一词多义的问题,提出了一种基于BERT和双向长短时记忆网络(BiLSTM)的文本情感分类模型.首先,该模型采用BERT(Bidirectional Encode,Representation from Transformers,BERT)预训练的字向量替代传统方式训练的词向量,然后利用BiLSTM对文本上下文进行关系特征提取,最后再利用Softmax分类器获得文本所属情感类别.实验证明,与LSTM、BiLSTM、TextCNN和BERT-LSTM模型相比,该模型在综合评价指标F1上分别提高了6.78%、6.74%、2.52%和1.01%;测试集正确率分别提升了6.66%、6.31%、1.95%和0.85%.