期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于改进ERNIE-DPCNN模型的中文文本分类 被引量:4
1
作者 牛玉婷 陈伯琪 陈彬 《江苏师范大学学报(自然科学版)》 CAS 2021年第1期47-52,共6页
利用自然语言处理中一种基于字向量的增强语言表征模型--ERNIE,通过随机隐藏部分字、词组、实体语义单元,预测上下文实现语言表征,并将ERNIE预训练模型输出的词向量输入到改进的DPCNN模型,形成改进的ERNIE-DPCNN模型,用于中文文本分类.... 利用自然语言处理中一种基于字向量的增强语言表征模型--ERNIE,通过随机隐藏部分字、词组、实体语义单元,预测上下文实现语言表征,并将ERNIE预训练模型输出的词向量输入到改进的DPCNN模型,形成改进的ERNIE-DPCNN模型,用于中文文本分类.通过实例将改进的ERNIE-DPCNN模型与ERNIE、BERT、BERT-DPCNN、ERNIE-CNN、ERNIE-RNN、ERNIE-DPCNN 6类模型在准确率、精确率、召回率、运行时间等指标上进行对比,结果表明,改进的ERNIE-DPCNN模型均优于其他模型. 展开更多
关键词 文本分类 ERNIE模型 dpcnn模型 改进的ERNIE-dpcnn模型 BERT模型
下载PDF
基于ERNIE及改进DPCNN的棉花病虫害问句意图识别
2
作者 李东亚 白涛 +2 位作者 香慧敏 戴硕 王震鲁 《山东农业科学》 北大核心 2024年第6期143-151,共9页
针对目前没有公开的棉花病虫害相关问句数据集且问句较短、类型多样等问题,本研究通过查阅文献及咨询相关领域专家,构建了棉花病虫害问句数据集CQCls,定义了78种棉花病虫害实体和9种问句类型;同时提出了一种基于ERNIE预训练模型的棉花... 针对目前没有公开的棉花病虫害相关问句数据集且问句较短、类型多样等问题,本研究通过查阅文献及咨询相关领域专家,构建了棉花病虫害问句数据集CQCls,定义了78种棉花病虫害实体和9种问句类型;同时提出了一种基于ERNIE预训练模型的棉花病虫害问句意图识别模型,首先通过ERNIE模型将输入问句映射到向量空间,使用融合词位置信息的DPCNN模型进行特征向量的抽取,与基础的DPCNN模型相比,通过融合词位置信息能有效提高模型的表达能力,然后经过Softmax得到最终结果。实验结果表明,本研究提出的意图识别模型相较于其他模型取得了较好的结果,宏平均和加权平均的F1分数值分别为97.45%和97.31%;在文本语料数据内容复杂多样且文本格式不规范的DMSCD数据集上,训练结果中不同类别的F1分数的权重平均也能达到73.42%,进一步证明了该模型的有效性及泛化能力。 展开更多
关键词 棉花病虫害 问句意图识别 ERNIE模型 dpcnn模型 词位置信息
下载PDF
基于预训练模型融合深层特征词向量的中文文本分类 被引量:1
3
作者 汤英杰 刘媛华 《上海理工大学学报》 CAS CSCD 北大核心 2023年第2期189-197,204,共10页
为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语... 为解决传统模型表示出的词向量存在序列、上下文、语法、语义以及深层次的信息表示不明的情况,提出一种基于预训练模型(Roberta)融合深层特征词向量的深度神经网络模型,处理中文文本分类的问题。通过Roberta模型生成含有上下文语义、语法信息的句子向量和含有句子结构特征的词向量,使用DPCNN模型和改进门控模型(RGRU)对词向量进行特征提取和融合,得到含有深层结构和局部信息的特征词向量,将句子向量与特征词向量融合在一起得到新向量。最后,新向量经过softmax激活层后,输出结果。在实验结果中,以F1值、准确率、召回率为评价标准,在THUCNews长文本中,这些指标分别达到了98.41%,98.44%,98.41%。同时,该模型在短文本分类中也取得了很好的成绩。 展开更多
关键词 预训练模型 Roberta模型 dpcnn模型 特征词向量 中文文本分类
下载PDF
基于DPCNN模型与语句特征融合的汉语因果类复句关系自动识别 被引量:1
4
作者 杨进才 曹元 胡泉 《中文信息学报》 CSCD 北大核心 2022年第9期19-27,共9页
汉语复句关系识别是对复句语义关系的识别,复句关系类别的自动识别对促进语言学和中文信息处理的研究有重要的价值。因果类复句是使用频率最高的复句,文中以二句式有标广义因果复句为研究对象,使用语言技术平台LTP进行依存句法分析,获... 汉语复句关系识别是对复句语义关系的识别,复句关系类别的自动识别对促进语言学和中文信息处理的研究有重要的价值。因果类复句是使用频率最高的复句,文中以二句式有标广义因果复句为研究对象,使用语言技术平台LTP进行依存句法分析,获得词性、依存父节点的词序、与父节点的依存关系等特征,将特征的不同组合与预训练的词向量拼接,得到新的向量,将新的向量输入到DPCNN模型中来进行关系类别识别。通过实验对提出的方法进行检验,实验结果显示:与未融合任何特征相比,DPCNN模型中融合语句特征使实验结果的指标均有提升,表明融合语句特征能取得更好的识别效果。在各种特征组合中,融合POS特征组合得到的准确度和F_(1)值最高,分别为98.41%,98.28%。 展开更多
关键词 因果类复句 关系识别 词向量 dpcnn模型 依存句法
下载PDF
基于BERT和DPCNN的电商客服对话意图分类
5
作者 曾伟桂 段中钰 《北京信息科技大学学报(自然科学版)》 2022年第2期93-98,共6页
针对消费者在与电商客服对话过程中的意图分类问题,提出了一种基于BERT词嵌入结合DPCNN模型及自注意力机制的BDCA深度学习算法。该算法采用BERT模型作为用户意图文本的词嵌入层进行预训练的词向量表示,借助DPCNN模型结构获得文本更全局... 针对消费者在与电商客服对话过程中的意图分类问题,提出了一种基于BERT词嵌入结合DPCNN模型及自注意力机制的BDCA深度学习算法。该算法采用BERT模型作为用户意图文本的词嵌入层进行预训练的词向量表示,借助DPCNN模型结构获得文本更全局的特征,同时结合自注意力机制和卷积神经网络提取文本的关键词特征,最后拼接融合两组特征输入到Softmax分类器进行分类。通过与TextCNN、BiGRU等语言模型在测试集上的对比实验,验证了该算法在电商客服对话意图分类上的有效性。 展开更多
关键词 BERT模型 dpcnn模型 自注意力机制 意图分类
下载PDF
基于知识图谱联合ERNIE-DPCNN模型的药品不良反应自动关联性评价方法研究
6
作者 贾晋生 刘红亮 +2 位作者 王青 侯永芳 李馨龄 《中国药物警戒》 2024年第2期163-166,180,共5页
目的 针对当前药品不良反应关联性评价存在的效率较低和主观性评估问题,通过建立药品不良反应关联性评价模型,探索药品不良反应自动关联性评价方法。方法 利用文献及互联网来源,对获取的不良反应报告标注数据(7 301条)进行知识抽取,构... 目的 针对当前药品不良反应关联性评价存在的效率较低和主观性评估问题,通过建立药品不良反应关联性评价模型,探索药品不良反应自动关联性评价方法。方法 利用文献及互联网来源,对获取的不良反应报告标注数据(7 301条)进行知识抽取,构建药品不良反应知识图谱,建立知识驱动的ERNIE-DPCNN自动关联性评价模型。结果 提出的知识图谱联合ERNIE-DPCNN模型在测试集中的精确度、召回率和F1值分别达到82.18%、81.40%、81.21%,相对于其他基线模型各项评估指标均取得了最高值。结论 知识图谱联合ERNIE-DPCNN模型的方法能提高药品不良反应关联性评价效率,具备较强的准确性,并在一定程度上减少主观性评估误差,对基于人工智能的自动化评价有一定参考价值。 展开更多
关键词 药品不良反应 ERNIE-dpcnn模型 知识图谱 关联性评价 文本分类 深度学习 人工智能
下载PDF
基于ERNIE-DPCNN模型的地址清洗匹配方法研究
7
作者 陈寅 马佳斌 《地矿测绘》 2022年第4期7-11,共5页
大规模地址数据的词向量特征维度较高,导致地址清洗过程中存在一定的误差。为此,文章研究了基于ERNIE-DPCNN模型的地址清洗匹配方法。该方法利用数据准备层获取地址街道、POI等地址数据后,将其传输至逻辑计算层内;逻辑计算层使用ERNIE-D... 大规模地址数据的词向量特征维度较高,导致地址清洗过程中存在一定的误差。为此,文章研究了基于ERNIE-DPCNN模型的地址清洗匹配方法。该方法利用数据准备层获取地址街道、POI等地址数据后,将其传输至逻辑计算层内;逻辑计算层使用ERNIE-DPCNN模型获取地址词向量特征,然后对该地址词向量特征进行地址分词匹配处理;将地址分词匹配结果输入到地址匹配引擎层内,生成行政区、街道等门牌索引;应用层使用Web服务器通过行政区、街道等门牌索引获取地址清洗匹配结果。实验结果表明:该方法可有效对地址数据字段进行清洗,最大程度地保留地址数据字段特征。该方法能在保证地址匹配结果较为精确的同时匹配到地址的行政区划分,应用效果较好。 展开更多
关键词 ERNIE-dpcnn模型 地址清洗匹配 词向量 向量维度 数据字段
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部