期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于BERT的医疗电子病历命名实体识别 被引量:17
1
作者 梁文桐 朱艳辉 +1 位作者 詹飞 冀相冰 《湖南工业大学学报》 2020年第4期54-62,共9页
针对中文医疗电子病历命名实体识别中,传统的字或词向量无法很好地表示上下文语义以及传统RNN并行计算能力不足等问题,提出了一个基于BERT的医疗电子病历命名实体识别模型。该模型中的BERT预训练语言模型可以更好地表示电子病历句子中... 针对中文医疗电子病历命名实体识别中,传统的字或词向量无法很好地表示上下文语义以及传统RNN并行计算能力不足等问题,提出了一个基于BERT的医疗电子病历命名实体识别模型。该模型中的BERT预训练语言模型可以更好地表示电子病历句子中的上下文语义,迭代膨胀卷积神经网络(IDCNN)对局部实体的卷积编码有更好的识别效果,多头注意力(MHA)多次计算每个字和所有字的注意力概率以获取电子病历句子的长距离依赖。实验结果表明,BERT-IDCNN-MHA-CRF模型能够较好地识别电子病历中的医疗实体,模型的精确率、召回率和F1值相比于基线模型分别提高了1.80%,0.41%,1.11%。 展开更多
关键词 电子病历 命名实体识别 BERT 膨胀卷积神经网络 多头注意力
下载PDF
基于增强型卷积神经网络的风力发电机行星齿轮箱故障诊断方法 被引量:5
2
作者 梁舒曼 谷艳玲 +1 位作者 罗园庆 陈长征 《太阳能学报》 EI CAS CSCD 北大核心 2023年第2期146-152,共7页
针对风力发电机行星齿轮箱的健康维护和状态检测难以诊断的问题,该文提出一种初始网与膨胀卷积相融合的初始膨胀卷积神经网络(IDCNN)的故障诊断研究方法。该方法首先构建初始膨胀卷积层以扩大感受野来使学习到的故障特征更加丰富。随后... 针对风力发电机行星齿轮箱的健康维护和状态检测难以诊断的问题,该文提出一种初始网与膨胀卷积相融合的初始膨胀卷积神经网络(IDCNN)的故障诊断研究方法。该方法首先构建初始膨胀卷积层以扩大感受野来使学习到的故障特征更加丰富。随后为了方便信号输入且确保信息丰富,将采用将一维原始信号序列转化为二维矩阵的预处理方法。最终将生成的二维信号输入到IDCNN中进行模型训练,并用测试数据对模型进行评估。实验结果表明,提出的IDCNN方法在风力发电机行星齿轮箱的故障诊断中精度高,在对比结果中该文提出方法的诊断精度要高于传统的深度学习方法。 展开更多
关键词 风力发电机 初始网 膨胀卷积神经网络 行星齿轮箱 故障诊断
下载PDF
基于DCNN和GLU的武器领域实体关系抽取方法 被引量:1
3
作者 李晗 侯守璐 +3 位作者 佟强 谌彤童 杨启民 刘秀磊 《计算机科学》 CSCD 北大核心 2023年第S01期48-54,共7页
武器领域的非结构化文本数据通常十分复杂,单句内可能存在“一武器与多个武器相关联”或“两武器之间存在多种关系”等情况,为此提出基于膨胀卷积神经网络和门控线性单元的实体关系抽取方法以处理该类型数据中存在的关系重叠问题。该方... 武器领域的非结构化文本数据通常十分复杂,单句内可能存在“一武器与多个武器相关联”或“两武器之间存在多种关系”等情况,为此提出基于膨胀卷积神经网络和门控线性单元的实体关系抽取方法以处理该类型数据中存在的关系重叠问题。该方法将拼接了词向量和位置向量的句子编码向量传入带有门控机制的膨胀卷积神经网络模型,引入可以快速抽取句内命名实体特征信息的自注意力机制,通过分层次的序列标注方式识别出句中全部实体以及每个主实体对应的所有关系和客实体,进而生成武器领域实体关系三元组。实验结果显示,该方法在自行标注的武器领域数据集上的F1值达81.1%,具备一定的实体关系抽取能力,在不同重叠类型下的F1值均高于78%,能够解决非结构化数据的关系重叠问题,同时在公开数据集NYT上也有良好的表现。 展开更多
关键词 关系抽取 关系重叠 膨胀卷积神经网络 门控线性单元
下载PDF
基于ERNIE与多特征融合的中文命名实体识别
4
作者 陈克金 叶善力 《浙江科技学院学报》 CAS 2023年第5期421-429,456,共10页
【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integ... 【目的】在中文命名实体识别中,传统命名实体识别方法中词向量只能将其映射为单一向量,无法表征一词多义,在特征提取过程中易忽略局部特征。针对以上问题,提出一种基于知识增强语义表示(enhanced reprsentation through knowledge integration,ERNIE)与多特征融合的实体识别方法。【方法】首先,通过预训练模型ERNIE获得词向量;然后将词向量并行输入双向长短时记忆网络(bidirectional long short-term memory network,BiLSTM)与膨胀卷积神经网络(iterated dilated convolutional neural network,IDCNN)中提取特征,再将输出特征向量进行融合;最后通过条件随机场(conditional random field,CRF)解码获取最佳序列。【结果】本研究所提出的模型优于其他传统模型,在微软亚洲研究院(Microsoft Research Asia,MSRA)数据集上的F_(1)值达到了95.18%,相比基准模型BiLSTM-CRF F_(1)值提高了8.86百分点,相比ERNIE-BiLSTM-CRF模型F_(1)值提高了1.34百分点。此外,在ERNIE-BiLSTM-IDCNN-CRF中引入注意力机制后F_(1)值仅提升了0.07百分点,可见引入注意力机制对本研究所提出的模型之识别效果提升有限。【结论】本研究所提出的模型有效地提升了中文数据集上的实体识别性能,可为自然语言处理的命名实体识别研究提供参考。 展开更多
关键词 命名实体识别 ERNIE 双向长短期记忆网络 膨胀卷积神经网络 注意力机制
下载PDF
融合多网络特征提取的命名实体识别方法
5
作者 王舸 《电脑编程技巧与维护》 2023年第6期53-55,共3页
在中文命名实体识别任务中,虽然经典模型BERT-BiLSTM-CRF取得了不错的效果,编码层Bi LSTM可以有效地提取到文本的全局特征,但在建模时无法兼顾到局部空间特征。针对此问题提出了改进的BBIMC模型,采用将BiLSTM网络和IDCNN网络相结合的方... 在中文命名实体识别任务中,虽然经典模型BERT-BiLSTM-CRF取得了不错的效果,编码层Bi LSTM可以有效地提取到文本的全局特征,但在建模时无法兼顾到局部空间特征。针对此问题提出了改进的BBIMC模型,采用将BiLSTM网络和IDCNN网络相结合的方式对特征提取层进行改进,并引入多头注意力机制加强模型聚焦于关键信息特征的能力,进一步提升了模型的性能。使用预训练语言模型BERT得到动态语义向量,将动态语义向量通过BiLSTM编码得到文本序列的上下文特征;通过IDCNN融入实体附近的局部空间特征,并引入多头注意力机制获取词语间潜在的关联,使模型更加关注与实体相关的字符;结合CRF进行实体标签的最优序列标注。采用中文社区问答cMedQANER数据集进行实验,实验结果表明,改进后的模型可以捕获更丰富的语义特征,提升了模型识别实体的能力。 展开更多
关键词 命名实体识别 长短期记忆网络 膨胀卷积神经网络 多头注意力机制
下载PDF
面向配电网数据的命名实体识别
6
作者 孙宏云 李喜旺 《计算机系统应用》 2023年第2期387-393,共7页
在电力系统中,配电调度是一个复杂且统筹性较强的工作,大多依赖于工作人员的经验和主观判断,极易出现纰漏.所以急需利用智能化手段来帮助检修计划的分析与生成.命名实体识别是构建配电网知识图谱以及问答系统等任务的关键技术,它能够将... 在电力系统中,配电调度是一个复杂且统筹性较强的工作,大多依赖于工作人员的经验和主观判断,极易出现纰漏.所以急需利用智能化手段来帮助检修计划的分析与生成.命名实体识别是构建配电网知识图谱以及问答系统等任务的关键技术,它能够将非结构化数据中的命名实体识别出来.针对配电检修数据的复杂性及强关联性等特点,本文采用BERT-IDCNN-BiLSTM-CRF深度学习模型.该模型相较于传统的BERT-BiLSTM-CRF模型,融入IDCNN神经网络模型,更好地利用GPU的性能,在保证识别准确率的前提下,提高效率.通过对标注好的检修计划数据进行训练,并与其他常用模型对比,在召回率、精确率以及F1值3个指标上,本文提出的模型均达到最优的效果,F1值可以达到83.1%,该模型在配电网数据识别任务上取得了很好的效果. 展开更多
关键词 命名实体识别 配电网 膨胀卷积神经网络 双向长短期记忆网络 条件随机场
下载PDF
基于膨胀卷积神经网络的中文医疗命名实体识别研究 被引量:3
7
作者 胡海洋 赵从朴 +3 位作者 马琏 姜会珍 张晶 朱卫国 《医学信息学杂志》 CAS 2021年第9期39-44,共6页
介绍国内外电子病历命名实体识别研究现状,阐述基于注意力机制和膨胀卷积神经网络的电子病历命名实体识别模型构建方法、结构以及实验环境、具体设计和结果,实验表明该模型具有更好的命名实体识别效果。
关键词 命名实体识别 膨胀卷积神经网络 字嵌入 自然语言处理
下载PDF
基于词典与字向量融合的井控领域命名实体识别 被引量:1
8
作者 吴雅娟 牛甲奎 +1 位作者 解红涛 马宁 《海南大学学报(自然科学版)》 CAS 2022年第2期125-133,共9页
为了解决面向井控领域的命名实体识别容易受分词信息的影响以及在特征提取过程中忽略部分局部特征的问题,提出一种基于词典与字向量融合的CW-NER实体识别模型.该方法首先利用井控领域词典对语料进行分词、标注,映射为低维向量,与经过特... 为了解决面向井控领域的命名实体识别容易受分词信息的影响以及在特征提取过程中忽略部分局部特征的问题,提出一种基于词典与字向量融合的CW-NER实体识别模型.该方法首先利用井控领域词典对语料进行分词、标注,映射为低维向量,与经过特征提取后的字向量进行拼接融合,获得更丰富的词向量表示;其次将词向量分别输入双向长短时记忆网络(BiLSTM)与膨胀卷积神经网络模型(IDCNN)中提取特征,并将输出特征合并,利用多头自注意力机制(Multi-headed Self-attention)来捕获向量间的权重等信息;最后,经过条件随机场(CRF)对结果进行修正后输出.为验证方法的有效性,在井控领域语料集上进行了多组对比实验,实验结果表明,本文提出的命名实体识别模型均优于其他传统模型,其识别的准确率、召回率和F1值分别达到了91.31%,87.03%,89.04%. 展开更多
关键词 命名实体识 井控领域 双向长短时记忆网络 膨胀卷积神经网络 多头自注意力机制
下载PDF
基于深度卷积神经网络的CT图像层间插值方法的初步研究 被引量:1
9
作者 菅影超 马善达 王伟 《中国医学计算机成像杂志》 CSCD 北大核心 2022年第6期669-675,共7页
目的:研究一种基于CT图像层间插值的方法,用于放射治疗过程中的患者摆位验证,从而提高放疗精度。方法:采用一种基于3D卷积和膨胀卷积神经网络(3D CNN-DCNN)算法,利用相邻图像层之间的关联信息重建中间层图像。采用U-Net网络架构,通过编... 目的:研究一种基于CT图像层间插值的方法,用于放射治疗过程中的患者摆位验证,从而提高放疗精度。方法:采用一种基于3D卷积和膨胀卷积神经网络(3D CNN-DCNN)算法,利用相邻图像层之间的关联信息重建中间层图像。采用U-Net网络架构,通过编码部分的卷积层、膨胀卷积层、池化层和解码部分的上采样层、卷积层、膨胀卷积层,对CT进行端到端的学习。采集20例患者图像数据,采用留一交叉验证的方法训练验证模型,分别对神经网络和线性插值的预测CT与原始薄层CT进行对照比较。结果:3D CNN-DCNN的平均绝对误差(MAE)为34 HU,远小于线性插值的55 HU。除此之外,骨骼的Dice相似系数(DSC)为0.95,大于线性插值方法的0.89。结论:与传统线性插值方法相比,3D CNN-DCNN算法可以更准确的重建薄层CT,明显改善了插值伪影、图像失真和锯齿状现象。 展开更多
关键词 摆位验证 膨胀卷积神经网络 U-Net 留一交叉验证 平均绝对误差 Dice相似系数
下载PDF
融合动态掩码预训练与膨胀卷积的实体识别 被引量:1
10
作者 葛志辉 洪龙翔 +1 位作者 李陶深 叶进 《广西大学学报(自然科学版)》 CAS 北大核心 2022年第3期692-703,共12页
针对传统的BERT模型在使用中文语料进行预训练时无法获取词的信息问题,本文中在预训练阶段引入基于动态掩码的RoBERTa预训练模型;该预训练模型所生成的语义表示含有词的信息,能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模... 针对传统的BERT模型在使用中文语料进行预训练时无法获取词的信息问题,本文中在预训练阶段引入基于动态掩码的RoBERTa预训练模型;该预训练模型所生成的语义表示含有词的信息,能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,更适用于中文命名实体识别任务;同时通过字在上下文中能形成词的词向量对相应的字向量进行了增强;为了提高模型的效率,在序列建模层引入膨胀卷积神经网络。实验表明,该模型在多尺度上下文和结构化预测方面比传统CNN有更好的容量,在常用中文实体识别任务语料库上,验证了模型的有效性。 展开更多
关键词 实体识别 深度学习 膨胀卷积神经网络 条件随机场
下载PDF
基于领域嵌入的循环膨胀卷积神经网络评价对象抽取方法 被引量:1
11
作者 陈积常 周武 《国外电子测量技术》 北大核心 2022年第1期20-27,共8页
在评价对象抽取任务当中,基于循环神经网络的方法具有前向依赖性且未能利用图形处理器(graphics processing unit,GPU)并行计算的能力,而基于传统卷积神经网络的方法则存在语义覆盖能力有限的问题。针对所述问题,为充分发挥模型的计算... 在评价对象抽取任务当中,基于循环神经网络的方法具有前向依赖性且未能利用图形处理器(graphics processing unit,GPU)并行计算的能力,而基于传统卷积神经网络的方法则存在语义覆盖能力有限的问题。针对所述问题,为充分发挥模型的计算能力以及语义覆盖能力,首次将循环膨胀卷积神经网络应用于该任务,并融入领域嵌入特征,提出了一种基于领域嵌入的循环膨胀卷积神经网络模型(domain embedding iterated dilated convolutions neural network,DE-IDCNN)。在评价对象抽取任务数据集L14、R14、R15、R16的实验中,取得的F1值分别为81.85、80.90、72.23、73.26,与基线模型相比取得了两个数据集实验效果的领先。经进一步实验验证,DE-IDCNN模型实现了更高的计算效率以及表现出更好的语义覆盖能力。 展开更多
关键词 评价对象抽取 领域嵌入 膨胀卷积神经网络
下载PDF
基于循环和卷积神经网络融合的中文命名实体识别与应用 被引量:1
12
作者 汪小龙 吴曲宁 范佳佳 《兰州工业学院学报》 2021年第3期77-82,共6页
针对中文命名实体识别中循环神经网络不能很好地处理长序列问题,以及用单一向量去表征汉字时,由于汉字存在多义性而导致识别结果不佳的问题,提出一种识别效果更好的方法——BLDC-NER模型.首先利用BERT(Bidirectional Encoder Representa... 针对中文命名实体识别中循环神经网络不能很好地处理长序列问题,以及用单一向量去表征汉字时,由于汉字存在多义性而导致识别结果不佳的问题,提出一种识别效果更好的方法——BLDC-NER模型.首先利用BERT(Bidirectional Encoder Representations from Transformers)预训练模型根据字的上下文语境生成字的动态语义向量,然后将字向量序列分别通过双向长短时记忆网络层和膨胀卷积层进行语义编码,融合2个网络层输出的语义向量,经过条件随机场得到最终结果.试验结果表明:BLDC-NER模型在训练过程中比单一循环神经网络收敛速度更快,识别效果更好,在MSRA、RESUME公开数据集上的F 1值分别达到了94.78%、95.68%;另外,将BLDC-NER模型应用在建筑施工安全事故领域,在自制的数据集上F 1值为95.24%. 展开更多
关键词 中文命名实体识别 BERT模型 双向长短时神经网络 膨胀卷积神经网络 建筑施工安全
下载PDF
基于多特征与DCNN的红外SF_(6)泄漏检测方法研究 被引量:1
13
作者 徐守坤 符心宇 +2 位作者 封晓晨 王雨生 石林 《计算机应用与软件》 北大核心 2021年第6期134-142,160,共10页
传统SF_(6)泄漏检测耗费大量人力物力。针对该问题,提出一种基于红外成像技术的自动检漏方法。使用混合高斯模型确认泄漏视频中的疑似泄漏区域;通过HSV颜色空间分析SF_(6)泄漏的颜色特征;分析泄漏SF_(6)在红外技术下的动态特性,提取其... 传统SF_(6)泄漏检测耗费大量人力物力。针对该问题,提出一种基于红外成像技术的自动检漏方法。使用混合高斯模型确认泄漏视频中的疑似泄漏区域;通过HSV颜色空间分析SF_(6)泄漏的颜色特征;分析泄漏SF_(6)在红外技术下的动态特性,提取其不规则运动特征;使用膨胀卷积神经网络(DCNN)作为分类器,并在视频帧上完成对泄漏区域的标注。实验结果表明,该方法通过检测不同设备、不同部位的SF_(6)泄漏视频能够准确标记出SF_(6)泄漏区域,检测准确率可以达到82.71%。 展开更多
关键词 SF_(6)泄漏 混合高斯模型 HSV颜色空间 膨胀卷积神经网络
下载PDF
RIB-NER:基于跨度的中文命名实体识别模型
14
作者 田红鹏 吴璟玮 《计算机工程与科学》 CSCD 北大核心 2024年第7期1311-1320,共10页
命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错... 命名实体识别是自然语言处理领域中诸多下游任务的重要基础。汉语作为重要的国际语言,在许多方面具有独特性。传统上,中文命名实体识别任务模型使用序列标记机制,该机制需要条件随机场捕获标签的依赖性,然而,这种方法容易出现标签的错误分类。针对这个问题,提出基于跨度的命名实体识别模型RIB-NER。首先,以RoBERTa-wwm-ext作为模型嵌入层,提供字符级嵌入,以获得更多的上下文语义信息和词汇信息。其次,利用IDCNN的并行卷积核来增强词之间的位置信息,从而使词与词之间联系更加紧密。同时,在模型中融合BiLSTM网络来获取上下文信息。最后,采用双仿射模型对句子中的开始标记和结束标记评分,使用这些标记探索跨度。在MSRA和Weibo 2个语料库上的实验结果表明,RIB-NER能够较为准确地识别实体边界,并分别获得了95.11%和73.94%的F1值。与传统深度学习相比,有更好的识别效果。 展开更多
关键词 中文命名实体识别 双仿射模型 迭代膨胀卷积神经网络 预训练模型 跨度
下载PDF
数据驱动的半无限介质裂纹识别模型研究
15
作者 江守燕 邓王涛 +1 位作者 孙立国 杜成斌 《力学学报》 EI CAS CSCD 北大核心 2024年第6期1727-1739,共13页
缺陷识别是结构健康监测的重要研究内容,对评估工程结构的安全性具有重要的指导意义,然而,准确确定结构缺陷的尺寸十分困难.论文提出了一种创新的数据驱动算法,将比例边界有限元法(scaled boundary finite element methods,SBFEM)与自... 缺陷识别是结构健康监测的重要研究内容,对评估工程结构的安全性具有重要的指导意义,然而,准确确定结构缺陷的尺寸十分困难.论文提出了一种创新的数据驱动算法,将比例边界有限元法(scaled boundary finite element methods,SBFEM)与自编码器(autoencoder,AE)、因果膨胀卷积神经网络(causal dilated convolutional neural network,CDCNN)相结合用于半无限介质中的裂纹识别.在该模型中,SBFEM用于模拟波在含不同裂纹状缺陷半无限介质中的传播过程,对于不同的裂纹状缺陷,仅需改变裂纹尖端的比例中心和裂纹开口处节点的位置,避免了复杂的重网格过程,可高效地生成足够的训练数据.模拟波在半无限介质中传播时,建立了基于瑞利阻尼的吸收边界模型,避免了对结构全域模型进行计算.搭建了CDCNN,确保了时序数据的有序性,并获得更大的感受野而不增加神经网络的复杂性,可捕捉更多的历史信息,AE具有较强的非线性特征提取能力,可将高维的原始输入特征向量空间映射到低维潜在特征向量空间,以获得低维潜在特征用于网络模型训练,有效提升了网络模型的学习效率.数值算例表明:提出的模型能够高效且准确地识别半无限介质中裂纹的量化信息,且AE-CDCNN模型的识别效率较单CDCNN模型提高了约2.7倍. 展开更多
关键词 数据驱动 比例边界有限元法 自编码器 因果膨胀卷积神经网络 裂纹识别
下载PDF
基于笔画ELMo嵌入IDCNN-CRF模型的企业风险领域实体抽取研究 被引量:1
16
作者 杨美芳 杨波 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第9期86-99,共14页
【目的】有效学习风险领域文本特征和上下文语义关联性,提升企业风险领域实体抽取的性能。【方法】提出基于笔画ELMo嵌入IDCNN-CRF的企业风险领域实体抽取模型。使用双向语言模型预训练大规模非结构化的企业风险领域数据得到的笔画ELMo... 【目的】有效学习风险领域文本特征和上下文语义关联性,提升企业风险领域实体抽取的性能。【方法】提出基于笔画ELMo嵌入IDCNN-CRF的企业风险领域实体抽取模型。使用双向语言模型预训练大规模非结构化的企业风险领域数据得到的笔画ELMo向量作为输入特征;将其送入IDCNN网络进行训练,运用CRF对IDCNN的输出层进行处理,获得全局最优的企业风险领域实体序列标注。【结果】模型对企业风险领域实体抽取的F值为91.9%,相对于BiLSTM-CRF模型的抽取性能提升了2.0%,且测试速度快2.36倍。【局限】未考虑本模型扩展于更多领域实体抽取任务的普适性。【结论】本文模型能够为企业风险领域实体语料库构建提供参考借鉴。 展开更多
关键词 笔画ELMo 迭代膨胀卷积神经网络 条件随机场 实体抽取 风险领域实体
原文传递
基于3D双流卷积神经网络的异常行为检测 被引量:5
17
作者 刘良鑫 林勉芬 +3 位作者 钟良泉 彭雯雯 曲超 潘家辉 《计算机系统应用》 2021年第5期120-127,共8页
随着科技的不断发展,越来越多的人工智能技术应用于社会生活.依据这一现实,本文运用当前较为热门的图像处理技术进行能识别视频中异常行为并给出预测值的系统开发.首先,我们利用双流膨胀3D卷积网络(Two-Stream-I3D)特征提取技术对视频... 随着科技的不断发展,越来越多的人工智能技术应用于社会生活.依据这一现实,本文运用当前较为热门的图像处理技术进行能识别视频中异常行为并给出预测值的系统开发.首先,我们利用双流膨胀3D卷积网络(Two-Stream-I3D)特征提取技术对视频进行特征提取.其次,运用Python对特征进行处理,转化为深度学习网络所能识别的特征,最后进行GRNN广义回归网络训练,最终达到能对特征值进行良好的异常概率回归的效果.实验表明,运用本系统针对测试集近50例的视频的检测下,系统的平均准确率达74%,具有良好的性能. 展开更多
关键词 异常行为识别 双流膨胀3D卷积神经网络 概率回归
下载PDF
基于BERT-DGCNN的中文事件抽取方法研究 被引量:4
18
作者 陈安南 叶岩宁 +2 位作者 王畅畅 王文举 李博文 《计算机科学与应用》 2021年第5期1572-1578,共7页
本文构建了一个事件抽取pipeline模型,其旨在对新闻中的信息元进行有效的抽取。在管道抽取模式下,先对文本进行存在事件类型识别,而后再将事件类型与文本一并作为输入传入模型进行事件论元角色抽取,其中事件论元角色采用类似于BERT中SQ... 本文构建了一个事件抽取pipeline模型,其旨在对新闻中的信息元进行有效的抽取。在管道抽取模式下,先对文本进行存在事件类型识别,而后再将事件类型与文本一并作为输入传入模型进行事件论元角色抽取,其中事件论元角色采用类似于BERT中SQuAD等阅读理解任务上的双指针输出。两个基本模型都是利用BERT预训练模型产生的词嵌入,使用DGCNN进行编码之后池化,再连接到dense层进行分类。实验结果表明,本模型可对新闻类内容进行高效抽取。 展开更多
关键词 事件抽取 BERT模型 膨胀卷积神经网络
下载PDF
基于FPGA的事件抽取模型与加速器的设计实现 被引量:3
19
作者 韩哲 姜晶菲 +3 位作者 乔林波 窦勇 许金伟 阚志刚 《计算机工程与科学》 CSCD 北大核心 2020年第11期1941-1948,共8页
事件抽取技术是实现特定信息快速提取的一种关键技术,可广泛应用于信息检索、情感分析等场景。中文事件抽取因需要考虑中文语言特性的问题,较英文事件抽取任务来说更为困难。基于当前前沿的英文事件抽取神经网络模型,提出了一种适合硬... 事件抽取技术是实现特定信息快速提取的一种关键技术,可广泛应用于信息检索、情感分析等场景。中文事件抽取因需要考虑中文语言特性的问题,较英文事件抽取任务来说更为困难。基于当前前沿的英文事件抽取神经网络模型,提出了一种适合硬件计算的中文事件抽取神经网络模型CEE-DGCNN,其事件触发词分类在ACE2005中文语料库上实现了71.71%的F1值。并设计实现了相应的加速器,通过对数据的定点量化进一步优化了模型大小,其性能在Xilinx XCKU115 FPGA上达到了97 GOP/s,为CPU平台上性能的67倍。 展开更多
关键词 FPGA 事件抽取 膨胀卷积神经网络 加速器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部