期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于语义先验知识与类型嵌入的复杂实体识别 被引量:1
1
作者 姜小波 何昆 阎广瑜 《软件学报》 EI CSCD 北大核心 2023年第12期5649-5669,共21页
实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的... 实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的方法来识别嵌套实体,在实体边界检测方面呈现出模糊化,影响识别的性能.针对这些问题和挑战,提出了一种基于语义先验知识与类型嵌入的实体识别模型GIA-2DPE.该模型使用实体类别的关键词序列作为语义先验知识来提升对实体的认知,并通过类型嵌入捕获不同实体类型的潜在特征,然后通过门控交互注意力机制将先验知识与类型特征相融合以辅助复杂实体识别.另外,模型通过2D概率编码来预测实体边界,并利用边界特征和上下文特征来增强对边界的精准检测,从而提升嵌套实体的识别效果.在7个英文数据集和2个中文数据集上进行了广泛实验.结果表明,GIA-2DPE超越了目前最先进的模型;并且在ScienceIE数据集的实体识别任务中,相对基线F1分数取得了最高10.4%的提升. 展开更多
关键词 信息抽取 复杂实体识别 门控交互注意力机制 2D概率编码
下载PDF
面向武器装备领域的复杂三元组抽取方法
2
作者 游新冬 刘陌村 +2 位作者 葛昊杰 肖刚 吕学强 《小型微型计算机系统》 CSCD 北大核心 2024年第3期521-528,共8页
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对... 为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对抗的方式,实现模型层面的数据增强,减少模型对标注样本规模的依赖;采用单层指针网络获取头实体对头实体的类别进行判定,利用维基百科知识库对武器装备领域的实体类别解释信息的向量,对武器装备类别信息以字为最小粒度进行融合,缓解分层标注的天然缺陷;最后在横纵两个维度基于不同粒度的序列标注实现复杂三元组的抽取.在武器装备领域的数据集上精准率达到88.54%,召回率达到75.88%,F1值达到81.72%,取得了SOTA效果.实验表明提出的RDA方法对武器装备领域的信息利用更加充分,有效地缓解武器装备领域遇到的单实体重叠问题(SEO)和实体对重叠(EPO)问题. 展开更多
关键词 三元组抽取 武器装备领域 复杂命名实体识别 单层指针网络 多轮对抗攻击 RDA
下载PDF
面向武器装备领域的复杂实体识别 被引量:3
3
作者 游新冬 葛昊杰 +2 位作者 韩君妹 李育贤 吕学强 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2022年第3期391-404,共14页
针对武器装备领域复杂实体的特点,提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先,使用BERT模型对武器装备领域数据进行预训练,得到数据向量,使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征,获取特... 针对武器装备领域复杂实体的特点,提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先,使用BERT模型对武器装备领域数据进行预训练,得到数据向量,使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征,获取特征向量。然后,将数据向量与特征向量融合,利用Bi-LSTM模型进行编码,使用CRF解码得到标签序列。最后,基于武器装备领域知识,对标签序列进行复杂实体的触发检测,完成复杂命名实体识别。使用环球军事网数据作为语料进行实验,分析不同的特征组合、不同神经网络模型下的识别效果,并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明,提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%,优于现有方法。 展开更多
关键词 武器装备 复杂命名实体识别 郑码 领域规则 BERT 评价方法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部