期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于语义先验知识与类型嵌入的复杂实体识别
被引量:
1
1
作者
姜小波
何昆
阎广瑜
《软件学报》
EI
CSCD
北大核心
2023年第12期5649-5669,共21页
实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的...
实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的方法来识别嵌套实体,在实体边界检测方面呈现出模糊化,影响识别的性能.针对这些问题和挑战,提出了一种基于语义先验知识与类型嵌入的实体识别模型GIA-2DPE.该模型使用实体类别的关键词序列作为语义先验知识来提升对实体的认知,并通过类型嵌入捕获不同实体类型的潜在特征,然后通过门控交互注意力机制将先验知识与类型特征相融合以辅助复杂实体识别.另外,模型通过2D概率编码来预测实体边界,并利用边界特征和上下文特征来增强对边界的精准检测,从而提升嵌套实体的识别效果.在7个英文数据集和2个中文数据集上进行了广泛实验.结果表明,GIA-2DPE超越了目前最先进的模型;并且在ScienceIE数据集的实体识别任务中,相对基线F1分数取得了最高10.4%的提升.
展开更多
关键词
信息抽取
复杂实体识别
门控交互注意力机制
2D概率编码
下载PDF
职称材料
面向武器装备领域的复杂三元组抽取方法
2
作者
游新冬
刘陌村
+2 位作者
葛昊杰
肖刚
吕学强
《小型微型计算机系统》
CSCD
北大核心
2024年第3期521-528,共8页
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对...
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对抗的方式,实现模型层面的数据增强,减少模型对标注样本规模的依赖;采用单层指针网络获取头实体对头实体的类别进行判定,利用维基百科知识库对武器装备领域的实体类别解释信息的向量,对武器装备类别信息以字为最小粒度进行融合,缓解分层标注的天然缺陷;最后在横纵两个维度基于不同粒度的序列标注实现复杂三元组的抽取.在武器装备领域的数据集上精准率达到88.54%,召回率达到75.88%,F1值达到81.72%,取得了SOTA效果.实验表明提出的RDA方法对武器装备领域的信息利用更加充分,有效地缓解武器装备领域遇到的单实体重叠问题(SEO)和实体对重叠(EPO)问题.
展开更多
关键词
三元组抽取
武器装备领域
复杂命名实体识别
单层指针网络
多轮对抗攻击
RDA
下载PDF
职称材料
面向武器装备领域的复杂实体识别
被引量:
3
3
作者
游新冬
葛昊杰
+2 位作者
韩君妹
李育贤
吕学强
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022年第3期391-404,共14页
针对武器装备领域复杂实体的特点,提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先,使用BERT模型对武器装备领域数据进行预训练,得到数据向量,使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征,获取特...
针对武器装备领域复杂实体的特点,提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先,使用BERT模型对武器装备领域数据进行预训练,得到数据向量,使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征,获取特征向量。然后,将数据向量与特征向量融合,利用Bi-LSTM模型进行编码,使用CRF解码得到标签序列。最后,基于武器装备领域知识,对标签序列进行复杂实体的触发检测,完成复杂命名实体识别。使用环球军事网数据作为语料进行实验,分析不同的特征组合、不同神经网络模型下的识别效果,并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明,提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%,优于现有方法。
展开更多
关键词
武器装备
复杂命名实体识别
郑码
领域规则
BERT
评价方法
下载PDF
职称材料
题名
基于语义先验知识与类型嵌入的复杂实体识别
被引量:
1
1
作者
姜小波
何昆
阎广瑜
机构
华南理工大学电子与信息学院
出处
《软件学报》
EI
CSCD
北大核心
2023年第12期5649-5669,共21页
基金
国家自然科学基金(U1801262)
广东省科技计划(2019B010154003)。
文摘
实体识别是信息抽取的关键任务.随着信息抽取技术的发展,研究人员从简单实体的识别转向复杂实体的识别.然而,复杂实体缺乏明显的特征且在句法结构与词性组成上更加复杂多样,给实体识别带来了巨大挑战.此外,现有模型广泛采用基于跨度的方法来识别嵌套实体,在实体边界检测方面呈现出模糊化,影响识别的性能.针对这些问题和挑战,提出了一种基于语义先验知识与类型嵌入的实体识别模型GIA-2DPE.该模型使用实体类别的关键词序列作为语义先验知识来提升对实体的认知,并通过类型嵌入捕获不同实体类型的潜在特征,然后通过门控交互注意力机制将先验知识与类型特征相融合以辅助复杂实体识别.另外,模型通过2D概率编码来预测实体边界,并利用边界特征和上下文特征来增强对边界的精准检测,从而提升嵌套实体的识别效果.在7个英文数据集和2个中文数据集上进行了广泛实验.结果表明,GIA-2DPE超越了目前最先进的模型;并且在ScienceIE数据集的实体识别任务中,相对基线F1分数取得了最高10.4%的提升.
关键词
信息抽取
复杂实体识别
门控交互注意力机制
2D概率编码
Keywords
information
extraction
complex
entity
recognition
gated
interactive
attention
2D
probability
encoding
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
面向武器装备领域的复杂三元组抽取方法
2
作者
游新冬
刘陌村
葛昊杰
肖刚
吕学强
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
军事科学院系统工程研究院复杂系统仿真总体重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2024年第3期521-528,共8页
基金
国防科技重点实验室基金项目(6412006200404)资助
国家自然科学基金项目(62171043)资助.
文摘
为解决武器装备领域中单实体重叠和实体对重叠的复杂三元组的抽取问题,提出了挂载武器装备领域知识结合多轮对抗攻击的复杂三元组抽取方法(RDA),该方法通过武器装备领域微调后的Bert获取更具领域语义的文本向量;利用在嵌入层发起多轮对抗的方式,实现模型层面的数据增强,减少模型对标注样本规模的依赖;采用单层指针网络获取头实体对头实体的类别进行判定,利用维基百科知识库对武器装备领域的实体类别解释信息的向量,对武器装备类别信息以字为最小粒度进行融合,缓解分层标注的天然缺陷;最后在横纵两个维度基于不同粒度的序列标注实现复杂三元组的抽取.在武器装备领域的数据集上精准率达到88.54%,召回率达到75.88%,F1值达到81.72%,取得了SOTA效果.实验表明提出的RDA方法对武器装备领域的信息利用更加充分,有效地缓解武器装备领域遇到的单实体重叠问题(SEO)和实体对重叠(EPO)问题.
关键词
三元组抽取
武器装备领域
复杂命名实体识别
单层指针网络
多轮对抗攻击
RDA
Keywords
triple
extraction
weapons
and
equipment
field
complex
named
entity
recognition
single-layer
pointer
network
multiple
rounds
of
counterattack
RDA
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向武器装备领域的复杂实体识别
被引量:
3
3
作者
游新冬
葛昊杰
韩君妹
李育贤
吕学强
机构
北京信息科技大学网络文化与数字传播北京市重点实验室
军事科学院系统工程研究院复杂系统仿真总体重点实验室
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022年第3期391-404,共14页
基金
北京市自然科学基金(4212020)
国家自然科学基金(62171043)
+2 种基金
国防科技重点实验室基金(6412006200404)
北京信息科技大学“勤信人才”培育计划项目(QXTCP B201908)
北京市市教委科研计划(KM202111232001)资助。
文摘
针对武器装备领域复杂实体的特点,提出一种融合多特征后挂载武器装备领域知识的复杂命名实体识别方法。首先,使用BERT模型对武器装备领域数据进行预训练,得到数据向量,使用Word2Vec模型学习郑码、五笔、拼音和笔画的上下位特征,获取特征向量。然后,将数据向量与特征向量融合,利用Bi-LSTM模型进行编码,使用CRF解码得到标签序列。最后,基于武器装备领域知识,对标签序列进行复杂实体的触发检测,完成复杂命名实体识别。使用环球军事网数据作为语料进行实验,分析不同的特征组合、不同神经网络模型下的识别效果,并提出适用于评价复杂命名实体识别结果的计算方法。实验结果表明,提出的挂载领域知识且融合多特征的武器装备复杂命名实体识别方法的F1值达到95.37%,优于现有方法。
关键词
武器装备
复杂命名实体识别
郑码
领域规则
BERT
评价方法
Keywords
weapon
and
equipment
complex
named
entity
recognition
Zhengma
domain
rules
BERT
evalua-tion
method
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
E91 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于语义先验知识与类型嵌入的复杂实体识别
姜小波
何昆
阎广瑜
《软件学报》
EI
CSCD
北大核心
2023
1
下载PDF
职称材料
2
面向武器装备领域的复杂三元组抽取方法
游新冬
刘陌村
葛昊杰
肖刚
吕学强
《小型微型计算机系统》
CSCD
北大核心
2024
0
下载PDF
职称材料
3
面向武器装备领域的复杂实体识别
游新冬
葛昊杰
韩君妹
李育贤
吕学强
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2022
3
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部