-
题名一种改进的基于翻译的知识图谱表示方法
被引量:51
- 1
-
-
作者
方阳
赵翔
谭真
杨世宇
肖卫东
-
机构
国防科技大学信息系统与管理学院
地球空间信息技术协同创新中心(武汉大学)
新南威尔士大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2018年第1期139-150,共12页
-
基金
国家自然科学基金项目(61402494
61402498
+1 种基金
71690233)
湖南省自然科学基金项目(2015JJ4009)~~
-
文摘
知识图谱在人工智能上有很大的研究价值,并被广泛应用于语义搜索和自动问答等领域.知识图谱表示将包含了实体和关系的大规模知识图谱映射到一个连续的向量空间.为此,有一系列知识表示模型提出,其中基于翻译模型的经典方法 TransE不仅模型复杂度低、计算效率高,而且同样具有良好的知识表达能力.但是,TransE亦存在2个缺陷:1)它使用了不够灵活的欧氏距离作为度量,对每一个特征维同等对待,模型的准确性可能受到无关维度的干扰;2)它在处理自反、一对多、多对一和多对多等复杂关系时存在局限性.目前,还没有一种方法能同时解决上述2个缺陷,因此提出一种改进的基于翻译的知识图谱表示方法 TransAH.对于第1个缺陷,TransAH采用了一种自适应的度量方法,加入了对角权重矩阵将得分函数中的度量由欧氏距离转换为加权欧氏距离,并实现了为每一个特征维区别地赋予权重.针对第2个缺陷,受TransH方法的启发,TransAH引入面向特定关系的超平面模型,将头实体和尾实体映射至给定关系的超平面加以区分.最后,在公开真实的知识图谱数据集上分析和验证了所提方法的有效性.利用链路预测和三元组分类这2项任务开展了全面横向评测实验,相较于现有的模型和方法,TransAH在各项指标上均取得了很大的进步,体现了其优越性.
-
关键词
知识图谱
知识表示
表示学习
链路预测
三元组分类
-
Keywords
knowledge graph
knowledge representation
representation learning
link prediction
triplet classification
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名融合对抗训练的端到端知识三元组联合抽取
被引量:13
- 2
-
-
作者
黄培馨
赵翔
方阳
朱慧明
肖卫东
-
机构
国防科技大学信息系统工程重点实验室
地球空间信息技术协同创新中心(武汉大学)
长沙商贸旅游职业技术学院经济贸易学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2019年第12期2536-2548,共13页
-
基金
国家自然科学基金项目(61402494,61402498,71690233,61902417)
湖南省自然科学基金项目(2015JJ4009)~~
-
文摘
知识图谱作为一种有效表示现实世界的系统受到学术界和工业界广泛关注,并由于其精准表示知识的能力被广泛应用于信息服务、智慧搜索、自动问答等上层应用.知识图谱的核心为三元组形式的实体和关系.现有知识图谱远不足以描述现实世界,因此,如何通过实体关系抽取方法来补全或者构建新的知识图谱显得至关重要.传统流水线式的实体关系抽取方法会导致误差传递,而已有的联合抽取没有充分考虑命名实体识别与关系抽取之间的联系,从而降低抽取效果.针对上述问题,对知识三元组抽取方法进行了深入研究,提出了一种融合对抗训练的端到端知识三元组联合抽取方法.首先,采用了一种实体关系联合标注策略,通过端到端的神经网络抽取文本语义特征,并对文本进行自动标注;其次,模型在神经网络中加入自注意力机制增强对文本信息的编码能力,并通过引入带偏置项的目标函数提高对相关联实体的辨识能力;最后,模型融合了对抗训练以提高鲁棒性,改进抽取效果.在实验部分,采用4种分析方法和3种评价指标对模型性能进行评价分析,实验结果证明了模型在知识抽取上的性能明显优于现有方法.
-
关键词
知识图谱
知识三元组抽取
对抗训练
端到端网络
标注策略
-
Keywords
knowledge graph
knowledge triplet extraction
adversarial training
end-to-end network
tagging scheme
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于重排序的迭代式实体对齐
被引量:9
- 3
-
-
作者
曾维新
赵翔
唐九阳
谭真
王炜
-
机构
国防科技大学信息系统工程重点实验室
地球空间信息技术协同创新中心(武汉大学)
新南威尔士大学计算机科学与工程学院
-
出处
《计算机研究与发展》
EI
CSCD
北大核心
2020年第7期1460-1471,共12页
-
基金
国家自然科学基金项目(61872446,61902417,71690233,71971212)
湖南省自然科学基金项目(2019JJ20024)
湖南省研究生科研创新项目(CX20190033)。
-
文摘
现有的知识图谱无法避免地存在不完整这一问题.缓解此问题的可行方法是引入外部知识图谱中的知识.在此过程中,实体对齐是最关键的步骤.当前最先进的实体对齐解决方案主要依靠知识图谱的结构信息来判断实体的等价性,但在真实世界知识图谱上,大部分实体只具有较低的节点度数以及微少的结构信息.此外,标注数据的缺乏也大大限制了实体对齐模型的效果.为解决上述问题,提出将不受节点度数影响的实体名信息与结构信息相结合,从更全面的角度实现实体对齐.在此基本框架上,利用基于课程学习的迭代训练方法从易至难地选择高置信度结果加入到训练数据中,扩增标注数据的规模.最后使用词移距离模型进一步改进实体名信息的利用方式,并对前序对齐结果重排序,提升实体对齐准确率.在跨语言以及单语言实体对齐任务上的实验结果表明,提出的实体对齐方法性能远好于当前最好的方法.
-
关键词
实体对齐
课程学习
迭代训练
重排序
知识图谱对齐
-
Keywords
entity alignment
curriculum learning
iterative training
re-ranking
knowledge graph alignment
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-