期刊文献+

基于预训练模型和图卷积网络的中文短文本实体链接

Chinese Short Text Entity Linking Based on BERT and GCN
下载PDF
导出
摘要 短文本实体链接由于缺乏主题信息,只能依靠局部短文本信息和知识库。现有方法主要通过计算局部短文本和候选实体之间的相似度完成候选实体集的排序,但并未显式地考虑局部短文本和候选实体在文本交互上的关联性。针对上述问题,该文提出短文本交互图(STIG)的概念和一个双步训练方案,利用BERT提取局部短文本和候选实体间的多粒度特征,并在短文本交互图上使用图卷积机制。此外,为了缓解均值池化使图卷积发生退化的问题,该文提出一个将交互图中各节点特征和边信息压缩成稠密向量的方法。在CCKS2020短文本实体链接数据集上的实验验证了所提方法的有效性。 Short text entity linking can relies on local short text information and knowledge base due to the lack of global topic information.This paper proposes the concept of short text interaction graph(STIG)and a double stage training strategy.The Bert is used to extract the multi-granularity features between local short text and candidate entities,and the graph convolution mechanism is used on the short text interaction graph.To alleviate the degradation of graph convolution caused by mean pooling,a method is further proposed to compress the feature of nodes and edges information in interaction graph into a dense vector.Experiments on CCKS2020 entity linking dataset show the effectiveness of the proposed method.
作者 郭世伟 马博 马玉鹏 杨雅婷 GUO Shiwei;MA Bo;MA Yupeng;YANG Yating(The Xinjiang Technical Institute of Physics and Chemistry,Urumqi,Xinjiang 830011,China;University of Chinese Academy of Sciences,Beijing 100049,China;Xinjiang Laboratory of Minority Speech and Language Information Processing,Urumqi,Xinjiang 830011,China)
出处 《中文信息学报》 CSCD 北大核心 2022年第12期104-114,共11页 Journal of Chinese Information Processing
基金 国家自然科学基金(U2003303) 中国科学院西部青年学者项目-A类(2019-XBQNXZ-A-004) 中国科学院青年创新促进会项目(科发人函字[2019]26号) 自治区天山青年计划项目(2018Q032) 新疆维吾尔自治区重大专项(2020A03004-4)。
关键词 实体链接 BERT 图卷积神经网络 entity linking BERT graph convolutional neural network
  • 相关文献

参考文献2

二级参考文献2

共引文献7

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部