基于BERT的两次注意力机制远程监督关系抽取

Twice attention mechanism distantly supervised relation extraction based on BERT

下载PDF

导出

摘要针对词向量语义信息不完整以及文本特征抽取时的一词多义问题,提出基于BERT(Bidirectional Encoder Representation from Transformer)的两次注意力加权算法(TARE)。首先,在词向量编码阶段,通过构建Q、K、V矩阵使用自注意力机制动态编码算法,为当前词的词向量捕获文本前后词语义信息;其次,在模型输出句子级特征向量后,利用定位信息符提取全连接层对应参数,构建关系注意力矩阵;最后,运用句子级注意力机制算法为每个句子级特征向量添加不同的注意力分数,提高句子级特征的抗噪能力。实验结果表明:在NYT-10m数据集上,与基于对比学习框架的CIL(Contrastive Instance Learning)算法相比,TARE的F1值提升了4.0个百分点,按置信度降序排列后前100、200和300条数据精准率Precision@N的平均值(P@M)提升了11.3个百分点;在NYT-10d数据集上,与基于注意力机制的PCNN-ATT(Piecewise Convolutional Neural Network algorithm based on ATTention mechanism)算法相比,精准率与召回率曲线下的面积(AUC)提升了4.8个百分点,P@M值提升了2.1个百分点。在主流的远程监督关系抽取(DSER)任务中,TARE有效地提升了模型对数据特征的学习能力。 Aiming at the problem of incomplete semantic information of word vectors and the problem of word polysemy faced by text feature extraction,a BERT(Bidirectional Encoder Representation from Transformer)word vector-based Twice Attention mechanism weighting algorithm for Relation Extraction(TARE)was proposed.Firstly,in the word embedding stage,the self-attention dynamic encoding algorithm was used to capture the semantic information before and after the text for the current word vector by constructing Q,K and V matrices.Then,after the model output the sentence-level feature vector,the locator was used to extract the corresponding parameters of the fully connected layer to construct the relation attention matrix.Finally,the sentence level attention mechanism algorithm was used to add different attention scores to sentence-level feature vectors to improve the noise immunity of sentence-level features.The experimental results show that compared with Contrastive Instance Learning(CIL)algorithm for relation extraction,the F1 value is increased by 4.0 percentage points and the average value of Precision@100,Precision@200,and Precision@300(P@M)is increased by 11.3 percentage points on the NYT-10m dataset.Compared with the Piecewise Convolutional Neural Network algorithm based on ATTention mechanism(PCNN-ATT),the AUC(Area Under precision-recall Curve)value is increased by 4.8 percentage points and the P@M value is increased by 2.1 percentage points on the NYT-10d dataset.In various mainstream Distantly Supervised for Relation Extraction(DSRE)tasks,TARE effectively improves the model’s ability to learn data features.

作者袁泉陈昌平陈泽詹林峰 YUAN Quan;CHEN Changping;CHEN Ze;ZHAN Linfeng(School of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065,China;Research Center of New Communication Technology Applications,Chongqing University of Posts and Telecommunications,Chongqing 400065,China)

机构地区重庆邮电大学通信与信息工程学院重庆邮电大学通信新技术应用研究中心

出处《计算机应用》 CSCD 北大核心 2024年第4期1080-1085,共6页 journal of Computer Applications

关键词远程监督关系抽取注意力机制词向量特征全连接层 distant supervision relation extraction attention mechanism word embedding feature fully connected layer

分类号 TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1唐焕玲,卫红敏,王育林,朱辉,窦全胜.结合LDA与Word2vec的文本语义增强方法[J].计算机工程与应用,2022,58(13):135-145. 被引量：20
2王佳宇,李楹,马春梅,吴东昊,姜丽芬.融合实体信息的图卷积神经网络的短文本分类模型[J].天津师范大学学报（自然科学版）,2023,43(1):67-72. 被引量：7

二级参考文献10

1唐焕玲,林正奎,鲁明羽.基于差异性评估对Co-training文本分类算法的改进[J].电子学报,2008,36(B12):138-143. 被引量：4
2李新福,赵蕾蕾,何海斌,李芳.使用Logistic回归模型进行中文文本分类[J].计算机工程与应用,2009,45(14):152-154. 被引量：10
3郭茂盛,张宇,刘挺.文本蕴含关系识别与知识获取研究进展及展望[J].计算机学报,2017,40(4):889-910. 被引量：27
4侯强,侯瑞丽.机器翻译方法研究与发展综述[J].计算机工程与应用,2019,55(10):30-35. 被引量：25
5唐焕玲,窦全胜,于立萍,宋英杰,鲁明羽.有监督主题模型的SLDA-TC文本分类新方法[J].电子学报,2019,47(6):1300-1308. 被引量：10
6吴呈,王朝坤,王沐贤.基于文本化简的实体属性抽取方法[J].计算机工程与应用,2020,56(21):115-122. 被引量：2
7张志昌,曾扬扬,庞雅丽.融合语义角色和自注意力机制的中文文本蕴含识别[J].电子学报,2020,48(11):2162-2169. 被引量：9
8Sheng-Luan Hou,Xi-Kun Huang,Chao-Qun Fei,Shu-Han Zhang,Yang-Yang Li,Qi-Lin Sun,Chuan-Qing Wang.A Survey of Text Summarization Approaches Based on Deep Learning[J].Journal of Computer Science & Technology,2021,36(3):633-663. 被引量：1
9江洋洋,金伯,张宝昌.深度学习在自然语言处理领域的研究进展[J].计算机工程与应用,2021,57(22):1-14. 被引量：22
10杨世刚,刘勇国.融合语料库特征与图注意力网络的短文本分类方法[J].计算机应用,2022,42(5):1324-1329. 被引量：3

共引文献25

1洪海蓝,李文林,杨涛,李玥,梅文静.基于知识图谱的海洋中药智能问答系统的设计与实现[J].世界科学技术-中医药现代化,2023(6):1935-1941. 被引量：4
2赵训新,王卫玉,马泽宁,陈启卷.基于知识图谱的水电机组主动维护体系探讨[J].水电与新能源,2022,36(8):23-27. 被引量：3
3杨益兴,许洪波.基于语义相似度与PROMETHEE的生鲜电商服务质量评价[J].昆明理工大学学报（社会科学版）,2023,23(2):109-118. 被引量：1
4邹丽强,何月顺.多特征融合的文本相似度方法[J].现代电子技术,2023,46(11):103-108. 被引量：1
5周志刚,窦路遥.基于专利视角的企业潜在竞争与合作关系预测——以钙钛矿型太阳能电池为例[J].科技管理研究,2023,43(10):136-145. 被引量：2
6孙红蕊,周星亚,原义豪,木也塞尔·努热合买提,夏克尔·赛塔尔.基于LBP和神经网络的织物疵点分类[J].服饰导刊,2023,12(3):110-120.
7张霁阳,张鹏,李思佳,刘静,窦云莲,兰月新.基于实时社会网络分析的突发舆情事件动态意见领袖识别方法研究[J].情报杂志,2023,42(9):109-116. 被引量：3
8于诗睿,李爱花,林紫洛,陈逸菲,唐小利.基于主题模型的科技文献主题演化及优化方法研究综述[J].医学信息学杂志,2023,44(8):31-36.
9王治学.融合实体信息的图卷积神经网络的短文本分类模型分析[J].信息系统工程,2023(9):122-125. 被引量：1
10黄婵.社交媒体热点事件挖掘与传播机制研究——基于事件网络文本表示模型[J].互联网周刊,2023(20):18-20. 被引量：2

1席运江,李曼,邓雨珊,廖晓,邝云英.中文在线医疗社区问答内容知识图谱构建研究[J].图书情报工作,2024,68(4):124-136.
2邹旺,张吴波.基于BERT-TextCNN的汽车评论情感分析[J].天津理工大学学报,2024,40(1):101-108. 被引量：1
3Yun-Fei Shi,Zheng-Xin Yang,Sicong Ma,Pei-Lin Kang,Cheng Shang,P.Hu,Zhi-Pan Liu.Machine Learning for Chemistry:Basics and Applications[J].Engineering,2023(8):70-83.
4胡忠义,税典程,吴江.基于ERNIE和DPCNN的科技文献摘要结构要素识别[J].数据分析与知识发现,2024,8(1):125-134.
5林葳,汤宏涛,何坤.肝细胞癌肝移植转化治疗进展[J].中华普通外科学文献（电子版）,2024,18(2):147-150.
6于明诚,党亚固,吴奇林,吉旭,毕可鑫.基于多尺度上下文的英文作文自动评分研究[J].计算机工程,2024,50(3):259-266. 被引量：1
7钟圣华,张智.基于多示例学习图卷积网络的隐写者检测[J].自动化学报,2024,50(4):771-789.
8李岩珂,邹昱,郭兆金,刘圣,李鹏,魏冰妍,温丹丹,赵建林.Constructing arbitrary self-similar Bessel-like beams via transverse-longitudinal mapping[J].Chinese Optics Letters,2024,22(2):167-171. 被引量：1
9雷春兰.建筑工程项目招投标风险管理分析及应对措施[J].中文科技期刊数据库（引文版）工程技术,2024(4):0037-0039.
10黄欣然,YANG Hongjie,CHEN Hu,ZHANG Yi,廖培希.PT-MIL:Parallel transformer based on multi-instance learning for osteoporosis detection in panoramic oral radiography[J].中国体视学与图像分析,2023,28(4):410-418.

计算机应用

2024年第4期

浏览历史

内容加载中请稍等...

基于BERT的两次注意力机制远程监督关系抽取

参考文献2

二级参考文献10

共引文献25

相关作者

相关机构

相关主题

浏览历史