面向文本实体关系抽取研究综述

Review of Text-Oriented Entity Relation Extraction Research

下载PDF

导出

摘要信息抽取是知识图谱构建的基础,关系抽取作为信息抽取的关键流程和核心步骤,旨在从文本数据中定位实体并识别实体间的语义联系。因此提高关系抽取的效率可以有效提升信息抽取的质量,进而影响到知识图谱的构建以及后续的下游任务。关系抽取按照抽取文本长度可以分为句子级关系抽取和文档级关系抽取,两种级别的抽取方法在不同应用场景下各有优缺点。句子级关系抽取适用于较小规模数据集的应用场景,而文档级关系抽取适用于新闻事件分析、长篇报告或文章的关系挖掘等场景。不同于已有的关系抽取,介绍了关系抽取的基本概念以及领域内近年来的发展历程,罗列了两种级别关系抽取所采用的数据集,对数据集的特点进行概述;分别对句子级关系抽取和文档级关系抽取进行了阐述,介绍了不同级别关系抽取的优缺点,并分析了各类方法中代表模型的性能以及局限性;总结了当前研究领域中存在的问题并对关系抽取发展前景进行了展望。 Information extraction is the foundation of knowledge graph construction,and relation extraction,as a key process and core step of information extraction,aims to locate entities from text data and recognize semantic links between entities.Therefore,improving the efficiency of relation extraction can effectively improve the quality of information extraction,which affects the construction of knowledge graph and subsequent downstream tasks.Relation extraction can be categorized into sentence-level relation extraction and document-level relation extraction according to the length of the extracted text.The two levels of extraction methods have their own advantages and disadvantages in different application scenarios:sentence-level relation extraction is suitable for application scenarios with smaller datasets,while document-level relation extraction is suitable for scenarios such as news event analysis,long reports or articles with relational mining.Unlike the existing relation extraction,this paper first introduces the basic concept of relation extraction and the development history of the field in recent years,lists the datasets used in the two levels of relation extraction,and gives an overview of the characteristics of the datasets.Then,this paper elaborates on the sentence-level relation extraction and the document-level relation extraction respectively,summarizes the advantages and disadvantages of different levels of relation extraction,and analyses the performance and limitations of the representative models in each method.Finally,this paper summarizes the problems in the current research field and looks forward to future development of relation extraction.

作者任安琪柳林王海龙刘静 REN Anqi;LIU Lin;WANG Hailong;LIU Jing(School of Computer Science and Technology,Inner Mongolia Normal University,Hohhot 010022,China;Computer Science Joint Innovation Laboratory,Inner Mongolia Normal University,Hohhot 010022,China;Library,Inner Mongolia University,Hohhot 010021,China)

机构地区内蒙古师范大学计算机科学技术学院内蒙古师范大学计算机科学联合创新实验室内蒙古大学图书馆

出处《计算机科学与探索》 CSCD 北大核心 2024年第11期2848-2871,共24页 Journal of Frontiers of Computer Science and Technology

基金国家重点研发计划(2020YFC1523305) 内蒙古自治区自然科学基金(2023LHMS06006) 内蒙古师范大学基本科研业务费专项资金(2022JBYJ032) 内蒙古自治区档案馆档案科技项目(2023-13) 无穷维哈密顿系统及其算法应用教育部重点实验室(内蒙古师范大学)开放课题(2023KFYB03,2023KFZD03)。

关键词信息抽取实体关系抽取句子级关系抽取文档级关系抽取知识图谱构建 information extraction entity relation extraction sentence-level relation extraction document-level relation extraction knowledge graph construction

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献21

1田玲,张谨川,张晋豪,周望涛,周雪.知识图谱综述——表示、构建、推理与知识超图理论[J].计算机应用,2021,41(8):2161-2186. 被引量：105
2赵晔辉,柳林,王海龙,韩海燕,裴冬梅.知识图谱推荐系统研究综述[J].计算机科学与探索,2023,17(4):771-791. 被引量：18
3刘峤,李杨,段宏,刘瑶,秦志光.知识图谱构建技术综述[J].计算机研究与发展,2016,53(3):582-600. 被引量：993
4李冬梅,张扬,李东远,林丹琼.实体关系抽取方法研究综述[J].计算机研究与发展,2020,57(7):1424-1448. 被引量：89
5皮德常,吴致远,曹建军.基于知识图谱表示学习的谣言早期检测方法[J].电子学报,2023,51(2):385-395. 被引量：1
6张西硕,柳林,王海龙,苏贵斌,刘静.知识图谱中实体关系抽取方法研究[J].计算机科学与探索,2024,18(3):574-596. 被引量：3
7冯钧,魏大保,苏栋,杭婷婷,陆佳民.文档级实体关系抽取方法研究综述[J].计算机科学,2022,49(10):224-242. 被引量：8
8祝涛杰,卢记仓,周刚,丁肖摇,王凌,朱秀宝.文档级关系抽取技术研究综述[J].计算机科学,2023,50(5):189-200. 被引量：4
9鄂海红,张文静,肖思琪,程瑞,胡莺夕,周筱松,牛佩晴.深度学习实体关系抽取研究综述[J].软件学报,2019,30(6):1793-1818. 被引量：170
10王传栋,徐娇,张永.实体关系抽取综述[J].计算机工程与应用,2020,56(12):25-36. 被引量：30

二级参考文献213

1付秀,陈麒麟,李杰,付毅,包国峰.基于智能预问诊的全景多学科会诊平台的设计与应用[J].中国数字医学,2021,16(10):79-82. 被引量：7
2刘辉,江千军,桂前进,张祺,王梓豫,王磊,王京景.实体关系抽取技术研究进展综述[J].计算机应用研究,2020,37(S02):1-5. 被引量：27
3方卫东,袁华,刘卫红.基于Web挖掘的领域本体自动学习[J].清华大学学报（自然科学版）,2005,45(S1):1729-1733. 被引量：31
4车万翔,刘挺,李生.实体关系自动抽取[J].中文信息学报,2005,19(2):1-6. 被引量：117
5吴健,吴朝晖,李莹,邓水光.基于本体论和词汇语义相似度的Web服务发现[J].计算机学报,2005,28(4):595-602. 被引量：218
6李林,刘贺欢,刘椿年.Ontology自动构建平台OntoAGS[J].计算机工程,2006,32(13):212-214. 被引量：6
7张素香,文娟,秦颖,袁彩霞,钟义信.实体关系的自动抽取研究[J].哈尔滨工程大学学报,2006,27(B07):370-373. 被引量：10
8何婷婷,徐超,李晶,赵君喆.基于种子自扩展的命名实体关系抽取方法[J].计算机工程,2006,32(21):183-184. 被引量：25
9邓擘,樊孝忠,杨立公.用语义模式提取实体关系的方法[J].计算机工程,2007,33(10):212-214. 被引量：24
10MUC[EB/OL]. http://www. itl. nist. gov/iaui/874. 02/related project/muc/, 1987-1998. 被引量：1

共引文献1471

1陈财森,向阳霞,寇应展,刘会英.面向装备作战数据的知识图谱平台构建[J].装甲兵学报,2022(5):105-110. 被引量：1
2袁野,刘佳伟,赵惠浞,左志平,葛超,朱晋锐.基于知识图谱的钢厂设备故障智能诊断技术研究与应用[J].冶金设备,2023(S02):20-25.
3杨靖凡,孔繁鹏,韩立强.知识图谱在信息系统运维领域中的应用研究[J].新一代信息技术,2023,6(12):13-16.
4何宏,葛张鹏,徐小良,夏一行,王宇翔.基于知识图谱语义查询技术的科技咨询服务研究[J].信息与管理研究,2019,4(4):86-96.
5李华昱,付亚凤,闫阳,李家瑞.基于LEBERT的多模态领域知识图谱构建[J].计算机系统应用,2022,31(11):79-90. 被引量：3
6曹艳琴.基于深度学习的英语自然语言处理系统[J].系统仿真技术,2021,17(4):285-288. 被引量：1
7吴雅娟,杨壮壮,尚福华,解红涛,杜睿山.学习仪表盘在油田射孔取心工培训系统中的应用[J].系统仿真技术,2021,17(1):17-21.
8王昊,李晓敏,布文茹,赵梓博,邓三鸿.面向知识图谱生成的非遗丝织领域实体关系抽取研究[J].数据分析与知识发现,2024,8(8):179-190.
9朱丽雅,张珺,洪亮,罗绍辉,兰度.数字人文领域的知识图谱:研究进展与未来趋势[J].知识管理论坛,2022(1):87-100. 被引量：5
10熊回香,严舞月.基于知识图谱的数字档案服务模式探究[J].知识管理论坛,2021(4):204-212. 被引量：3

1顾亦然,薛宇辰,张腾飞.ID4TST:基于融合数据集的文本风格迁移模型[J].小型微型计算机系统,2024,45(10):2338-2344.
2杨丽萍,方其庆,胡亚慧,谷成刚,汪会敏.基于深度学习的预警装备知识图谱构建方法研究[J].现代防御技术,2024,52(5):61-72. 被引量：1
3王鑫,张文静,史伟,可乐乐.面向社会性昆虫识别的知识迁移DenseNet后训练剪枝轻量化模型研究[J].宁夏大学学报（自然科学版）,2024,45(3):307-314.
4屈喜文,韩瑶妹,胡冕军.基于单目视觉的空中手写数据采集系统[J].信息与控制,2024,53(3):339-352.
5彭亮,方思南,郑鉨彬.RTTVTS:实时端到端视频文本追踪[J].阜阳师范大学学报（自然科学版）,2024,41(3):14-20.
6郭瑞强,杨世龙,贾晓文,魏谦强.基于标签增强的细粒度文本分类[J].计算机工程与应用,2024,60(21):134-141.
7田萱,李嘉梁,孟晓欢.基于深度学习的抽取式摘要研究综述[J].计算机科学与探索,2024,18(11):2823-2847.
8王宇君,郭健,徐立,李宗明,李可欣.利用深度森林进行船舶类型分类识别[J].测绘科学技术学报,2024,40(4):425-432.
9朱梦涵,唐海,李贵荣,徐洪胜,刘洋.基于MacBERT与对抗训练的在线课程评论的方面词抽取[J].山西大同大学学报（自然科学版）,2024,40(5):21-26.

计算机科学与探索

2024年第11期

浏览历史

内容加载中请稍等...

面向文本实体关系抽取研究综述

参考文献21

二级参考文献213

共引文献1471

相关作者

相关机构

相关主题

浏览历史