期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
268
篇文章
<
1
2
…
14
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
中文事件抽取技术研究
被引量:
105
1
作者
赵妍妍
秦兵
+1 位作者
车万翔
刘挺
《中文信息学报》
CSCD
北大核心
2008年第1期3-8,共6页
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了...
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了基于最大熵的多元分类的方法。这些方法很好的解决了事件抽取中训练实例正反例不平衡以及数据稀疏问题,取得了较好的系统性能。
展开更多
关键词
计算机应用
中文信息处理
事件抽取
事件类别识别
事件元素识别
下载PDF
职称材料
信息抽取研究综述
被引量:
84
2
作者
郭喜跃
何婷婷
《计算机科学》
CSCD
北大核心
2015年第2期14-17,38,共5页
信息抽取的任务是从大量数据中准确、快速地获取目标信息,提高信息的利用率。目前,信息抽取已经成为NLP领域的一个重要分支。随着互联网应用的发展,其价值也正日益显现,学术界和工业界对此都寄予厚望。首先回顾了信息抽取的发展历程;接...
信息抽取的任务是从大量数据中准确、快速地获取目标信息,提高信息的利用率。目前,信息抽取已经成为NLP领域的一个重要分支。随着互联网应用的发展,其价值也正日益显现,学术界和工业界对此都寄予厚望。首先回顾了信息抽取的发展历程;接着从命名实体识别、指代消解、关系抽取和事件抽取4个方面总结了信息抽取关键技术的研究进展;然后分析了信息抽取目前面临的若干主要问题;最后对信息抽取的研究趋势作了预测。
展开更多
关键词
信息抽取
命名实体识别
指代消解
关系抽取
事件抽取
下载PDF
职称材料
基于多任务学习的中文事件抽取联合模型
被引量:
43
3
作者
贺瑞芳
段绍杨
《软件学报》
EI
CSCD
北大核心
2019年第4期1015-1030,共16页
事件抽取旨在从非结构化的文本中提取人们感兴趣的信息,并以结构化的形式呈现给用户.当前,大多数中文事件抽取系统采用连续的管道模型,即:先识别事件触发词,后识别事件元素.其容易产生级联错误,且处于下游的任务无法将信息反馈至上游任...
事件抽取旨在从非结构化的文本中提取人们感兴趣的信息,并以结构化的形式呈现给用户.当前,大多数中文事件抽取系统采用连续的管道模型,即:先识别事件触发词,后识别事件元素.其容易产生级联错误,且处于下游的任务无法将信息反馈至上游任务,辅助上游任务的识别.将事件抽取看作序列标注任务,构建了基于CRF多任务学习的中文事件抽取联合模型.针对仅基于CRF的事件抽取联合模型的缺陷进行了两个扩展:首先,采用分类训练策略解决联合模型中事件元素的多标签问题(即:当一个事件提及中包含多个事件时,同一个实体往往会在不同的事件中扮演不同的角色).其次,由于处于同一事件大类下的事件子类,其事件元素存在高度的相互关联性.为此,提出采用多任务学习方法对各事件子类进行互增强的联合学习,进而有效缓解分类训练后的语料稀疏问题.在ACE2005中文语料上的实验证明了该方法的有效性.
展开更多
关键词
多任务学习
条件随机场(CRF)
事件抽取
下载PDF
职称材料
事件抽取技术研究综述
被引量:
30
4
作者
高强
游宏梁
《情报理论与实践》
CSSCI
北大核心
2013年第4期114-117,128,共5页
作为信息抽取的重要组成部分,事件抽取的研究具有广阔的应用前景和巨大的现实意义。文章阐述事件及事件抽取的基本概念,简单介绍事件抽取的发展历史,并从元事件抽取和主题事件抽取两个方面出发,详细介绍主要的研究方法与研究现状,总结...
作为信息抽取的重要组成部分,事件抽取的研究具有广阔的应用前景和巨大的现实意义。文章阐述事件及事件抽取的基本概念,简单介绍事件抽取的发展历史,并从元事件抽取和主题事件抽取两个方面出发,详细介绍主要的研究方法与研究现状,总结事件抽取发展所面临的挑战,并在此基础上展望事件抽取的研究趋势。
展开更多
关键词
事件抽取
信息抽取
信息技术
综述
原文传递
基于事理图谱的网络舆情演化路径分析——以医疗舆情为例
被引量:
28
5
作者
单晓红
庞世红
+1 位作者
刘晓燕
杨娟
《情报理论与实践》
CSSCI
北大核心
2019年第9期99-103,85,共6页
[目的/意义]网络舆情的监管和引导是舆情工作者面临的一项挑战。网络舆情演化路径分析可以为有关部门加强舆情监管提供决策参考。[方法/过程]以医疗领域网络舆情事件为例,微博相关评论为数据源,使用规则模板识别因果关系、提取事件对。...
[目的/意义]网络舆情的监管和引导是舆情工作者面临的一项挑战。网络舆情演化路径分析可以为有关部门加强舆情监管提供决策参考。[方法/过程]以医疗领域网络舆情事件为例,微博相关评论为数据源,使用规则模板识别因果关系、提取事件对。利用Word2vec训练词向量,通过K-means聚类将相似度较高的事件泛化为一类,分别构建网络舆情事理图谱和抽象网络舆情事理图谱,从两个层次分析网络舆情的演化路径。[结果/结论]结果表明,网络舆情事件的演化路径呈现多级性,且事件的演化方向不唯一。
展开更多
关键词
网络舆情
演化路径
事理图谱
事件抽取
原文传递
音乐领域典型事件抽取方法研究
被引量:
24
6
作者
丁效
宋凡
+1 位作者
秦兵
刘挺
《中文信息学报》
CSCD
北大核心
2011年第2期15-20,共6页
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该...
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。
展开更多
关键词
事件抽取
事件类型发现
事件类型识别
事件元素识别
下载PDF
职称材料
中文事件抽取研究综述
被引量:
26
7
作者
项威
王邦
《计算机技术与发展》
2020年第2期1-6,共6页
事件抽取是构建知识图谱的关键任务之一,也是当前自然语言处理的研究热点和难点问题。事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息,对人们认知世界有着深远的意义,在信息检索、智能问答、情感分析等应用场景...
事件抽取是构建知识图谱的关键任务之一,也是当前自然语言处理的研究热点和难点问题。事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息,对人们认知世界有着深远的意义,在信息检索、智能问答、情感分析等应用场景有着重要的意义和价值。在公开国际测评和语料的推动下,事件抽取研究受到越来越多的学者关注,取得了许多的研究成果。按照事件抽取任务定义,有预先定义结构化的事件表示框架的框架表示事件抽取和通过事件实例中触发词及事件元素进行聚类的实例表示事件抽取。根据事件抽取方法的不同,可以分为基于模式匹配的方法和基于机器学习的方法两大类,中文事件抽取方法还要考虑中文语言特性问题。文中全面介绍了中文事件抽取的任务和方法,并总结展望了未来的发展趋势。
展开更多
关键词
事件抽取
自然语言处理
中文信息处理
知识图谱
机器学习
下载PDF
职称材料
面向知识图谱构建的知识抽取技术综述
被引量:
22
8
作者
于浏洋
郭志刚
+1 位作者
陈刚
席耀一
《信息工程大学学报》
2020年第2期227-235,共9页
随着人工智能技术的高速发展,“信息爆炸和知识缺乏”的矛盾愈发凸显。通过知识抽取技术从海量异构数据中自动、快速、准确地抽取人们感兴趣的知识并将其以结构化的知识存储起来,是解决上述矛盾的有效途径之一。系统介绍了面向知识图谱...
随着人工智能技术的高速发展,“信息爆炸和知识缺乏”的矛盾愈发凸显。通过知识抽取技术从海量异构数据中自动、快速、准确地抽取人们感兴趣的知识并将其以结构化的知识存储起来,是解决上述矛盾的有效途径之一。系统介绍了面向知识图谱构建的知识抽取技术,分析比较了该领域不同方法之间的优缺点,同时对各个技术的研究进展和使用方法进行了总结,并对知识抽取领域仍需进一步关注的问题提出了思考。
展开更多
关键词
知识抽取
实体抽取
关系抽取
属性抽取
事件抽取
知识图谱
下载PDF
职称材料
面向网络舆情数据的异常行为识别
被引量:
22
9
作者
郝亚洲
郑庆华
+1 位作者
陈艳平
闫彩霞
《计算机研究与发展》
EI
CSCD
北大核心
2016年第3期611-620,共10页
社交网络的日益普及和移动设备快捷的网络接入,使得网络舆情的传播十分迅捷,民众对热点话题的关注度和参与度得到很大的提升.网络舆情具有自由性、交互性、多元性、偏差性、突发性等特点,能够左右民众的情感和判断,能推动和改变事件的...
社交网络的日益普及和移动设备快捷的网络接入,使得网络舆情的传播十分迅捷,民众对热点话题的关注度和参与度得到很大的提升.网络舆情具有自由性、交互性、多元性、偏差性、突发性等特点,能够左右民众的情感和判断,能推动和改变事件的发展和走向,容易被反对分子利用,已经成为影响社会稳定的重要因素.因此,及时检测、控制并引导舆情的发展具有十分重要的意义.研究关注网络中传播的蕴含有"破坏"、"危险"、"损失"等涉及公共安全或涉及司法公正的行为.根据课题的需要,定义4种关注的异常行为类型:攻击行为、受伤行为、死亡行为、拘捕行为.从数据挖掘和信息抽取的角度研究识别异常行为的方法,首先通过分类器和触发词从海量的数据中过滤出包含异常行为的句子,然后抽取异常行为句中包含的命名实体,最后利用抽取的实体构建异常行为共现网络,为分析人员提供可视化的网络舆情分析方法.
展开更多
关键词
网络舆情
事件抽取
异常行为识别
共现网
数据挖掘
下载PDF
职称材料
基于混合神经网络的实体和事件联合抽取方法
被引量:
19
10
作者
吴文涛
李培峰
朱巧明
《中文信息学报》
CSCD
北大核心
2019年第8期77-83,共7页
实体和事件抽取旨在从文本中识别出实体和事件信息并以结构化形式予以呈现。现有工作通常将实体抽取和事件抽取作为两个单独任务,忽略了这两个任务之间的紧密关系。实际上,事件和实体密切相关,实体往往在事件中充当参与者。该文提出了...
实体和事件抽取旨在从文本中识别出实体和事件信息并以结构化形式予以呈现。现有工作通常将实体抽取和事件抽取作为两个单独任务,忽略了这两个任务之间的紧密关系。实际上,事件和实体密切相关,实体往往在事件中充当参与者。该文提出了一种混合神经网络模型,同时对实体和事件进行抽取,挖掘两者之间的依赖关系。模型采用双向LSTM识别实体,并将在双向LSTM中获得的实体上下文信息进一步传递到结合了自注意力和门控卷积的神经网络来抽取事件。在英文ACE 2005语料库上的实验结果证明了该文方法优于目前最好的基准系统。
展开更多
关键词
事件抽取
实体抽取
自注意力
门控卷积神经网络
下载PDF
职称材料
事件抽取综述
被引量:
14
11
作者
马春明
李秀红
+2 位作者
李哲
王惠茹
杨丹
《计算机应用》
CSCD
北大核心
2022年第10期2975-2989,共15页
将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法...
将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。
展开更多
关键词
事件抽取
事件表示
元事件抽取
主题事件抽取
跨语言事件抽取
下载PDF
职称材料
基于卷积双向长短期记忆网络的事件触发词抽取
被引量:
18
12
作者
陈斌
周勇
刘兵
《计算机工程》
CAS
CSCD
北大核心
2019年第1期153-158,共6页
传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留...
传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留句子级别特征,从而提高事件触发词的抽取性能。在ACE2005英文语料上的实验结果表明,该方法在事件触发词识别与分类阶段的F值达到69. 5%,具有较好的抽取性能。
展开更多
关键词
事件抽取
触发词
卷积神经网络
循环神经网络
自然语言处理
特征提取
下载PDF
职称材料
中文新闻关键事件的主题句识别
被引量:
18
13
作者
王伟
赵东岩
赵伟
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第5期789-796,共8页
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新...
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
展开更多
关键词
计算机应用
中文信息处理
自然语言处理
自动文摘
事件抽取
新闻标题
下载PDF
职称材料
《左传》战争事件抽取技术研究
被引量:
17
14
作者
李章超
李忠凯
何琳
《图书情报工作》
CSSCI
北大核心
2020年第7期20-29,共10页
[目的/意义]针对《左传》中的战争事件展开研究,对先秦历史乃至中华民族文化的研究具有重要参考价值。[方法/过程]基于框架理论构建《左传》战争事件基本框架体系,利用模式匹配法进行战争句识别,选择条件随机场模型、结合特征模板对战...
[目的/意义]针对《左传》中的战争事件展开研究,对先秦历史乃至中华民族文化的研究具有重要参考价值。[方法/过程]基于框架理论构建《左传》战争事件基本框架体系,利用模式匹配法进行战争句识别,选择条件随机场模型、结合特征模板对战争时间、交战双方等7个命名实体进行识别和抽取,最后基于得到的结构化数据对战争事件进行分析和可视化展示。[结果/结论]研究结果表明,条件随机场模型能够较好地应用于《左传》战争事件的抽取;特征选取会影响实体识别的结果;具体内容方面,春秋时期晋国、楚国、齐国、郑国等国参战频率较高,晋国为主要进攻方,郑国为主要防守方。
展开更多
关键词
《左传》
战争事件
事件抽取
原文传递
神经网络事件抽取技术综述
被引量:
17
15
作者
秦彦霞
张民
郑德权
《智能计算机与应用》
2018年第3期1-5,10,共6页
事件抽取是信息抽取领域一个重要研究方向,对信息检索、自动问答、舆情分析等领域均有很高的应用价值。传统事件抽取方法大多采用人工构建的方式进行特征表示,并通过分类模型进行事件触发词分类和论元角色识别。近年来,神经网络方法在...
事件抽取是信息抽取领域一个重要研究方向,对信息检索、自动问答、舆情分析等领域均有很高的应用价值。传统事件抽取方法大多采用人工构建的方式进行特征表示,并通过分类模型进行事件触发词分类和论元角色识别。近年来,神经网络方法在图像分类、语音识别和自然语言处理等领域展现了突出的效果。神经网络方法的优势在于能够自动学习构建特征,从而避免了繁琐的特征工程。本文将对神经网络事件抽取技术进行系统论述,并展望未来的研究方向。
展开更多
关键词
事件抽取
信息抽取
神经网络
自动构建特征
下载PDF
职称材料
自动识别事件类别的中文事件抽取技术研究
被引量:
15
16
作者
许红磊
陈锦秀
+2 位作者
周昌乐
林如琦
杨肖方
《心智与计算》
2010年第1期34-44,共11页
本文提出一种新的中文事件抽取中自动识别事件类别的模型,即:基于事件实例句子的分类模型。该模型主要分为两个步骤:1)过滤掉句子集合中的非事件句子,并获得事件实例句子组成的集合;2)借助上一步获得的事件实例集合,通过多元分类的思想...
本文提出一种新的中文事件抽取中自动识别事件类别的模型,即:基于事件实例句子的分类模型。该模型主要分为两个步骤:1)过滤掉句子集合中的非事件句子,并获得事件实例句子组成的集合;2)借助上一步获得的事件实例集合,通过多元分类的思想,获得事件实例相应的事件类别。本实验的实验数据是ACE2005中文语料[1],实验表明我们的模型取得了良好的效果。
展开更多
关键词
事件抽取
分类
事件类别识别
原文传递
基于深度神经网络的信息抽取研究综述
被引量:
11
17
作者
代建华
彭若瑶
+3 位作者
许路
蒋超
曾道建
李扬定
《西南师范大学学报(自然科学版)》
CAS
2022年第4期1-11,共11页
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的...
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的有效手段,是实现大数据资源化、知识化和普适化的核心技术,此外进一步为更高层面的应用和任务提供了支撑.文章对基于深度神经网络的信息抽取相关研究进行了综述,首先,简要概述了信息抽取的任务定义、目标和意义,然后,回顾了信息抽取任务的发展历程,接下来,从实体抽取、实体关系抽取、事件抽取和事件关系抽取4个方面梳理了近几年关键技术的研究进展.最后,文章对信息抽取领域的未来发展趋势进行了分析和展望.
展开更多
关键词
信息抽取
深度神经网络
实体抽取
实体关系抽取
事件抽取
事件关系抽取
下载PDF
职称材料
事件图谱的构建、推理与应用
被引量:
13
18
作者
胡志磊
靳小龙
+1 位作者
陈剑赟
黄冠利
《大数据》
2021年第3期80-96,共17页
近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在...
近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在构建、推理与应用方面的关键技术,主要包括事件抽取、事件信息补全、事件关系推断以及事件预测技术。给出了事件图谱的具体应用场景,并且针对事件图谱研究中存在的挑战,对未来的研究趋势进行了展望。
展开更多
关键词
知识图谱
事件图谱
事件知识
事件抽取
事件推理
下载PDF
职称材料
基于事件抽取的网络新闻多文档自动摘要
被引量:
15
19
作者
韩永峰
许旭阳
+2 位作者
李弼程
朱武斌
陈刚
《中文信息学报》
CSCD
北大核心
2012年第1期58-66,共9页
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新...
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
展开更多
关键词
事件抽取
中文信息处理
分类
新闻文档
聚类
自动摘要
下载PDF
职称材料
基于RoBERTa-CRF的古文历史事件抽取方法研究
被引量:
15
20
作者
喻雪寒
何琳
徐健
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第7期26-35,共10页
【目的】为有效抽取典籍中蕴含的事件信息,构建面向典籍的事件抽取框架,并采用RoBERTa-CRF模型实现事件类型、论元角色和论元的抽取。【方法】选择《左传》的战争句作为实验数据,建立事件类型和论元角色的分类模板。基于RoBERTa-CRF模型...
【目的】为有效抽取典籍中蕴含的事件信息,构建面向典籍的事件抽取框架,并采用RoBERTa-CRF模型实现事件类型、论元角色和论元的抽取。【方法】选择《左传》的战争句作为实验数据,建立事件类型和论元角色的分类模板。基于RoBERTa-CRF模型,先用多层Transformer提取语料特征,再结合前后文序列标签学习相关性约束,由输出的标记序列识别论元并对其进行抽取。【结果】对比GuwenBERT-LSTM、BERT-LSTM、RoBERTa-LSTM、BERT-CRF、RoBERTa-CRF等5种模型在数据集上的事件抽取实验结果,RoBERTa-CRF的精确度为87.6%、召回率为77.2%、F1值达到82.1%,验证了该模型的有效性和可操作性。【局限】使用的数据集规模较小,无法使主题类别更均衡化。【结论】本文构建的RoBERTa-CRF模型提升了面向《左传》战争句的事件抽取效果。
展开更多
关键词
RoBERTa
CRF
事件抽取
古文
原文传递
题名
中文事件抽取技术研究
被引量:
105
1
作者
赵妍妍
秦兵
车万翔
刘挺
机构
哈尔滨工业大学计算机学院信息检索研究室
出处
《中文信息学报》
CSCD
北大核心
2008年第1期3-8,共6页
基金
国家自然科学基金资助项目(60575042
60675034)
国家863资助项目(2006AA01Z145)
文摘
事件抽取是信息抽取领域一个重要的研究方向,本文对事件抽取的两项关键技术——事件类别识别以及事件元素识别进行了深入研究。在事件类别识别阶段,本文采用了一种基于触发词扩展和二元分类相结合的方法;在事件元素识别阶段,本文采用了基于最大熵的多元分类的方法。这些方法很好的解决了事件抽取中训练实例正反例不平衡以及数据稀疏问题,取得了较好的系统性能。
关键词
计算机应用
中文信息处理
事件抽取
事件类别识别
事件元素识别
Keywords
computer
application
Chinese
information
processing
event
extraction
event
type
recognition
event
argument
recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
信息抽取研究综述
被引量:
84
2
作者
郭喜跃
何婷婷
机构
华中师范大学国家数字化学习工程技术研究中心
兴义民族师范学院信息技术学院
出处
《计算机科学》
CSCD
北大核心
2015年第2期14-17,38,共5页
基金
国家语委"十二五"重点项目(ZDI125-1)
国家"十二五"科技支撑计划课题(2012BAK24B01)
+1 种基金
教育部国家外国专家局高等学校学科创新引智计划项目(B07042)
湖北省自然科学基金重点项目(2011CDA034)资助
文摘
信息抽取的任务是从大量数据中准确、快速地获取目标信息,提高信息的利用率。目前,信息抽取已经成为NLP领域的一个重要分支。随着互联网应用的发展,其价值也正日益显现,学术界和工业界对此都寄予厚望。首先回顾了信息抽取的发展历程;接着从命名实体识别、指代消解、关系抽取和事件抽取4个方面总结了信息抽取关键技术的研究进展;然后分析了信息抽取目前面临的若干主要问题;最后对信息抽取的研究趋势作了预测。
关键词
信息抽取
命名实体识别
指代消解
关系抽取
事件抽取
Keywords
Information
extraction
Named-entity
recognition
Anaphora
resolution
Relation
extraction
event
extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于多任务学习的中文事件抽取联合模型
被引量:
43
3
作者
贺瑞芳
段绍杨
机构
天津大学智能与计算学部
天津市认知计算与应用重点实验室
出处
《软件学报》
EI
CSCD
北大核心
2019年第4期1015-1030,共16页
基金
国家自然科学基金(61472277)
天津市自然科学基金(18JCYBJC15500)~~
文摘
事件抽取旨在从非结构化的文本中提取人们感兴趣的信息,并以结构化的形式呈现给用户.当前,大多数中文事件抽取系统采用连续的管道模型,即:先识别事件触发词,后识别事件元素.其容易产生级联错误,且处于下游的任务无法将信息反馈至上游任务,辅助上游任务的识别.将事件抽取看作序列标注任务,构建了基于CRF多任务学习的中文事件抽取联合模型.针对仅基于CRF的事件抽取联合模型的缺陷进行了两个扩展:首先,采用分类训练策略解决联合模型中事件元素的多标签问题(即:当一个事件提及中包含多个事件时,同一个实体往往会在不同的事件中扮演不同的角色).其次,由于处于同一事件大类下的事件子类,其事件元素存在高度的相互关联性.为此,提出采用多任务学习方法对各事件子类进行互增强的联合学习,进而有效缓解分类训练后的语料稀疏问题.在ACE2005中文语料上的实验证明了该方法的有效性.
关键词
多任务学习
条件随机场(CRF)
事件抽取
Keywords
multi-task
learning
condition
random
field
(CRF)
event
extraction
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
事件抽取技术研究综述
被引量:
30
4
作者
高强
游宏梁
机构
中国国防科技信息中心
出处
《情报理论与实践》
CSSCI
北大核心
2013年第4期114-117,128,共5页
文摘
作为信息抽取的重要组成部分,事件抽取的研究具有广阔的应用前景和巨大的现实意义。文章阐述事件及事件抽取的基本概念,简单介绍事件抽取的发展历史,并从元事件抽取和主题事件抽取两个方面出发,详细介绍主要的研究方法与研究现状,总结事件抽取发展所面临的挑战,并在此基础上展望事件抽取的研究趋势。
关键词
事件抽取
信息抽取
信息技术
综述
Keywords
event
extraction
information
extraction
information
technology
review
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于事理图谱的网络舆情演化路径分析——以医疗舆情为例
被引量:
28
5
作者
单晓红
庞世红
刘晓燕
杨娟
机构
北京工业大学经济与管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2019年第9期99-103,85,共6页
基金
国家社会科学基金青年项目“基于多维信息计量分析的学术影响力综合评价研究”(项目编号:15CTQ023)
北京自然科学基金资助项目“基于技术交易数据的京津冀科技协同创新潜力挖掘”(项目编号:9172002)
北京自然科学基金资助项目“多重共现耦合的科技知识网络关联发现研究:链路预测的视角”(项目编号:9174029)的成果
文摘
[目的/意义]网络舆情的监管和引导是舆情工作者面临的一项挑战。网络舆情演化路径分析可以为有关部门加强舆情监管提供决策参考。[方法/过程]以医疗领域网络舆情事件为例,微博相关评论为数据源,使用规则模板识别因果关系、提取事件对。利用Word2vec训练词向量,通过K-means聚类将相似度较高的事件泛化为一类,分别构建网络舆情事理图谱和抽象网络舆情事理图谱,从两个层次分析网络舆情的演化路径。[结果/结论]结果表明,网络舆情事件的演化路径呈现多级性,且事件的演化方向不唯一。
关键词
网络舆情
演化路径
事理图谱
事件抽取
Keywords
internet
public
opinion
evolution
path
event
evolution
graph
event
extraction
分类号
G206 [文化科学—传播学]
C912.63 [经济管理]
原文传递
题名
音乐领域典型事件抽取方法研究
被引量:
24
6
作者
丁效
宋凡
秦兵
刘挺
机构
哈尔滨工业大学计算机学院
出处
《中文信息学报》
CSCD
北大核心
2011年第2期15-20,共6页
基金
国家自然科学基金资助项目(60975055,60803093)
国家863计划资助项目(2008AA01Z144)
高等学校博士学科点专项科研基金资助课题(2007021346)
文摘
事件抽取是信息抽取领域一个重要的研究方向。该文从音乐领域的事件抽取出发,通过领域事件词聚类的方法自动发现音乐领域具有代表性的事件,然后采用基于关键词与触发词相结合的过滤方法简化了事件类型的识别过程。在事件元素识别中,该文采用了基于最大熵的事件元素识别方法。在该文构建的语料库下,最终事件类型识别的平均F值达到82.82%,事件元素识别的平均F值达到75.79%。
关键词
事件抽取
事件类型发现
事件类型识别
事件元素识别
Keywords
event
extraction
event
type
detection
event
type
recognition
event
argument
recognition
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文事件抽取研究综述
被引量:
26
7
作者
项威
王邦
机构
华中科技大学电子信息与通信学院
出处
《计算机技术与发展》
2020年第2期1-6,共6页
基金
国家自然科学基金(61771209)
文摘
事件抽取是构建知识图谱的关键任务之一,也是当前自然语言处理的研究热点和难点问题。事件抽取研究从非结构化的自然语言文本中自动抽取用户感兴趣的事件信息,对人们认知世界有着深远的意义,在信息检索、智能问答、情感分析等应用场景有着重要的意义和价值。在公开国际测评和语料的推动下,事件抽取研究受到越来越多的学者关注,取得了许多的研究成果。按照事件抽取任务定义,有预先定义结构化的事件表示框架的框架表示事件抽取和通过事件实例中触发词及事件元素进行聚类的实例表示事件抽取。根据事件抽取方法的不同,可以分为基于模式匹配的方法和基于机器学习的方法两大类,中文事件抽取方法还要考虑中文语言特性问题。文中全面介绍了中文事件抽取的任务和方法,并总结展望了未来的发展趋势。
关键词
事件抽取
自然语言处理
中文信息处理
知识图谱
机器学习
Keywords
event
extraction
natural
language
processing
Chinese
information
processing
knowledge
graph
machine
learning
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向知识图谱构建的知识抽取技术综述
被引量:
22
8
作者
于浏洋
郭志刚
陈刚
席耀一
机构
信息工程大学
出处
《信息工程大学学报》
2020年第2期227-235,共9页
基金
国家社会科学基金资助项目(19CXW027)。
文摘
随着人工智能技术的高速发展,“信息爆炸和知识缺乏”的矛盾愈发凸显。通过知识抽取技术从海量异构数据中自动、快速、准确地抽取人们感兴趣的知识并将其以结构化的知识存储起来,是解决上述矛盾的有效途径之一。系统介绍了面向知识图谱构建的知识抽取技术,分析比较了该领域不同方法之间的优缺点,同时对各个技术的研究进展和使用方法进行了总结,并对知识抽取领域仍需进一步关注的问题提出了思考。
关键词
知识抽取
实体抽取
关系抽取
属性抽取
事件抽取
知识图谱
Keywords
knowledge
extraction
entity
extraction
relationship
extraction
attribute
extraction
event
extraction
knowledge
graph
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
面向网络舆情数据的异常行为识别
被引量:
22
9
作者
郝亚洲
郑庆华
陈艳平
闫彩霞
机构
陕西省天地网技术重点实验室(西安交通大学)
西安交通大学计算机科学与技术系
出处
《计算机研究与发展》
EI
CSCD
北大核心
2016年第3期611-620,共10页
基金
国家自然科学基金项目(91118005
91218301
+1 种基金
91418205)
国家"八六三"高技术研究发展计划基金项目(2012AA011003)~~
文摘
社交网络的日益普及和移动设备快捷的网络接入,使得网络舆情的传播十分迅捷,民众对热点话题的关注度和参与度得到很大的提升.网络舆情具有自由性、交互性、多元性、偏差性、突发性等特点,能够左右民众的情感和判断,能推动和改变事件的发展和走向,容易被反对分子利用,已经成为影响社会稳定的重要因素.因此,及时检测、控制并引导舆情的发展具有十分重要的意义.研究关注网络中传播的蕴含有"破坏"、"危险"、"损失"等涉及公共安全或涉及司法公正的行为.根据课题的需要,定义4种关注的异常行为类型:攻击行为、受伤行为、死亡行为、拘捕行为.从数据挖掘和信息抽取的角度研究识别异常行为的方法,首先通过分类器和触发词从海量的数据中过滤出包含异常行为的句子,然后抽取异常行为句中包含的命名实体,最后利用抽取的实体构建异常行为共现网络,为分析人员提供可视化的网络舆情分析方法.
关键词
网络舆情
事件抽取
异常行为识别
共现网
数据挖掘
Keywords
public
opinion
event
extraction
recognition
of
abnormal
behavior
co-occurrence
network
data
mining
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于混合神经网络的实体和事件联合抽取方法
被引量:
19
10
作者
吴文涛
李培峰
朱巧明
机构
苏州大学计算机科学与技术学院
江苏省计算机信息技术处理重点实验室
出处
《中文信息学报》
CSCD
北大核心
2019年第8期77-83,共7页
基金
国家自然科学基金(61472265,61773276,61836007)
文摘
实体和事件抽取旨在从文本中识别出实体和事件信息并以结构化形式予以呈现。现有工作通常将实体抽取和事件抽取作为两个单独任务,忽略了这两个任务之间的紧密关系。实际上,事件和实体密切相关,实体往往在事件中充当参与者。该文提出了一种混合神经网络模型,同时对实体和事件进行抽取,挖掘两者之间的依赖关系。模型采用双向LSTM识别实体,并将在双向LSTM中获得的实体上下文信息进一步传递到结合了自注意力和门控卷积的神经网络来抽取事件。在英文ACE 2005语料库上的实验结果证明了该文方法优于目前最好的基准系统。
关键词
事件抽取
实体抽取
自注意力
门控卷积神经网络
Keywords
event
extraction
entity
extraction
self-attention
gated
convolutional
neural
networks
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
事件抽取综述
被引量:
14
11
作者
马春明
李秀红
李哲
王惠茹
杨丹
机构
新疆大学信息科学与工程学院
香港理工大学电子及资讯工程学系
出处
《计算机应用》
CSCD
北大核心
2022年第10期2975-2989,共15页
基金
国家语委科研重点项目(ZDI135-96)。
文摘
将用户感兴趣的事件从非结构化信息中提取出来,然后以结构化的方式展示给用户,这就是事件抽取。事件抽取在信息收集、信息检索、文档合成、信息问答等方面有着广泛应用。从全局出发,事件抽取算法可以分为基于模式匹配的算法、触发词法、基于本体的算法以及前沿联合模型方法这四类。在研究过程中根据相关需求可使用不同评价方法和数据集,而不同的事件表示方法也与事件抽取研究有一定联系;以任务类型区分,元事件抽取和主题事件抽取是事件抽取的两大基本任务。其中,元事件抽取有基于模式匹配、基于机器学习和基于神经网络这三种方式,而主题事件抽取有基于事件框架和基于本体两种方式。事件抽取研究在中英等单语言上均已取得了优秀成果,而跨语言事件抽取依然面临着许多问题。最后,总结了事件抽取的相关工作并提出未来研究方向,以期为后续研究提供参考。
关键词
事件抽取
事件表示
元事件抽取
主题事件抽取
跨语言事件抽取
Keywords
event
extraction
event
representation
meta-
event
extraction
subject
event
extraction
cross-language
event
extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于卷积双向长短期记忆网络的事件触发词抽取
被引量:
18
12
作者
陈斌
周勇
刘兵
机构
中国矿业大学计算机科学与技术学院
中国科学院电子研究所
出处
《计算机工程》
CAS
CSCD
北大核心
2019年第1期153-158,共6页
基金
国家自然科学基金青年基金"面向高维数据的稀疏非参核学习方法研究"(61403394)
国家自然科学基金面上项目"多目标低秩非参核学习模型与优化方法研究"(61572505)
文摘
传统事件触发词抽取方法在特征提取过程中过分依赖自然语言处理工具,容易造成误差累积。为解决该问题,在卷积双向长短期记忆网络的基础上,提出一种事件触发词抽取方法。通过卷积操作提取单词上下文语境信息,同时利用长短期记忆网络保留句子级别特征,从而提高事件触发词的抽取性能。在ACE2005英文语料上的实验结果表明,该方法在事件触发词识别与分类阶段的F值达到69. 5%,具有较好的抽取性能。
关键词
事件抽取
触发词
卷积神经网络
循环神经网络
自然语言处理
特征提取
Keywords
event
extraction
trigger
word
Convolutional
Neural
Network(CNN)
Recurrent
Neural
Network(RNN)
Natural
Language
Processing(NLP)
feature
extraction
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
中文新闻关键事件的主题句识别
被引量:
18
13
作者
王伟
赵东岩
赵伟
机构
北京大学计算科学与技术研究所
武警工程学院电子技术系
计算语言学教育部重点实验室
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011年第5期789-796,共8页
基金
国家自然科学基金(61003009)
北京市科委基金(Z101101005010003)
高等学校博士学科点专项科研基金(20100001120029)资助
文摘
提出在单文档中通过提取主题句以获取关键事件信息的思想。根据新闻的体裁特点,分析了新闻报道与事件的关系,以及新闻标题在内容、形式和语言方面的特征。提出利用标题的提示性信息提取主题句来描述新闻关键事件的方法。该方法首先对新闻标题按信息含量进行分类,然后结合新闻句子的词频、长度、位置、与标题的相似度等特征计算句子的重要性。实验表明,该方法能够准确提取新闻主题句,为进一步抽取事件信息打好了基础。
关键词
计算机应用
中文信息处理
自然语言处理
自动文摘
事件抽取
新闻标题
Keywords
computer
application
Chinese
information
processing
natural
language
processing
automatic
text
abstract
event
extraction
news
headline
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
《左传》战争事件抽取技术研究
被引量:
17
14
作者
李章超
李忠凯
何琳
机构
南京农业大学信息管理系
出处
《图书情报工作》
CSSCI
北大核心
2020年第7期20-29,共10页
基金
国家社会科学基金项目"基于典籍的中华传统文化知识表达体系自动构建方法"(项目编号:18BTQ063)研究成果之一。
文摘
[目的/意义]针对《左传》中的战争事件展开研究,对先秦历史乃至中华民族文化的研究具有重要参考价值。[方法/过程]基于框架理论构建《左传》战争事件基本框架体系,利用模式匹配法进行战争句识别,选择条件随机场模型、结合特征模板对战争时间、交战双方等7个命名实体进行识别和抽取,最后基于得到的结构化数据对战争事件进行分析和可视化展示。[结果/结论]研究结果表明,条件随机场模型能够较好地应用于《左传》战争事件的抽取;特征选取会影响实体识别的结果;具体内容方面,春秋时期晋国、楚国、齐国、郑国等国参战频率较高,晋国为主要进攻方,郑国为主要防守方。
关键词
《左传》
战争事件
事件抽取
Keywords
Zuo
Zhuan
war
event
event
extraction
分类号
G255 [文化科学—图书馆学]
原文传递
题名
神经网络事件抽取技术综述
被引量:
17
15
作者
秦彦霞
张民
郑德权
机构
哈尔滨工业大学计算机科学与技术学院
苏州大学计算机科学与技术学院
出处
《智能计算机与应用》
2018年第3期1-5,10,共6页
基金
国家高技术研究发展计划(863)(2015AA015405)
文摘
事件抽取是信息抽取领域一个重要研究方向,对信息检索、自动问答、舆情分析等领域均有很高的应用价值。传统事件抽取方法大多采用人工构建的方式进行特征表示,并通过分类模型进行事件触发词分类和论元角色识别。近年来,神经网络方法在图像分类、语音识别和自然语言处理等领域展现了突出的效果。神经网络方法的优势在于能够自动学习构建特征,从而避免了繁琐的特征工程。本文将对神经网络事件抽取技术进行系统论述,并展望未来的研究方向。
关键词
事件抽取
信息抽取
神经网络
自动构建特征
Keywords
event
extraction
information
extraction
neural
network
automatic
feature
learning
分类号
TP391.01 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
自动识别事件类别的中文事件抽取技术研究
被引量:
15
16
作者
许红磊
陈锦秀
周昌乐
林如琦
杨肖方
机构
厦门大学计算机科学系
厦门大学智能科学与技术系
福建省仿脑智能系统重点实验室(厦门大学)
出处
《心智与计算》
2010年第1期34-44,共11页
文摘
本文提出一种新的中文事件抽取中自动识别事件类别的模型,即:基于事件实例句子的分类模型。该模型主要分为两个步骤:1)过滤掉句子集合中的非事件句子,并获得事件实例句子组成的集合;2)借助上一步获得的事件实例集合,通过多元分类的思想,获得事件实例相应的事件类别。本实验的实验数据是ACE2005中文语料[1],实验表明我们的模型取得了良好的效果。
关键词
事件抽取
分类
事件类别识别
Keywords
event
extraction
classification
event
type
identification
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
原文传递
题名
基于深度神经网络的信息抽取研究综述
被引量:
11
17
作者
代建华
彭若瑶
许路
蒋超
曾道建
李扬定
机构
湖南师范大学语言与文化研究院/智能计算与语言信息处理湖南省重点实验室
出处
《西南师范大学学报(自然科学版)》
CAS
2022年第4期1-11,共11页
基金
国家自然科学基金项目(61602059)
湖南省自然科学基金项目(2020JJ4624)
+2 种基金
国家社会科学基金项目(20&ZD047)
湖南省教育厅科研基金项目(19A020)
湖南师范大学语言与文化研究院青年培育项目(2020QNP05).
文摘
信息抽取任务旨在从非结构化的文本中抽取出结构化的信息,帮助将海量信息进行自动分类、提取和重构,提高信息的利用率.目前,基于深度神经网络的信息抽取技术已经成为自然语言处理领域最重要的研究主题之一,它提供了分析非结构化文本的有效手段,是实现大数据资源化、知识化和普适化的核心技术,此外进一步为更高层面的应用和任务提供了支撑.文章对基于深度神经网络的信息抽取相关研究进行了综述,首先,简要概述了信息抽取的任务定义、目标和意义,然后,回顾了信息抽取任务的发展历程,接下来,从实体抽取、实体关系抽取、事件抽取和事件关系抽取4个方面梳理了近几年关键技术的研究进展.最后,文章对信息抽取领域的未来发展趋势进行了分析和展望.
关键词
信息抽取
深度神经网络
实体抽取
实体关系抽取
事件抽取
事件关系抽取
Keywords
information
extraction
deep
neural
network
entity
extraction
entity
relation
extraction
event
extraction
event
relation
extraction
分类号
TP18 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
事件图谱的构建、推理与应用
被引量:
13
18
作者
胡志磊
靳小龙
陈剑赟
黄冠利
机构
中国科学院网络数据科学与技术重点实验室
中国科学院计算技术研究所
中国科学院大学计算机科学与技术学院
北京市信息技术研究所
北京电子科技职业学院
出处
《大数据》
2021年第3期80-96,共17页
基金
国家重点研发计划资助项目(No.2016QY02D0404)
国家自然科学基金资助项目(No.U1911401,No.61772501,No.62002341,No.U1836206)。
文摘
近些年,知识图谱的构建技术得到了极大的发展,构建好的知识图谱已经被应用到众多领域。在此基础上,研究者将目光从知识图谱转向事件图谱。事件图谱以事件为核心,准确地描述了事件信息以及事件之间的关联关系。基于此,总结了事件图谱在构建、推理与应用方面的关键技术,主要包括事件抽取、事件信息补全、事件关系推断以及事件预测技术。给出了事件图谱的具体应用场景,并且针对事件图谱研究中存在的挑战,对未来的研究趋势进行了展望。
关键词
知识图谱
事件图谱
事件知识
事件抽取
事件推理
Keywords
knowledge
graph
event
graph
event
knowledge
event
extraction
event
reasoning
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于事件抽取的网络新闻多文档自动摘要
被引量:
15
19
作者
韩永峰
许旭阳
李弼程
朱武斌
陈刚
机构
解放军信息工程大学信息工程学院
出处
《中文信息学报》
CSCD
北大核心
2012年第1期58-66,共9页
基金
国家社科重大基金项目(09&ZD014)
国家"863"计划资助项目(2007AA01Z439)
文摘
目前,有代表性的自动摘要方法是根据文本片段进行聚类,较传统方法避免了信息冗余,但网络新闻文本中有些文本片段和主题无关,影响了聚类的效果,导致最终生成的摘要不够简洁。为此,该文引入事件抽取技术,提出了一种基于事件抽取的网络新闻多文档自动摘要方法。该方法首先通过二元分类器辨析出文本中的事件和非事件;然后通过聚类将文档原来以段落或句子为单位的物理划分转化为以事件为单位的内容逻辑划分,最后通过主旨事件抽取、排序及润色,生成摘要。实验结果表明,该方法是有效的,显著提高了生成摘要的质量。
关键词
事件抽取
中文信息处理
分类
新闻文档
聚类
自动摘要
Keywords
event
extraction
Chinese
information
processing
classification
news
text
clustering
automatic
summarization
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于RoBERTa-CRF的古文历史事件抽取方法研究
被引量:
15
20
作者
喻雪寒
何琳
徐健
机构
南京农业大学信息管理学院
出处
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021年第7期26-35,共10页
基金
南京农业大学中央高校基本科研业务费(项目编号:SKCX2020006)
中国博士后面上基金(项目编号:2020M681652)的研究成果之一。
文摘
【目的】为有效抽取典籍中蕴含的事件信息,构建面向典籍的事件抽取框架,并采用RoBERTa-CRF模型实现事件类型、论元角色和论元的抽取。【方法】选择《左传》的战争句作为实验数据,建立事件类型和论元角色的分类模板。基于RoBERTa-CRF模型,先用多层Transformer提取语料特征,再结合前后文序列标签学习相关性约束,由输出的标记序列识别论元并对其进行抽取。【结果】对比GuwenBERT-LSTM、BERT-LSTM、RoBERTa-LSTM、BERT-CRF、RoBERTa-CRF等5种模型在数据集上的事件抽取实验结果,RoBERTa-CRF的精确度为87.6%、召回率为77.2%、F1值达到82.1%,验证了该模型的有效性和可操作性。【局限】使用的数据集规模较小,无法使主题类别更均衡化。【结论】本文构建的RoBERTa-CRF模型提升了面向《左传》战争句的事件抽取效果。
关键词
RoBERTa
CRF
事件抽取
古文
Keywords
RoBERTa
CRF
event
extraction
Ancient
Chinese
Language
分类号
TP391 [自动化与计算机技术—计算机应用技术]
G255 [自动化与计算机技术—计算机科学与技术]
原文传递
题名
作者
出处
发文年
被引量
操作
1
中文事件抽取技术研究
赵妍妍
秦兵
车万翔
刘挺
《中文信息学报》
CSCD
北大核心
2008
105
下载PDF
职称材料
2
信息抽取研究综述
郭喜跃
何婷婷
《计算机科学》
CSCD
北大核心
2015
84
下载PDF
职称材料
3
基于多任务学习的中文事件抽取联合模型
贺瑞芳
段绍杨
《软件学报》
EI
CSCD
北大核心
2019
43
下载PDF
职称材料
4
事件抽取技术研究综述
高强
游宏梁
《情报理论与实践》
CSSCI
北大核心
2013
30
原文传递
5
基于事理图谱的网络舆情演化路径分析——以医疗舆情为例
单晓红
庞世红
刘晓燕
杨娟
《情报理论与实践》
CSSCI
北大核心
2019
28
原文传递
6
音乐领域典型事件抽取方法研究
丁效
宋凡
秦兵
刘挺
《中文信息学报》
CSCD
北大核心
2011
24
下载PDF
职称材料
7
中文事件抽取研究综述
项威
王邦
《计算机技术与发展》
2020
26
下载PDF
职称材料
8
面向知识图谱构建的知识抽取技术综述
于浏洋
郭志刚
陈刚
席耀一
《信息工程大学学报》
2020
22
下载PDF
职称材料
9
面向网络舆情数据的异常行为识别
郝亚洲
郑庆华
陈艳平
闫彩霞
《计算机研究与发展》
EI
CSCD
北大核心
2016
22
下载PDF
职称材料
10
基于混合神经网络的实体和事件联合抽取方法
吴文涛
李培峰
朱巧明
《中文信息学报》
CSCD
北大核心
2019
19
下载PDF
职称材料
11
事件抽取综述
马春明
李秀红
李哲
王惠茹
杨丹
《计算机应用》
CSCD
北大核心
2022
14
下载PDF
职称材料
12
基于卷积双向长短期记忆网络的事件触发词抽取
陈斌
周勇
刘兵
《计算机工程》
CAS
CSCD
北大核心
2019
18
下载PDF
职称材料
13
中文新闻关键事件的主题句识别
王伟
赵东岩
赵伟
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2011
18
下载PDF
职称材料
14
《左传》战争事件抽取技术研究
李章超
李忠凯
何琳
《图书情报工作》
CSSCI
北大核心
2020
17
原文传递
15
神经网络事件抽取技术综述
秦彦霞
张民
郑德权
《智能计算机与应用》
2018
17
下载PDF
职称材料
16
自动识别事件类别的中文事件抽取技术研究
许红磊
陈锦秀
周昌乐
林如琦
杨肖方
《心智与计算》
2010
15
原文传递
17
基于深度神经网络的信息抽取研究综述
代建华
彭若瑶
许路
蒋超
曾道建
李扬定
《西南师范大学学报(自然科学版)》
CAS
2022
11
下载PDF
职称材料
18
事件图谱的构建、推理与应用
胡志磊
靳小龙
陈剑赟
黄冠利
《大数据》
2021
13
下载PDF
职称材料
19
基于事件抽取的网络新闻多文档自动摘要
韩永峰
许旭阳
李弼程
朱武斌
陈刚
《中文信息学报》
CSCD
北大核心
2012
15
下载PDF
职称材料
20
基于RoBERTa-CRF的古文历史事件抽取方法研究
喻雪寒
何琳
徐健
《数据分析与知识发现》
CSSCI
CSCD
北大核心
2021
15
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
2
…
14
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部