-
题名融入多特征的篇章级新闻要素关系抽取
被引量:1
- 1
-
-
作者
党雪云
王剑
-
机构
昆明理工大学信息工程与自动化学院
云南省人工智能重点实验室
-
出处
《电视技术》
2022年第6期73-78,共6页
-
基金
国家重点研发计划(No.2018YFC0830105
No.2018YFC0830101
No.2018YFC0830100)。
-
文摘
随着互联网信息技术高速更新迭代,新闻文本信息在以指数级的速度增多。面对海量的新闻文本信息,如何自动提取长篇新闻文本中要素与要素之间的关系,成为研究的重点。篇章级新闻要素关系抽取是指从篇章级新闻文本中跨句子识别要素之间的关系信息,有助于加速人们对整篇新闻文本脉络的理解。本文以舆情新闻文本为例,提出融入多特征的篇章级新闻要素关系抽取方法,通过异构图模型将句子间的邻接关系、从属关系、句法依赖关系、要素间的多跳关系等多种特征进行融合,充分挖掘文本中潜在的上下文信息。在构建的篇章级舆情新闻要素关系数据集上的实验结果表明,融入的多种特征对要素关系抽取的性能均有明显的提升,F1值最高提升了4.09%,较目前主流方法取得了更好的效果。
-
关键词
舆情新闻文本信息
篇章级要素关系抽取
异构图模型
-
Keywords
discourse-level element relation extraction
heterogeneous graph
public opinion news text information
-
分类号
TN931.3
[电子电信—信号与信息处理]
-