-
题名基于指针网络的抽取生成式摘要生成模型
被引量:2
- 1
-
-
作者
陈伟
杨燕
-
机构
西南交通大学计算机与人工智能学院
-
出处
《计算机应用》
CSCD
北大核心
2021年第12期3527-3533,共7页
-
基金
国家自然科学基金面上项目(61976247)。
-
文摘
作为自然语言处理中的热点问题,摘要生成具有重要的研究意义。基于Seq2Seq模型的生成式摘要模型取得了良好的效果,然而抽取式的方法具有挖掘有效特征并抽取文章重要句子的潜力,因此如何利用抽取式方法来改进生成式方法是一个较好的研究方向。鉴于此,提出了融合生成式和抽取式方法的模型。首先,使用TextRank算法并融合主题相似度来抽取文章中有重要意义的句子。然后,设计了融合抽取信息语义的基于Seq2Seq模型的生成式框架来实现摘要生成任务;同时,引入指针网络解决模型训练中的未登录词(OOV)问题。综合以上步骤得到最终摘要,并在CNN/Daily Mail数据集上进行验证。结果表明在ROUGE-1、ROUGE-2和ROUGE-L三个指标上所提模型比传统TextRank算法均有所提升,同时也验证了融合抽取式和生成式方法在摘要生成领域中的有效性。
-
关键词
抽取生成式摘要
TextRank算法
Seq2Seq模型
指针网络
语义融合
-
Keywords
extractive and abstractive summarization
TextRank algorithm
Seq2Seq(Sequence-to-Sequence)model
pointer-generator network
semantic fusion
-
分类号
TP183
[自动化与计算机技术—控制理论与控制工程]
-