期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向长文本涉法舆情信息的混合式摘要方法
1
作者 席铁钧 段宗涛 +4 位作者 曹建荣 杨博 卜娜娜 刘悦霞 肖媛媛 《中文信息学报》 CSCD 北大核心 2024年第7期63-72,共10页
旨在从冗长复杂的舆情文本中,准确地生成简短摘要。在长文本涉法舆情摘要中,现有的自动文本摘要方法存在语义不连贯、关键信息丢失的问题。为此,该文提出了一种结合抽取式和生成式的混合式摘要方法。首先将长文本分成多个语义片段;其次... 旨在从冗长复杂的舆情文本中,准确地生成简短摘要。在长文本涉法舆情摘要中,现有的自动文本摘要方法存在语义不连贯、关键信息丢失的问题。为此,该文提出了一种结合抽取式和生成式的混合式摘要方法。首先将长文本分成多个语义片段;其次采用无监督对比学习方法微调RoBERTa-wwm-ext模型进行语义片段的表征;然后使用膨胀门卷积神经网络抽取与摘要相关的语义片段,合成抽取文本;最后通过微调预训练语言模型PEGASUS对抽取文本进行摘要生成,以获得最佳生成摘要。在CAIL 2022涉法舆情摘要数据集上的实验结果表明,相比于其他的基线模型,该方法能够生成ROUGE和BLEU得分更高的摘要,进一步提升了摘要的可靠性。 展开更多
关键词 涉法舆情摘要 混合式摘要 预训练语言模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部