期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
Recent Advances on Neural Headline Generation 被引量:5
1
作者 Ayana Shi-Qi Shen +4 位作者 Yan-Kai Lin Cun-Chao Tu Yu Zhao Zhi-Yuan Liu Mao-Song Sun 《Journal of Computer Science & Technology》 SCIE EI CSCD 2017年第4期768-784,共17页
Recently, neural models have been proposed for headline generation by learning to map documents to headlines with recurrent neural network. In this work, we give a detailed introduction and comparison of existing work... Recently, neural models have been proposed for headline generation by learning to map documents to headlines with recurrent neural network. In this work, we give a detailed introduction and comparison of existing work and recent improvements in neural headline generation, with particular attention on how encoders, decoders and neural model training strategies alter the overall performance of the headline generation system. Furthermore, we perform quantitative analysis of most existing neural headline generation systems and summarize several key factors that impact the performance of headline generation systems. Meanwhile, we carry on detailed error analysis to typical neural headline generation systems in order to gain more comprehension. Our results and conclusions are hoped to benefit future research studies. 展开更多
关键词 neural network headline generation data analysis
原文传递
基于句子级LSTM编码的文本标题生成 被引量:4
2
作者 钱揖丽 马雪雯 《计算机应用与软件》 北大核心 2021年第5期190-195,共6页
在标题自动生成任务中,BiLSTM表示文本是随着时间循环递归对每个单词进行编码,需要逐字读取单词序列,语义信息会随着状态的传递不断减弱。对此,构建一个句子级LSTM的编码器,并行对文本中每个单词编码表示。循环步骤同时对单词之间的局... 在标题自动生成任务中,BiLSTM表示文本是随着时间循环递归对每个单词进行编码,需要逐字读取单词序列,语义信息会随着状态的传递不断减弱。对此,构建一个句子级LSTM的编码器,并行对文本中每个单词编码表示。循环步骤同时对单词之间的局部状态和整体文本的全局状态进行信息交换,编码得到语义表示后使用混合指针网络的解码器生成标题。在相关数据集上进行实验,结果验证了该模型在标题生成任务上的有效性。 展开更多
关键词 标题生成 句子级 LSTM 序列到序列模型
下载PDF
基于序列模型的单文档标题生成研究 被引量:3
3
作者 焦利颖 郭岩 +2 位作者 刘悦 俞晓明 程学旗 《中文信息学报》 CSCD 北大核心 2021年第1期64-71,共8页
中文单文档摘要是把一篇文档压缩成一个更短描述的过程。随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值。但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题。该文... 中文单文档摘要是把一篇文档压缩成一个更短描述的过程。随着互联网数据量的增长,文档压缩技术对文本分析、数据浏览等有着重大的应用价值。但在基于序列模型的单文档单句摘要生成即标题生成领域中仍然存在数据使用率不高的问题。该文提出基于关键信息指导的标题生成算法。算法中的关键信息除了主流方法中使用的新闻首段句子之外,还包括新闻后续内容中有实质信息的句子,以及新闻中的重点词语。该算法将这些关键信息作为序列模型的输入,指导其生成标题,使得生成的标题能够覆盖更多的新闻信息。实验表明,在基于序列模型生成标题时,使用关键信息能够提升新闻标题生成的效果。 展开更多
关键词 单文档 标题生成 序列模型
下载PDF
融入显著性事件信息的标题生成方法 被引量:1
4
作者 杨冰 孙锐 姬东鸿 《计算机工程与应用》 CSCD 北大核心 2016年第24期236-240,266,共6页
标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事... 标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事件信息的标题生成模型。该模型首先利用互增强原则学习显著性事件,并指导生成候选语句,然后根据这些候选语句构造词图,再结合路径显著性、流畅度,以及覆盖度等因素,设计相应的排名策略生成最终的标题。在标准评测集上的实验结果表明,提出的模型相对于目前主流的方法,取得了更好的性能。 展开更多
关键词 标题生成 显著性事件 多语句压缩 互增强原则
下载PDF
新闻标题的内涵外延传承生成机制 被引量:1
5
作者 张秀云 《西昌学院学报(社会科学版)》 2010年第3期41-44,61,共5页
本文根据新闻标题的类型,分析其生成机制,探讨为什么有些新闻标题按字面来看,说的似乎并不完全是稿件中提到的事,但事实上却跟稿件联系得非常紧密,而且准确地表达了新闻主题。本文运用"内涵外延"传承说对此做出详细的分析。... 本文根据新闻标题的类型,分析其生成机制,探讨为什么有些新闻标题按字面来看,说的似乎并不完全是稿件中提到的事,但事实上却跟稿件联系得非常紧密,而且准确地表达了新闻主题。本文运用"内涵外延"传承说对此做出详细的分析。本研究的目的是希望通过对新闻标题生成机制的分析,能成为从认知视角研究新闻标题的一种新思路。 展开更多
关键词 新闻标题 类层级结构 内涵和外延的传承 生成机制
下载PDF
基于事件图的新闻标题生成研究
6
作者 孙锐 《乐山师范学院学报》 2017年第4期42-46,共5页
为新闻自动生成标题是一个极具挑战的任务。文章基于事件图,提出一种有效的无监督标题生成方法。给定一篇新闻文档,首先为其构造事件图以表示整个篇章,然后采用图排序方法以计算每个事件的显著性得分。随后为排序后的多个事件,抽取其在... 为新闻自动生成标题是一个极具挑战的任务。文章基于事件图,提出一种有效的无监督标题生成方法。给定一篇新闻文档,首先为其构造事件图以表示整个篇章,然后采用图排序方法以计算每个事件的显著性得分。随后为排序后的多个事件,抽取其在文中的依存片段作为候选标题,最后设计一个目标优化函数以搜索最终的标题。在英文和中文数据集上的实验结果表明,文章提出的方法能有效地学习显著性事件并能较好地生成标题。 展开更多
关键词 事件抽取 互增强原则 标题生成
下载PDF
短文本新闻标题生成方法
7
作者 赵明 《电子科技》 2024年第9期87-94,共8页
当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决... 当今新闻具有文本短、发布频繁、时效性强等特点,一个媒体账号一天内发布数十条新闻。为大量新闻制定适用且有吸引力的标题已经成为媒体工作者的一项主要工作内容。媒体工作者需要一个自动生成短文本标题的系统来缓解工作压力。为解决该问题,文中提出了一种短文本新闻标题生成模型。该模型采用序列到序列结构,在编码器和解码器分别应用预训练语言模型和分层自注意力解码器。为了使生成标题包含原始新闻的关键信息,提出一种基于LCSTS数据集和Weibo4数据集的分阶段训练方法,并使模型分别从这两个数据集学习提取关键新闻信息和构建风格化表达,使模型生成标题能够准确表达新闻的核心内容从而吸引读者。 展开更多
关键词 新闻标题生成 预训练语言模型 分层自注意力解码器 编码器 文本提取 文本生成
下载PDF
SOM-NCSCM+:抽取式神经网络中文标题生成方法研究
8
作者 资康莉 王石 曹存根 《高技术通讯》 CAS 2023年第8期836-848,共13页
标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的... 标题生成作为文本摘要任务的一个分支,能够帮助人们高效获取信息。本文针对中文标题生成任务面临的大规模、高质量中文标注数据缺乏的问题,利用标题往往可由原文中的词语来构成的特点,从将无监督学习模型与有监督的序列标注模型结合的角度出发,提出了融合聚类模型和主题模型的抽取式深度神经网络中文标题生成方法和模型。在缺乏人工分类标注信息的中文新闻数据集上,该模型可利用聚类和主题模型自动挖掘数据内部潜在的特征信息,获得不同的数据簇及各簇内的主题词来辅助中文新闻标题生成,使模型在具有潜在主题类别特征的、标题质量参差的中文新闻数据集上都具有较好的适用性。本文提出的中文标题生成模型在互联网上公开的中文新闻标题数据集上的实验结果也表明其在微观F1、BLEU、ROUGE、压缩率等评价指标上都取得了较基准模型更好的效果。 展开更多
关键词 中文标题生成 神经网络模型 主题模型 聚类模型 序列标注
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部