期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于预读及简单注意力机制的句子压缩方法 被引量:3
1
作者 鹿忠磊 刘文芬 +2 位作者 周艳芳 胡学先 王彬宇 《计算机应用研究》 CSCD 北大核心 2019年第2期371-375,394,共6页
针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果... 针对英文句子压缩方法进行研究,提出一种基于预读及简单注意力机制的压缩方法。在编码器—解码器(encoder-decoder)框架下,以循环门单元(gated recurrent unit,GRU)神经网络模型为基础,在编码阶段对原句语义进行两次建模。首次建模结果作为全局信息,加强二次语义建模,得到更全面准确的语义编码向量。解码阶段充分考虑删除式句子压缩的特殊性,适用简单注意力(3t-attention)机制,将编码向量中与当前解码时刻最相关的语义部分输入到解码器中,提高预测效率及准确率。在谷歌新闻句子压缩数据集上的实验结果表明,所提压缩方法优于已有公开结果。因此,预读及简单注意力机制可有效提高英文句子压缩精度。 展开更多
关键词 自然语言处理 句子压缩 预读 注意力机制
下载PDF
基于语句压缩的中文语义依存分析 被引量:2
2
作者 周亮俊 向阳 《计算机应用》 CSCD 北大核心 2017年第A01期266-269,共4页
针对当前中文语义依存分析中耗时长、准确率低的问题,提出了一种基于语句压缩进行中文语义依存分析的方法。在此方案中,首先通过开源工具CRF++训练得到特定的序列化标签压缩模型,通过此模型得到任意输入句子的主干信息,并为下一步提供... 针对当前中文语义依存分析中耗时长、准确率低的问题,提出了一种基于语句压缩进行中文语义依存分析的方法。在此方案中,首先通过开源工具CRF++训练得到特定的序列化标签压缩模型,通过此模型得到任意输入句子的主干信息,并为下一步提供候选集;其次,选取原句和压缩后句子中的词性、上下文等特征,使用条件随机场对其中的语义依存关系进行识别;最后进行谓语消歧和句子回溯。实验以Co NLL 2009公开任务中的公有语料作为数据集,与传统的直接使用基于图的语义依存分析方法相比,本方案的处理时间缩短了80%,精确率提高了3.48%,综合指标提高了2.11%。 展开更多
关键词 语义依存 语句压缩 条件随机场 中文信息处理
下载PDF
Hedge Trimmer句子压缩技术的算法实现及改进 被引量:1
3
作者 景秀丽 《沈阳师范大学学报(自然科学版)》 CAS 2012年第4期519-524,共6页
压缩技术旨在模拟人类的文本概括和信息提取能力。句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子。文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩... 压缩技术旨在模拟人类的文本概括和信息提取能力。句子压缩技术是自动生成能够保留原句核心内容的,合乎语法的,语义连贯的简短句子。文章分析了英文句子压缩技术中基于句法分析的Hedge Trimmer压缩技术,讨论了相关压缩理论,探索其压缩过程并用类C语言进行算法实现。提出了好的压缩句应该至少满足以下3个标准:第一是保留原句的核心内容,第二是具有正确的语法,第三是压缩长度合理。在算法的评估工作中,从DUC 2003语料库中选取了624个原始句子和对应的人工压缩句,与Hedge Trimmer压缩算法自动生成的压缩句进行对照分析。发现5种压缩效果不理想的情况,分析其原因并提出了改进策略。最后,通过实例对改进算法生成的压缩句和原来算法生成的压缩句进行对比评估,证明了改良算法能够获得更理想的压缩句。在英文句子压缩领域,改良的Hedge Trimmer句子压缩算法值得推广和应用。 展开更多
关键词 句子压缩 HEDGE Trimmer算法 评估 改进
下载PDF
基于Markov逻辑网的句子压缩方法 被引量:1
4
作者 金锋 黄民烈 朱小燕 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第11期1686-1690,共5页
提出了一种基于Markov逻辑网通过删除单词进行英文句子压缩的方法。通过一阶逻辑公式表示单词的局部特征以及单词之间的相互依赖关系,确定单词是否应该删除。与现有方法相比,该方法把判别式学习和整数规划的优点相结合,既融合了丰富的... 提出了一种基于Markov逻辑网通过删除单词进行英文句子压缩的方法。通过一阶逻辑公式表示单词的局部特征以及单词之间的相互依赖关系,确定单词是否应该删除。与现有方法相比,该方法把判别式学习和整数规划的优点相结合,既融合了丰富的句子特征,又以逻辑公式方便地表示全局约束。在书面和口语两个新闻数据集上的实验结果表明:该方法与L3和SVTL系统相比具有明显优势,在压缩率接近时,以人工压缩结果为评测标准,压缩后句子的依存关系F-score有较大提高。 展开更多
关键词 句子压缩 文档摘要 MARKOV逻辑网
原文传递
基于结构化学习的语句压缩研究
5
作者 张永磊 王红玲 周国栋 《中文信息学报》 CSCD 北大核心 2013年第2期10-16,64,共8页
近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征... 近年来随着各类信息的日益增多,语句压缩作为自动摘要的重要部分也越来越引起研究者的关注。然而当前针对语句压缩的研究才刚刚展开,存在压缩效果不佳、没有统一的自动评测指标等问题。该文在简单的删除单词的方法框架下,采用基于特征权重的最大边缘训练的结构化学习方法实现语句压缩。同时该文还提出了两种新的自动评价指标(N-Gram和BLEU)来评价语句压缩的性能。实验结果表明,采用结构化学习方法能够在保持较好压缩率的情况下保留源语句的主要信息,并且新提出的两个评价指标能够有效反映语句压缩性能。 展开更多
关键词 语句压缩 结构化学习 自动评测
下载PDF
基于概率和句法的句子压缩技术对比研究
6
作者 景秀丽 《辽宁大学学报(自然科学版)》 CAS 2012年第4期300-304,共5页
句子压缩是自然语言处理领域的一个基础应用方向,是开发自动文摘生成系统和自动标题生成系统的第一步.句子压缩技术主要是以简短的形式重写句子并且保留原句中最重要的信息.好的压缩句子应该是合乎语法的和表述连贯的句子.选取Noisy-Cha... 句子压缩是自然语言处理领域的一个基础应用方向,是开发自动文摘生成系统和自动标题生成系统的第一步.句子压缩技术主要是以简短的形式重写句子并且保留原句中最重要的信息.好的压缩句子应该是合乎语法的和表述连贯的句子.选取Noisy-Channel Model压缩算法和Hedge Trimmer压缩算法作为两种压缩技术的代表范例进行对比研究,分析了两种方法的优势和劣势,探索了一种混合式句子压缩技术.混合式压缩技术将会改善英文句子压缩效果,相关研究将成为自然语言处理领域的一个新方向. 展开更多
关键词 句子压缩 概率 句法 语料库
下载PDF
基于事件指导的多文档生成式摘要方法 被引量:6
7
作者 王振超 孙锐 姬东鸿 《计算机应用研究》 CSCD 北大核心 2017年第2期343-346,356,共5页
建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指... 建立在理解篇章语义基础之上的生成式摘要,在思想上相对于抽取式摘要更加合理,但在具体实现上却面临语义理解、自然语言生成等难题。提出了一种以事件作为基本语义单元的生成式摘要方法,通过对事件聚类反映篇章的主题分布,并利用事件指导多语句压缩生成自然语句构建摘要。通过在DUC标准数据集上进行评测,最终的ROUGE得分媲美目前主流的生成式方法,从而说明事件能够很好地承载篇章的主干信息,同时有效地指导多语句压缩过程中冗余信息的去除和自然语言的生成。 展开更多
关键词 事件 生成式 组合语义 子主题 多语句压缩 多文档摘要
下载PDF
融入显著性事件信息的标题生成方法 被引量:1
8
作者 杨冰 孙锐 姬东鸿 《计算机工程与应用》 CSCD 北大核心 2016年第24期236-240,266,共6页
标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事... 标题生成任务中,现有方法多以语句或短语为基本处理单元,利用单语句压缩技术或语句合成技术来生成最终的标题。这些方法或因语句过于稀疏而缺失篇章主要信息,或因短语合成缺乏语法规则约束而导致标题可读性差。提出了一种融入显著性事件信息的标题生成模型。该模型首先利用互增强原则学习显著性事件,并指导生成候选语句,然后根据这些候选语句构造词图,再结合路径显著性、流畅度,以及覆盖度等因素,设计相应的排名策略生成最终的标题。在标准评测集上的实验结果表明,提出的模型相对于目前主流的方法,取得了更好的性能。 展开更多
关键词 标题生成 显著性事件 多语句压缩 互增强原则
下载PDF
基于词语热度的启发式中文句子压缩算法 被引量:1
9
作者 韩静 张东站 《计算机工程与应用》 CSCD 2014年第4期132-139,共8页
传统的句子压缩方法多基于难以获得的"原句-压缩句"对齐语料库,因此提出了不依赖于对齐语料库的中文句子压缩算法。通过研究人工压缩结果并结合语言学知识,提出了词语层面和分句层面的两组压缩规则。算法在原句句法分析树和... 传统的句子压缩方法多基于难以获得的"原句-压缩句"对齐语料库,因此提出了不依赖于对齐语料库的中文句子压缩算法。通过研究人工压缩结果并结合语言学知识,提出了词语层面和分句层面的两组压缩规则。算法在原句句法分析树和词语间依赖关系的基础上,使用两组规则进行压缩,同时为了保证压缩算法具有更强的适应性和准确性,引入词语的热度加强了压缩算法,最后通过句子整理和语法修复得到最终的压缩句。对比了人工压缩、只使用规则压缩和引入词语热度压缩三种压缩方法。实验结果表明,基于热度的启发式中文句子压缩算法可以在压缩比、语法性、信息量都损失较少的情况下,提高压缩句的热度。 展开更多
关键词 中文句子压缩 热词 语言学 句法分析树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部