期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
多文档文摘中基于时间信息的句子排序策略研究 被引量:8
1
作者 徐永东 王亚东 +2 位作者 刘杨 王伟 权光日 《中文信息学报》 CSCD 北大核心 2009年第4期27-33,共7页
文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序... 文摘句排序是多文档自动文摘中的一个关键技术,直接影响到文摘的流畅程度和可读性。文本时间信息处理是影响排序算法质量的瓶颈技术,由于无法获得准确的时间信息,传统的句子排序策略均回避了这一问题,而且均无法获得稳定的高质量的排序效果。对此该文从文本时间信息处理入手,首先提出了中文文本时间信息抽取、语义计算以及时序推理算法,并在此算法基础上,借鉴传统的主成分排列的思想和句子相关度计算方法,提出了基于时间信息的句子排序算法。实验表明该算法的质量要明显好于传统的主成分排列算法和时序排列算法。 展开更多
关键词 计算机应用 中文信息处理 多文档自动文摘 句子排序 中文时间信息处理
下载PDF
基于注意力机制的句子排序方法 被引量:7
2
作者 栾克鑫 杜新凯 +2 位作者 孙承杰 刘秉权 王晓龙 《中文信息学报》 CSCD 北大核心 2018年第1期123-130,共8页
句子排序是多文档自动摘要和答案融合任务的关键技术,其效果直接影响摘要或者答案融合结果的可读性。作为句子排序的重要依据,语义逻辑关系的准确度对于排序结果的可读性有很大影响。为此,该文提出了引入注意力机制的句子排序模型,以增... 句子排序是多文档自动摘要和答案融合任务的关键技术,其效果直接影响摘要或者答案融合结果的可读性。作为句子排序的重要依据,语义逻辑关系的准确度对于排序结果的可读性有很大影响。为此,该文提出了引入注意力机制的句子排序模型,以增强句子语义逻辑关系的捕获能力,进而获取句子的合理排序。实验结果表明,在句子排序任务中,引入注意力机制的句子排序模型明显优于基线方法。 展开更多
关键词 句子排序 注意力机制 语义逻辑关系
下载PDF
一种基于神经网络模型的句子排序方法 被引量:5
3
作者 康世泽 马宏 黄瑞阳 《中文信息学报》 CSCD 北大核心 2016年第5期195-202,共8页
句子排序是多文本摘要中的重要问题,合理地对句子进行排序对于摘要的可读性和连贯性具有重要意义。该文首先利用神经网络模型融合了五种前人已经提出过的标准来决定任意两个句子之间的连接强度,这五种标准分别是时间、概率、主题相似性... 句子排序是多文本摘要中的重要问题,合理地对句子进行排序对于摘要的可读性和连贯性具有重要意义。该文首先利用神经网络模型融合了五种前人已经提出过的标准来决定任意两个句子之间的连接强度,这五种标准分别是时间、概率、主题相似性、预设以及继承。其次,该文提出了一种基于马尔科夫随机游走模型的句子排序方法,该方法利用所有句子之间的连接强度共同决定句子的最终排序。最终,该文同时使用人工和半自动方法对句子排序的质量进行评价,实验结果表明该文所提出方法的句子排序质量与基准算法相比具有明显提高。 展开更多
关键词 句子排序 多文本摘要 神经网络模型 马尔科夫随机游走模型
下载PDF
用于多文档文摘句排序的改进MO算法 被引量:2
4
作者 蒋效宇 樊孝忠 陈康 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第9期43-47,70,共6页
针对CO和MO文摘句排序算法的缺陷,提出了一种将局部主题间的内聚度与MO算法相结合进行文摘句排序的新方法.在统计局部主题间相对位置的基础上,建立它们之间的关系有向图并计算其内聚度;排序过程中每从有向图中输出一个顶点,便从剩余顶... 针对CO和MO文摘句排序算法的缺陷,提出了一种将局部主题间的内聚度与MO算法相结合进行文摘句排序的新方法.在统计局部主题间相对位置的基础上,建立它们之间的关系有向图并计算其内聚度;排序过程中每从有向图中输出一个顶点,便从剩余顶点中查找与其具有最大内聚度的顶点,若该内聚度大于阈值,则将这两个顶点所代表的局部主题文摘句置于摘要中相邻的位置.实验结果表明,该算法排序生成的文摘更具连贯性和可读性. 展开更多
关键词 人工智能 多文档文摘 局部主题 句子排序
下载PDF
基于抽取的高考作文生成 被引量:4
5
作者 冯骁骋 龚恒 +3 位作者 冷海涛 秦兵 孙承杰 刘挺 《计算机学报》 EI CSCD 北大核心 2020年第2期315-325,共11页
机器人自动写作是人工智能和自然语言处理领域重要的研究方向,然而传统的自动写作方法主要针对体育新闻、天气预报等较短的段落级文本进行研究,并没有对篇章级文本自动生成技术进行深入地建模.针对这一问题,我们着重研究面向高考作文的... 机器人自动写作是人工智能和自然语言处理领域重要的研究方向,然而传统的自动写作方法主要针对体育新闻、天气预报等较短的段落级文本进行研究,并没有对篇章级文本自动生成技术进行深入地建模.针对这一问题,我们着重研究面向高考作文的篇章级文本生成任务.具体而言我们提出了一种基于抽取式的高考作文生成模型,即先进行抽取再利用深度学习排序方法进行段落内部的文本组合生成.通过实际专家评测,我们所生成的作文能够达到北京高考二类卷平均分数,具有一定的实际应用价值. 展开更多
关键词 文本生成 文本抽取 句子排序 作文生成 自然语言处理
下载PDF
潜在语义分析聚类算法在文摘句子排序中的应用 被引量:3
6
作者 郭红建 黄兵 《计算机应用研究》 CSCD 北大核心 2013年第11期3299-3301,共3页
针对多文档文摘生成过程中话题容易中断和文摘句子语义出现不连贯这两个研究难点,分析了潜在语义分析聚类算法在句子排序中的应用,以期提高文摘的生成质量。先采用潜在语义分析聚类算法将文摘句子聚类,从而形成话题集,以达到解决话题中... 针对多文档文摘生成过程中话题容易中断和文摘句子语义出现不连贯这两个研究难点,分析了潜在语义分析聚类算法在句子排序中的应用,以期提高文摘的生成质量。先采用潜在语义分析聚类算法将文摘句子聚类,从而形成话题集,以达到解决话题中断的目的。通过计算文档的文摘展现力,挑选出文摘展现力最大的文档作为模板,然后根据模板对文摘句子进行两趟排序。实验结果表明,提出的算法是有效的,该算法能够提高文摘的可读性。 展开更多
关键词 多文档文摘 聚类 句子排序
下载PDF
基于段落-句子互增强的自动文摘算法 被引量:3
7
作者 谢浩 孙伟 《计算机科学》 CSCD 北大核心 2013年第11A期246-250,共5页
句子排序问题是文本自动摘要的核心问题,基于互增强关系(MRP)的基本思想,提出一种新的句子排序模型——段落-句子互增强模型。利用段落关系,通过段落句子的互增强,迭代计算出句子的显著度,抽取出文摘句。分析了模型中的内、外影响因子... 句子排序问题是文本自动摘要的核心问题,基于互增强关系(MRP)的基本思想,提出一种新的句子排序模型——段落-句子互增强模型。利用段落关系,通过段落句子的互增强,迭代计算出句子的显著度,抽取出文摘句。分析了模型中的内、外影响因子对算法效果的影响并对冗余处理进行了讨论。实验表明,将其运用在单文本自动摘要中,能取得高质量的文摘。 展开更多
关键词 句子排序 互增强关系 自动文摘
下载PDF
基于语种关联度课程学习的多语言神经机器翻译 被引量:1
8
作者 于东 谢婉莹 +1 位作者 谷舒豪 冯洋 《计算机科学》 CSCD 北大核心 2022年第1期24-30,共7页
近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问... 近年来,使用单一模型实现多语言神经机器翻译的方法受到了广泛关注。然而,现有方法多将所有语种语料直接混合作为训练语料,未能利用多种语言之间关联和相似的信息。此外,模型训练涉及语言种类多、数据量大、整体训练难度大、耗时长等问题。针对以上两个问题,文中提出了一种基于语种关联度的课程学习方法来提高多语言神经机器翻译的整体性能和收敛速度。具体来说,提出了两种度量语种关联度的指标:使用奇异向量典型相关分析对不同语言进行排序以及使用余弦相似度对特定语言中的不同句子进行排序。进一步,文中提出以验证集损失为课程替换标准的课程学习策略,使模型训练由整体训练转化为一系列课程上的训练,降低了训练难度。该方法填补了课程学习策略在多语言神经机器翻译领域的空白。文中在平衡和非平衡的IWSLT多语言数据集和Europarl语料库数据集上进行了实验,结果表明,所提方法优于多语言基线翻译系统,最多可使训练时间缩短64%。 展开更多
关键词 机器翻译 多语言 课程学习 关联度评估 语种排序 句子排序
下载PDF
基于深度学习的自动文摘句排序方法 被引量:2
9
作者 何凯霖 丁晓峰 《计算机工程与设计》 北大核心 2017年第12期3457-3460,共4页
针对现有的文摘句排序方法难以理解深层语义的问题,提出一种基于深度学习的多文档文摘句排序方法。设计端到端深度神经网络完成语句的嵌入、理解及排序。用循环神经网络对句子进行单词级嵌入,在此基础上构建句子的上下文向量表示,用RNN... 针对现有的文摘句排序方法难以理解深层语义的问题,提出一种基于深度学习的多文档文摘句排序方法。设计端到端深度神经网络完成语句的嵌入、理解及排序。用循环神经网络对句子进行单词级嵌入,在此基础上构建句子的上下文向量表示,用RNN对句子在不同位置的内聚性进行评估,利用指针网络RNN进行下一句预测。实验结果表明,相比传统方法,采用该方法能够得到更高质量的多文档文摘,在自动文摘生成及自然语言处理等方面有广泛用途。 展开更多
关键词 自动文摘生成 句子排序 深度学习 循环神经网络 自然语言处理
下载PDF
作文段落句间逻辑合理性等级评测 被引量:2
10
作者 杨正祥 刘杰 +1 位作者 袁克柔 周建设 《计算机应用与软件》 北大核心 2019年第9期175-180,225,共7页
在作文评测中,句间逻辑合理性是评价语言运用能力的一项重要指标。从句间连贯性角度出发,采用句子排序的相关算法研究句间词汇中的潜在关联,并对作文段落逻辑合理性进行定量分析,达到对作文段落逻辑合理性等级评测的目的。以计算条件熵... 在作文评测中,句间逻辑合理性是评价语言运用能力的一项重要指标。从句间连贯性角度出发,采用句子排序的相关算法研究句间词汇中的潜在关联,并对作文段落逻辑合理性进行定量分析,达到对作文段落逻辑合理性等级评测的目的。以计算条件熵为基础,使用马尔科夫随机游走模型进行句子排序;计算过程中融入word2vec和同义词词林进行语义扩展;经ROUGE-L评分,该模型取得了较好的效果。提出带优化的句间逻辑合理性评测模型,实验证明其能够取得最优的效果。建立ROUGE-L分值与由专家评判的段落句间逻辑合理性等级的对应关系,确定ROUGE-L与逻辑合理性等级判定的分类边界,为辅助中文作文智能评测提供了新思路。 展开更多
关键词 作文自动评测 句间逻辑关系 作文等级评测 句子排序 马尔科夫随机游走模型
下载PDF
高考语文议论文自动生成技术概述
11
作者 冯骁骋 秦兵 刘挺 《人工智能》 2022年第2期21-29,共9页
议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,议论文文章长度更长,且要求具有明确的核心论点和清晰的论证结构。上述特点使得现有的生成模型难以直接迁移。本文基于已有自然语言生成相关技术从抽... 议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,议论文文章长度更长,且要求具有明确的核心论点和清晰的论证结构。上述特点使得现有的生成模型难以直接迁移。本文基于已有自然语言生成相关技术从抽取和生成两个维度分别论述了面向高考议论文的自动生成模型。与已有方法不同的是,两个系统都充分结合议论文自身结构特点设计了不同的优化方案,抽取式模型采用词到句、句到段的多步生成方式,可解释性和可控性更强;生成式方法在学习篇章结构的基础上端到端地逐段生成作文样例,行文更加流畅。最终本文还展示了相关方案的生成样例,并针对当前不足对议论文自动生成任务的未来发展方向进行展望。 展开更多
关键词 文本生成 议论文自动生成 预训练语言模型 句子排序
下载PDF
基于论证关系判别的议论文句子排序研究
12
作者 冯骁骋 张凌源 +3 位作者 冯掌印 吴佳铭 孙承杰 秦兵 《中文信息学报》 CSCD 北大核心 2022年第4期156-165,共10页
议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,所生成的文章需要句子语义明确、论证结构清晰并合理地表达出核心论点。上述特点使得现有的预训练模型难以准确地建模并自动生成,因此传统的检索式方... 议论文自动生成是自然语言生成中一项极具挑战性的任务,与诗歌、故事等生成任务不同,所生成的文章需要句子语义明确、论证结构清晰并合理地表达出核心论点。上述特点使得现有的预训练模型难以准确地建模并自动生成,因此传统的检索式方法成为解决该问题的主要方式。但前人方法在句子检索和排序过程中只考虑了语义相关度,忽视了对逻辑论证关系的判别,导致语义不连贯、论证逻辑倒置等问题。针对上述问题,该文将自然语言推理应用于论证关系逻辑判别任务,提出了基于显式语义结构的论证关系逻辑判别方法,新模型在论证判别数据集上取得优于以往自然语言推理模型的效果。同时将论文判别结果作为显式特征应用于议论文句子排序模型,在议论文生成数据集中有效改善了排序模型的逻辑不一致问题并进一步提升了议论文生成系统的总体性能。 展开更多
关键词 论证关系 句子排序 语义结构信息 图神经网络
下载PDF
基于子词级别词向量和指针网络的朝鲜语句子排序
13
作者 闫晓东 解晓庆 《中文信息学报》 CSCD 北大核心 2022年第8期54-61,共8页
句子排序是自然语言处理中的重要任务之一,其应用包括多文档摘要、问答和文本生成。不当的句子排序会产生逻辑不通顺的文本,使得文本的可读性降低。该文采用在中英文上大规模使用的深度学习方法,同时结合朝鲜语词语形态变化丰富的特点,... 句子排序是自然语言处理中的重要任务之一,其应用包括多文档摘要、问答和文本生成。不当的句子排序会产生逻辑不通顺的文本,使得文本的可读性降低。该文采用在中英文上大规模使用的深度学习方法,同时结合朝鲜语词语形态变化丰富的特点,提出了一种基于子词级别词向量和指针网络的朝鲜语句子排序模型,其目的是解决传统方法无法挖掘深层语义信息的问题。该文提出基于形态素拆分的词向量训练方法(MorV),同时对比子词n元词向量训练方法(SG),得到朝鲜语词向量;采用了两种句向量方法:基于卷积神经网络(CNN)、基于长短时记忆网络(LSTM),结合指针网络分别进行实验。结果表明采用MorV和LSTM的句向量结合方法可以更好地捕获句子间的语义逻辑关系,提升句子排序的效果。 展开更多
关键词 词向量 形态素拆分 指针网络 句子排序
下载PDF
儿童逻辑思维早期训练
14
作者 何盛全 《中国人民教师》 2005年第2期33-34,共2页
小学生逻辑思维早期训练方法之一,在四册才开始出现,通常是以排顺错乱句子的形式出现的。而排顺错乱句子,在教材中,上面发下来的教学参考书中都没有看到有关排顺错乱句子的讲授方法的介绍。
关键词 儿童 逻辑思维 早期训练 训练方法 小学 语文教学 句子排序
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部