期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于改进TextRank的文本摘要自动提取 被引量:12
1
作者 汪旭祥 韩斌 +1 位作者 高瑞 陈鹏 《计算机应用与软件》 北大核心 2021年第6期155-160,共6页
TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息。对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank)。通过Word2Vec训练的词向量来计算句子之间的相似... TextRank算法在自动提取中文文本摘要时只考虑句子间的相似性,而忽略了词语间的语义相关信息及文本的重要全局信息。对此,提出一种基于改进TextRank的文本摘要自动提取算法(SW-TextRank)。通过Word2Vec训练的词向量来计算句子之间的相似度,并综合考虑句子位置、句子与标题的相似度、关键词的覆盖率、关键句子以及线索词等影响句子权重的因素,从而优化句子权重;对得到的候选摘要句群进行冗余处理,选取适量排序靠前的句子并根据其在原文中的顺序重新排列得到最终文本的摘要。实验结果表明,SW-TextRank算法生成摘要的准确性比TextRank算法更高,摘要生成质量更好。 展开更多
关键词 文本摘要 SW-TextRank算法 词向量 相似度 句子权重
下载PDF
基于无向图构建策略的主题句抽取 被引量:10
2
作者 葛斌 李芳芳 +1 位作者 李阜 肖卫东 《计算机科学》 CSCD 北大核心 2011年第5期181-185,共5页
基于文档句构建无向图,将主题句的抽取问题转换为无向图中节点的权重计算问题。首先利用滑窗方法抽取主题词,构建空间向量并生成无向图,然后基于向量空间模型计算边权重,最后利用文档句相似度矩阵的权重模型对文档句权重进行建模与计算... 基于文档句构建无向图,将主题句的抽取问题转换为无向图中节点的权重计算问题。首先利用滑窗方法抽取主题词,构建空间向量并生成无向图,然后基于向量空间模型计算边权重,最后利用文档句相似度矩阵的权重模型对文档句权重进行建模与计算,依据压缩比得到文档的主题句。实验表明,该方法在不同的压缩比下生成的摘要质量高,主题句抽取结果接近于人工摘要,召回率和准确率综合指数较高。 展开更多
关键词 主题句抽取 无向图 文档句权重 自动文摘
下载PDF
一种基于主题词集的自动文摘方法 被引量:6
3
作者 刘兴林 郑启伦 马千里 《计算机应用研究》 CSCD 北大核心 2011年第4期1322-1324,共3页
提出一种基于主题词集的文本自动文摘方法,用于自动提取文档文摘。该方法根据提取到的主题词集,由主题词权重进行加权计算各主题词所在的句子权重,从而得出主题词集对应的每个句子的总权重,再根据自动文摘比例选取句子权重较大的几个句... 提出一种基于主题词集的文本自动文摘方法,用于自动提取文档文摘。该方法根据提取到的主题词集,由主题词权重进行加权计算各主题词所在的句子权重,从而得出主题词集对应的每个句子的总权重,再根据自动文摘比例选取句子权重较大的几个句子,最后按原文顺序输出文摘。实验在哈工大信息检索研究室单文档自动文摘语料库上进行,使用内部评测自动评估方法对获得的文摘进行评价,总体F值达到了66.07%。实验结果表明,该方法所获得的文摘质量高,较接近于参考文摘,取得了良好的效果。 展开更多
关键词 自动文摘 主题词集 句子权重 自然语言处理
下载PDF
基于句子相关度的文本自动分类 被引量:4
4
作者 张友华 熊范纶 《中国科学技术大学学报》 CAS CSCD 北大核心 2006年第5期540-545,共6页
提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段... 提出一种基于句子相关度的文本自动分类模型(TCSC).该模型利用训练样本增量式地自动更新类别语料库,根据句子的位置权值和语料权值计算句子类别相关度,获得用于文本分类的句子相关度矩阵,通过该矩阵实现文档分类.该模型避免了分类阶段待分类文本特别是中文文本的分词,模糊了词的多义问题,且在文本分类的实验中能够达到86%以上的查全率和查准率;随着语料库的不断训练和调整,分类性能还可以进一步提高,具有简单实现的特点. 展开更多
关键词 文本分类 语料库 相关度矩阵 句权
下载PDF
基于多因素的中文文本主题自动抽取方法 被引量:3
5
作者 刘金岭 谈芸 +1 位作者 李健普 袁娜 《计算机技术与发展》 2010年第7期72-75,79,共5页
提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系。根据概念间的相互关系,对同义概念进行语义归并和上下位概念进行语义聚焦。对于给定的文本,先进行特征词抽取进而生成代表主题概念的重要词汇。综合语句所在位... 提出了一种基于多因素的文本主题的提取方法,并着重讨论了相应的权值体系。根据概念间的相互关系,对同义概念进行语义归并和上下位概念进行语义聚焦。对于给定的文本,先进行特征词抽取进而生成代表主题概念的重要词汇。综合语句所在位置、语句中的标题、语句中所含重要词汇等多因素构造语句权值表达式,在此基础上,采用主题句选择算法保证每一个主题句被选中,同时解决了主题句的去重问题。实验结果表明,该方法具有较高的抽准率。 展开更多
关键词 主题句 主题抽取 文本主题 重要词汇 语句权值
下载PDF
基于句子权重和篇章结构的政府公文自动文摘算法 被引量:1
6
作者 毛良文 徐亮 《计算机与现代化》 2015年第12期19-24,共6页
提高文摘自动生成的准确性,能够帮助人们快速有效地获取有价值的信息。本文根据政府公文结构性强的特点,提出一种基于句子权重和篇章结构的政府公文自动文摘算法,首先通过基于游标的截取字符分句算法,对文档中句子和词语信息进行精确统... 提高文摘自动生成的准确性,能够帮助人们快速有效地获取有价值的信息。本文根据政府公文结构性强的特点,提出一种基于句子权重和篇章结构的政府公文自动文摘算法,首先通过基于游标的截取字符分句算法,对文档中句子和词语信息进行精确统计,获得对文章内容和篇章结构的基本了解;在此基础上,提出基于篇章结构的词语权重和句子权重计算方法,并根据权重计算结果对句子进行权重排序;然后,根据生成摘要的规模,筛选出一定数量的候选文摘句子;最后,对候选文摘句子进行一定的后处理,输出文摘句。实验结果表明,与同类型自动文摘算法以及Word 2003提供的自动文摘工具相比,本文提出的自动文摘算法在准确率和召回率上都有较大提高。 展开更多
关键词 政府公文 自动文摘 词语权重 句子权重 篇章结构
下载PDF
基于加权信息论的突发事件新闻主题抽取方法 被引量:5
7
作者 陈炯 张永奎 《计算机应用》 CSCD 北大核心 2008年第B06期150-151,共2页
在分析突发事件新闻文本特点的基础上,提出了一种基于加权信息论的主题抽取方法,与传统的方法相比,该方法既考虑了主题词在文本中所含统计信息,又考虑了突发事件新闻文本中主题词出现的位置特征。实验结果表明,采用该方法对突发事件新... 在分析突发事件新闻文本特点的基础上,提出了一种基于加权信息论的主题抽取方法,与传统的方法相比,该方法既考虑了主题词在文本中所含统计信息,又考虑了突发事件新闻文本中主题词出现的位置特征。实验结果表明,采用该方法对突发事件新闻文本进行主题抽取具有较好的性能。 展开更多
关键词 突发事件新闻 主题抽取 词位向量 句权向量 加权信息论
下载PDF
基于完全稀疏主题模型的多文档自动摘要 被引量:1
8
作者 邵洲 张晖 《计算机工程与设计》 CSCD 北大核心 2014年第3期1032-1036,共5页
为了解决稀疏情况下的自动文档摘要问题,将提出的完全稀疏主题模型引入到文档摘要中。根据模型中主题分布和主题的词汇分布,提出了该模型上的自动摘要算法。为了验证该方法的有效性,在DUC 2007数据集上使用ROUGE自动摘要评测工具进行评... 为了解决稀疏情况下的自动文档摘要问题,将提出的完全稀疏主题模型引入到文档摘要中。根据模型中主题分布和主题的词汇分布,提出了该模型上的自动摘要算法。为了验证该方法的有效性,在DUC 2007数据集上使用ROUGE自动摘要评测工具进行评测。通过与DUC 2007中专家摘要和对多种实验的比较,比较结果表明,该摘要方法在准确率上显著优于其它方法,同时在推断时间、方法的简单性等各个方面也都具有优势。 展开更多
关键词 完全稀疏主题模型 多文档摘要 稀疏性 句子权重计算 DUC 2007
下载PDF
A New Method for Calculating Similarity between Sentences and Application on Automatic Abstracting 被引量:1
9
作者 Wenqian JI Zhoujun LI +1 位作者 Wenhan CHAO Xiaoming CHEN 《Intelligent Information Management》 2009年第1期36-42,共7页
Sentence similarity computing plays an important role in machine question-answering systems, machine-translation systems, information retrieval and automatic abstracting systems. This article firstly sums up several m... Sentence similarity computing plays an important role in machine question-answering systems, machine-translation systems, information retrieval and automatic abstracting systems. This article firstly sums up several methods for calculating similarity between sentences, and brings out a new method which takes all factors into consideration including critical words, semantic information, sentential form and sen-tence length. And on this basis, a automatic abstracting system based on LexRank algorithm is implemented. We made several improvements in both sentence weight computing and redundancy resolution. The system described in this article could deal with single or multi-document summarization both in English and Chinese. With evaluations on two corpuses, our system could produce better summaries to a certain degree. We also show that our system is quite insensitive to the noise in the data that may result from an imperfect topical clustering of documents. And in the end, existing problem and the developing trend of automatic summariza-tion technology are discussed. 展开更多
关键词 sentence SIMILARITY AUTOMATIC abstracting lexrank sentence-weight computing REDUNDANCY resolution
下载PDF
基于语句类似度优化计算的改进自动摘要算法研究 被引量:3
10
作者 高雪霞 贾海龙 《计算机应用与软件》 CSCD 北大核心 2013年第9期160-162,182,共4页
计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重... 计算语句的类似度在自动问答、机器翻译、信息检索和自动摘要等算法中有着非常重要的作用。首先归纳了语句类似度计算的方法,综合考虑关键词特征、语义特征、句式特征和语句长度特征等信息并提出一种优化语句类似度计算方法,以语句权重计算方法以及冗余处理优化处理为基础,实现一个改进的自动摘要算法。通过在DUC的测评语料上进行仿真,实验结果证明了该算法对于摘要质量优化的高效性。最后,讨论了自动摘要研究存在的问题,并指出自动摘要的研究趋势。 展开更多
关键词 语句类似度 自动摘要 语句权重计算 冗余处理
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部