期刊文献+
共找到46篇文章
< 1 2 3 >
每页显示 20 50 100
一种结合聚集图嵌入的社会化推荐算法 被引量:3
1
作者 周林娥 游进国 《小型微型计算机系统》 CSCD 北大核心 2021年第1期78-84,共7页
社交网络信息已被广泛的应用到传统的推荐上,一定程度上减轻了数据稀疏和冷启动问题.随着表示学习的兴起,出现了利用表示学习进行推荐的算法研究.然而社交网络过大,表示学习可扩展性差,难以在有限内存中进行计算.聚集图通过空间压缩,保... 社交网络信息已被广泛的应用到传统的推荐上,一定程度上减轻了数据稀疏和冷启动问题.随着表示学习的兴起,出现了利用表示学习进行推荐的算法研究.然而社交网络过大,表示学习可扩展性差,难以在有限内存中进行计算.聚集图通过空间压缩,保留了关键的结构关系,去除次要或噪音的结构数据,便于表示学习能够有效学习图结构,从而更好地找到相似用户进行推荐.首先,利用图聚集算法同时考虑分组间及分组内的结构得到最终的聚集图;其次,在聚集图上计算随机游走的转移概率,然后选择每个具有偏差概率的后继节点并生成节点序列;最后将节点序列输入到skip-gram学习用户的潜在表示,获得节点的表示向量整合其信息到贝叶斯个性化排序模型(BPR)来解决项目排名问题.实验结果表明,该方法相比于社会化贝叶斯个性化排序(SBPR)、协同用户网络嵌入(CUNE)等基线方法在推荐任务中保持时间效率的同时有效提升了准确率、召回率和平均精度均值. 展开更多
关键词 聚集图 随机游走 表示学习 推荐
下载PDF
使用关键词扩展的新闻文本自动摘要方法 被引量:13
2
作者 李峰 黄金柱 +1 位作者 李舟军 杨伟铭 《计算机科学与探索》 CSCD 北大核心 2016年第3期372-380,共9页
提出了使用关键词扩展的新闻文本自动摘要方法。该方法从大规模的语料中提取与输入文档相近主题的文本组成背景语料,并基于背景语料进行关键词的扩展,强化关键词对文摘句的指示作用,从而提高新闻文本摘要抽取质量。研究和实验表明,该方... 提出了使用关键词扩展的新闻文本自动摘要方法。该方法从大规模的语料中提取与输入文档相近主题的文本组成背景语料,并基于背景语料进行关键词的扩展,强化关键词对文摘句的指示作用,从而提高新闻文本摘要抽取质量。研究和实验表明,该方法在Rouge-1,Rouge-2评测中取得了优于基于关键词、基于TextRank和基于Manifold Ranking方法的结果。在研究中组织制定了100篇新闻文本的4份中文新闻文本标准评价集,研制了基于关键词扩展的中文新闻文本自动摘要系统,开发了面向中文的基于ROUGE原理的新闻文本摘要结果自动评测系统,初步实现了从理论到实践的转化。 展开更多
关键词 扩展 相近文本 自动摘要 图算法 系统实现
下载PDF
基于关键词异构图的生成式摘要研究
3
作者 毛兴静 魏勇 +1 位作者 杨昱睿 琚生根 《计算机科学》 CSCD 北大核心 2024年第7期278-286,共9页
生成式摘要是自然语言处理中的重要任务,它帮助人们从海量文本中提取简洁而重要的信息.目前主流的生成式摘要模型是基于深度学习的序列到序列模型,这类模型生成的摘要质量更高.但由于缺乏对原文中关键词和句子之间的依赖关系的关注,现... 生成式摘要是自然语言处理中的重要任务,它帮助人们从海量文本中提取简洁而重要的信息.目前主流的生成式摘要模型是基于深度学习的序列到序列模型,这类模型生成的摘要质量更高.但由于缺乏对原文中关键词和句子之间的依赖关系的关注,现有模型生成的摘要仍然存在语义不明、重要信息含量低等问题.针对这个问题,提出了一种基于关键词异构图的生成式摘要模型.该模型通过从原始文本中提取关键词,将其与句子共同作为输入构建异构图,进而学习关键词和句子之间的依赖关系.文档编码器和图编码器分别用于学习文本知识和异构图中的依赖关系.此外,在解码器中采用分层图注意力机制来提高模型在生成摘要时对显著信息的关注.在CNN/Daily Mail和XSum数据集上进行了充分的实验,实验结果表明,所提模型在ROUGE评价指标上有了显著的提升.进一步的人类评估结果显示,所提模型所生成的摘要比基线模型包含更多的关键信息,并具有更高的可读性. 展开更多
关键词 生成式摘要 关键词 异构图 图注意力 序列到序列模型
下载PDF
Enhanced Topic-Aware Summarization Using Statistical Graph Neural Networks
4
作者 Ayesha Khaliq Salman Afsar Awan +2 位作者 Fahad Ahmad Muhammad Azam Zia Muhammad Zafar Iqbal 《Computers, Materials & Continua》 SCIE EI 2024年第8期3221-3242,共22页
The rapid expansion of online content and big data has precipitated an urgent need for efficient summarization techniques to swiftly comprehend vast textual documents without compromising their original integrity.Curr... The rapid expansion of online content and big data has precipitated an urgent need for efficient summarization techniques to swiftly comprehend vast textual documents without compromising their original integrity.Current approaches in Extractive Text Summarization(ETS)leverage the modeling of inter-sentence relationships,a task of paramount importance in producing coherent summaries.This study introduces an innovative model that integrates Graph Attention Networks(GATs)with Transformer-based Bidirectional Encoder Representa-tions from Transformers(BERT)and Latent Dirichlet Allocation(LDA),further enhanced by Term Frequency-Inverse Document Frequency(TF-IDF)values,to improve sentence selection by capturing comprehensive topical information.Our approach constructs a graph with nodes representing sentences,words,and topics,thereby elevating the interconnectivity and enabling a more refined understanding of text structures.This model is stretched to Multi-Document Summarization(MDS)from Single-Document Summarization,offering significant improvements over existing models such as THGS-GMM and Topic-GraphSum,as demonstrated by empirical evaluations on benchmark news datasets like Cable News Network(CNN)/Daily Mail(DM)and Multi-News.The results consistently demonstrate superior performance,showcasing the model’s robustness in handling complex summarization tasks across single and multi-document contexts.This research not only advances the integration of BERT and LDA within a GATs but also emphasizes our model’s capacity to effectively manage global information and adapt to diverse summarization challenges. 展开更多
关键词 summarIZATION graph attention network bidirectional encoder representations from transformers Latent Dirichlet Allocation term frequency-inverse document frequency
下载PDF
基于超图排序算法的视频摘要 被引量:5
5
作者 冀中 樊帅飞 《电子学报》 EI CAS CSCD 北大核心 2017年第5期1035-1043,共9页
技术作为一种快速感知视频内容的方式得到了广泛的关注.现有基于图模型的视频摘要方法将视频帧作为顶点,通过边表示两个顶点之间的关系,但并不能很好地捕获视频帧之间的复杂关系.为了克服该缺点,本文提出了一种基于超图排序算法的静态... 技术作为一种快速感知视频内容的方式得到了广泛的关注.现有基于图模型的视频摘要方法将视频帧作为顶点,通过边表示两个顶点之间的关系,但并不能很好地捕获视频帧之间的复杂关系.为了克服该缺点,本文提出了一种基于超图排序算法的静态视频摘要方法(Hyper-Graph Ranking based Video Summarization,HGRVS).HGRVS方法首先通过构建视频超图模型,将任意多个有内在关联的视频帧使用一条超边连接;然后提出一种基于超图排序的视频帧分类算法将视频帧按内容分类;最后通过求解提出的一种优化函数来生成静态视频摘要.在Open Video Project和YouTube两个数据集上的大量主观与客观实验验证了所提HGRVS算法的优良性能. 展开更多
关键词 视频摘要 超图 超图排序 视频帧分类 关键帧提取
下载PDF
基于节点相似性分组与图压缩的图摘要算法
6
作者 宏宇 陈鸿昶 +1 位作者 张建朋 黄瑞阳 《计算机应用》 CSCD 北大核心 2023年第10期3047-3053,共7页
针对当前图摘要方法压缩率较高,图压缩算法无法直接被用于下游任务分析的问题,提出一种图摘要与图压缩的融合算法,即基于节点相似性分组与图压缩的图摘要算法(GSNSC)。首先,初始化节点为超节点,并根据相似度对超节点分组;其次,将每个组... 针对当前图摘要方法压缩率较高,图压缩算法无法直接被用于下游任务分析的问题,提出一种图摘要与图压缩的融合算法,即基于节点相似性分组与图压缩的图摘要算法(GSNSC)。首先,初始化节点为超节点,并根据相似度对超节点分组;其次,将每个组的超节点合并,直到达到指定次数或指定节点数;再次,在超节点之间添加超边和校正边以恢复原始图;最后,对于图压缩部分,判断对每个超节点的邻接边压缩和摘要的代价,并选择二者中代价较小的执行。在Web-NotreDame、Web-Google和Web-Berkstan等6个数据集上进行了图压缩率和图查询实验。实验结果表明,在6个数据集上,与SLUGGER(Scalable Lossless sUmmarization of Graphs with HiERarchy)算法相比,所提算法的压缩率至少降低了23个百分点;与SWeG(Summarization of Web-scale Graphs)算法相比,所提算法的压缩率至少降低了13个百分点;在Web-NotreDame数据集上,所提算法的度误差比SWeG降低了41.6%。以上验证了所提算法具有更好的图压缩率和图查询准确度。 展开更多
关键词 图摘要 图压缩 图查询 超边 最小描述长度
下载PDF
图概要技术研究进展 被引量:3
7
作者 王雄 董一鸿 +1 位作者 施炜杰 潘剑飞 《计算机研究与发展》 EI CSCD 北大核心 2019年第6期1338-1355,共18页
图的概要化,简称图概要,旨在寻找一组简洁的超图或稀疏图,阐明原始图的主要结构信息或变化趋势.当前图概要的研究大多结合原始图的应用领域和背景,使用不同的概要技术构建一个特定的概要图,解决目前大图面临的信息过载、查询优化、空间... 图的概要化,简称图概要,旨在寻找一组简洁的超图或稀疏图,阐明原始图的主要结构信息或变化趋势.当前图概要的研究大多结合原始图的应用领域和背景,使用不同的概要技术构建一个特定的概要图,解决目前大图面临的信息过载、查询优化、空间压缩、影响分析、社交网络可视化等问题.对现有的图概要技术进行了汇总,以概要主要目的作为分类标准划分为基于空间压缩的图概要、基于查询优化的图概要、基于模式可视化的图概要和基于影响分析的图概要四大类,针对部分属性图和无属性图概要算法在真实数据集上进行了相关实验,并从压缩率、信息保持率、信息熵和时间进行对比分析.点明图概要的发展趋势,并指出图概要面临的挑战和可深入探索的研究方向,结合热门的深度学习技术提出了部分有价值的的宏观想法用以解决当前挑战. 展开更多
关键词 综述 图概要 图聚集 图概化 图压缩 可视化
下载PDF
TG-SMR:AText Summarization Algorithm Based on Topic and Graph Models 被引量:1
8
作者 Mohamed Ali Rakrouki Nawaf Alharbe +1 位作者 Mashael Khayyat Abeer Aljohani 《Computer Systems Science & Engineering》 SCIE EI 2023年第4期395-408,共14页
Recently,automation is considered vital in most fields since computing methods have a significant role in facilitating work such as automatic text summarization.However,most of the computing methods that are used in r... Recently,automation is considered vital in most fields since computing methods have a significant role in facilitating work such as automatic text summarization.However,most of the computing methods that are used in real systems are based on graph models,which are characterized by their simplicity and stability.Thus,this paper proposes an improved extractive text summarization algorithm based on both topic and graph models.The methodology of this work consists of two stages.First,the well-known TextRank algorithm is analyzed and its shortcomings are investigated.Then,an improved method is proposed with a new computational model of sentence weights.The experimental results were carried out on standard DUC2004 and DUC2006 datasets and compared to four text summarization methods.Finally,through experiments on the DUC2004 and DUC2006 datasets,our proposed improved graph model algorithm TG-SMR(Topic Graph-Summarizer)is compared to other text summarization systems.The experimental results prove that the proposed TG-SMR algorithm achieves higher ROUGE scores.It is foreseen that the TG-SMR algorithm will open a new horizon that concerns the performance of ROUGE evaluation indicators. 展开更多
关键词 Natural language processing text summarization graph model topic model
下载PDF
Topic-Aware Abstractive Summarization Based on Heterogeneous Graph Attention Networks for Chinese Complaint Reports
9
作者 Yan Li Xiaoguang Zhang +4 位作者 Tianyu Gong Qi Dong Hailong Zhu Tianqiang Zhang Yanji Jiang 《Computers, Materials & Continua》 SCIE EI 2023年第9期3691-3705,共15页
Automatic text summarization(ATS)plays a significant role in Natural Language Processing(NLP).Abstractive summarization produces summaries by identifying and compressing the most important information in a document.Ho... Automatic text summarization(ATS)plays a significant role in Natural Language Processing(NLP).Abstractive summarization produces summaries by identifying and compressing the most important information in a document.However,there are only relatively several comprehensively evaluated abstractive summarization models that work well for specific types of reports due to their unstructured and oral language text characteristics.In particular,Chinese complaint reports,generated by urban complainers and collected by government employees,describe existing resident problems in daily life.Meanwhile,the reflected problems are required to respond speedily.Therefore,automatic summarization tasks for these reports have been developed.However,similar to traditional summarization models,the generated summaries still exist problems of informativeness and conciseness.To address these issues and generate suitably informative and less redundant summaries,a topic-based abstractive summarization method is proposed to obtain global and local features.Additionally,a heterogeneous graph of the original document is constructed using word-level and topic-level features.Experiments and analyses on public review datasets(Yelp and Amazon)and our constructed dataset(Chinese complaint reports)show that the proposed framework effectively improves the performance of the abstractive summarization model for Chinese complaint reports. 展开更多
关键词 Text summarization TOPIC Chinese complaint report heterogeneous graph attention network
下载PDF
Graph Ranked Clustering Based Biomedical Text Summarization Using Top k Similarity
10
作者 Supriya Gupta Aakanksha Sharaff Naresh Kumar Nagwani 《Computer Systems Science & Engineering》 SCIE EI 2023年第6期2333-2349,共17页
Text Summarization models facilitate biomedical clinicians and researchers in acquiring informative data from enormous domain-specific literature within less time and effort.Evaluating and selecting the most informati... Text Summarization models facilitate biomedical clinicians and researchers in acquiring informative data from enormous domain-specific literature within less time and effort.Evaluating and selecting the most informative sentences from biomedical articles is always challenging.This study aims to develop a dual-mode biomedical text summarization model to achieve enhanced coverage and information.The research also includes checking the fitment of appropriate graph ranking techniques for improved performance of the summarization model.The input biomedical text is mapped as a graph where meaningful sentences are evaluated as the central node and the critical associations between them.The proposed framework utilizes the top k similarity technique in a combination of UMLS and a sampled probability-based clustering method which aids in unearthing relevant meanings of the biomedical domain-specific word vectors and finding the best possible associations between crucial sentences.The quality of the framework is assessed via different parameters like information retention,coverage,readability,cohesion,and ROUGE scores in clustering and non-clustering modes.The significant benefits of the suggested technique are capturing crucial biomedical information with increased coverage and reasonable memory consumption.The configurable settings of combined parameters reduce execution time,enhance memory utilization,and extract relevant information outperforming other biomedical baseline models.An improvement of 17%is achieved when the proposed model is checked against similar biomedical text summarizers. 展开更多
关键词 Biomedical text summarization UMLS BioBERT SDPMM clustering top K similarity PPF HITS page rank graph ranking
下载PDF
PSG: a two-layer graph model for document summarization 被引量:2
11
作者 Heng CHEN Hai JIN Feng ZHAO 《Frontiers of Computer Science》 SCIE EI CSCD 2014年第1期119-130,共12页
Graph model has been widely applied in docu- ment summarization by using sentence as the graph node, and the similarity between sentences as the edge. In this paper, a novel graph model for document summarization is p... Graph model has been widely applied in docu- ment summarization by using sentence as the graph node, and the similarity between sentences as the edge. In this paper, a novel graph model for document summarization is presented, that not only sentences relevance but also phrases relevance information included in sentences are utilized. In a word, we construct a phrase-sentence two-layer graph structure model (PSG) to summarize document(s) . We use this model for generic document summarization and query-focused sum- marization. The experimental results show that our model greatly outperforms existing work. 展开更多
关键词 relationship graph Markov random walk doc-ument summarization
原文传递
一种基于最短路径的视频摘要方法 被引量:3
12
作者 葛钊 赵烨 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2021年第2期193-198,共6页
视频摘要以简短的内容概括原始视频,是对原始视频的浓缩或者总结。传统的视频摘要方法有基于聚类的方法,通过视频帧的局部或全局特征将视频帧分成多个有代表性的集群,在每个集群中提取关键帧,最后去除冗余生成摘要;也有基于图模型的方法... 视频摘要以简短的内容概括原始视频,是对原始视频的浓缩或者总结。传统的视频摘要方法有基于聚类的方法,通过视频帧的局部或全局特征将视频帧分成多个有代表性的集群,在每个集群中提取关键帧,最后去除冗余生成摘要;也有基于图模型的方法,将视频帧作为顶点,连接顶点的边表示帧间的关系,通过图的模块化信息提取关键帧。文章将聚类方法和图模型的方法结合并优化,提出了一种新的基于最短路径算法的视频摘要方法(shortest path for video summary,SPVS)。SPVS方法将视频摘要问题转化为最短路径求解问题,路径上的帧即为关键帧,在数据集上的大量主客观实验结果都表明其具有良好的性能。 展开更多
关键词 视频摘要 聚类 图模型 最短路径
下载PDF
基于支配集的视频关键帧提取方法 被引量:2
13
作者 聂秀山 柴彦娥 滕聪 《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2879-2887,共9页
关键帧提取是视频处理的重要步骤之一,在视频内容分析中有广泛的应用.针对基于内容的视频分析,为获取高效的视频摘要提出一种视频关键帧提取方法.该方法首先以视频帧为顶点,以顶点之间的连线构造边,利用不同帧的加速鲁棒特征点的豪斯多... 关键帧提取是视频处理的重要步骤之一,在视频内容分析中有广泛的应用.针对基于内容的视频分析,为获取高效的视频摘要提出一种视频关键帧提取方法.该方法首先以视频帧为顶点,以顶点之间的连线构造边,利用不同帧的加速鲁棒特征点的豪斯多夫(Hausdorff)距离函数计算边权重,把视频建模成一个无向权重图,然后根据图的支配集理论把视频关键帧提取等价为无向权重图的极小支配集选取问题,进而利用整数线性规划选取图支配集,得到视频关键帧.与传统算法相比,该方法提取的关键帧依赖于视频内容,不受时间和视频镜头约束.实验结果显示,该方法能够体现关键帧的代表性和区分性,具有较高的保真度和压缩率. 展开更多
关键词 视频摘要 关键帧提取 图建模 支配集 整数规划 加速鲁棒特征
下载PDF
一种基于标签的网页摘要方法 被引量:2
14
作者 尚书杰 王灿 朱俊彦 《计算机工程》 CAS CSCD 北大核心 2010年第21期260-261,264,共3页
提出一种基于标签的网页摘要方法。根据优质用户和优质标签之间的相互加强关系,利用二分图排序算法对标签进行排序和打分,构建标签-文档图,应用ManifoldRanking算法对句子按其重要性进行排序,将排序靠前的句子组成网页摘要。实验结果证... 提出一种基于标签的网页摘要方法。根据优质用户和优质标签之间的相互加强关系,利用二分图排序算法对标签进行排序和打分,构建标签-文档图,应用ManifoldRanking算法对句子按其重要性进行排序,将排序靠前的句子组成网页摘要。实验结果证明,该方法的摘要准确性有明显改进。 展开更多
关键词 标签 摘要 图排序
下载PDF
基于主题聚类的动向情报自动摘要研究 被引量:1
15
作者 姚奕 杨帆 +1 位作者 杜晓明 袁清波 《国防科技》 2022年第3期76-83,共8页
信息时代的情报收集突破了传统情报收集方法的限制,广泛的来源导致其数据量超过了人工处理的极限。针对动向情报这类专业性强的多主题长文本,本文提出了一种基于主题聚类的自动摘要方法,即利用知识图谱蕴含的知识和语义关联关系来增强... 信息时代的情报收集突破了传统情报收集方法的限制,广泛的来源导致其数据量超过了人工处理的极限。针对动向情报这类专业性强的多主题长文本,本文提出了一种基于主题聚类的自动摘要方法,即利用知识图谱蕴含的知识和语义关联关系来增强句向量包含的语义信息并进行聚类,再基于主题特征对聚类结果进行优化,最后计算每个主题中句子之间的相似度,并选取每个主题中最具代表性的句子组成摘要。这项工作具有两大显著优势,一是聚类效果更好;二是在不降低准确率的前提下,运行速度更快。 展开更多
关键词 动向情报 文本摘要 知识图谱 预训练模型
下载PDF
基于改进K-means聚类与图模型相结合的多文本自动文摘研究 被引量:2
16
作者 赵美玲 刘胜全 +2 位作者 刘艳 郭竹为 符贤哲 《现代计算机(中旬刊)》 2017年第6期26-30,共5页
目前多文档文摘大多数对同一主题下的文本进行摘要,不同主题下的文本自动文摘的研究相对较少。已有的多文本自动摘要或多或少有不足,使用聚类方法存在初始质心k无法确定以及构造图模型时句子相似度计算没有考虑语义特征等现象。对不同... 目前多文档文摘大多数对同一主题下的文本进行摘要,不同主题下的文本自动文摘的研究相对较少。已有的多文本自动摘要或多或少有不足,使用聚类方法存在初始质心k无法确定以及构造图模型时句子相似度计算没有考虑语义特征等现象。对不同主题的多文档进行主题划分,然后依据主题进行多文本自动摘要,针对以上多文档文摘方法存在的不足,改进K-means聚类、句子相似度计算等缺陷,提出改进K-means聚类和图模型相结合的方法。通过实验表明,该方法的准确率高于基于聚类或者基于图排序的算法。 展开更多
关键词 自动文摘 多文本 聚类 图模型
下载PDF
Document Clustering Using Graph Based Fuzzy Association Rule Generation
17
作者 P.Perumal 《Computer Systems Science & Engineering》 SCIE EI 2022年第10期203-218,共16页
With the wider growth of web-based documents,the necessity of automatic document clustering and text summarization is increased.Here,document summarization that is extracting the essential task with appropriate inform... With the wider growth of web-based documents,the necessity of automatic document clustering and text summarization is increased.Here,document summarization that is extracting the essential task with appropriate information,removal of unnecessary data and providing the data in a cohesive and coherent manner is determined to be a most confronting task.In this research,a novel intelligent model for document clustering is designed with graph model and Fuzzy based association rule generation(gFAR).Initially,the graph model is used to map the relationship among the data(multi-source)followed by the establishment of document clustering with the generation of association rule using the fuzzy concept.This method shows benefit in redundancy elimination by mapping the relevant document using graph model and reduces the time consumption and improves the accuracy using the association rule generation with fuzzy.This framework is provided in an interpretable way for document clustering.It iteratively reduces the error rate during relationship mapping among the data(clusters)with the assistance of weighted document content.Also,this model represents the significance of data features with class discrimination.It is also helpful in measuring the significance of the features during the data clustering process.The simulation is done with MATLAB 2016b environment and evaluated with the empirical standards like Relative Risk Patterns(RRP),ROUGE score,and Discrimination Information Measure(DMI)respectively.Here,DailyMail and DUC 2004 dataset is used to extract the empirical results.The proposed gFAR model gives better trade-off while compared with various prevailing approaches. 展开更多
关键词 Document clustering text summarization fuzzy model association rule generation graph model relevance mapping feature patterns
下载PDF
一种基于图的文档关键词和摘要协同抽取方法研究 被引量:1
18
作者 毛湘科 黄少滨 余秦勇 《计算机科学》 CSCD 北大核心 2021年第10期44-50,共7页
关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括。评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖。在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词... 关键词提取和摘要抽取的目的都是从原文档中选择关键内容并对原文档的主要意思进行概括。评价关键词和摘要抽取质量的好坏主要看其能否对文档的主题进行良好的覆盖。在现有基于图模型的关键词提取和摘要抽取方法中,很少涉及到将关键词提取和摘要抽取任务协同进行的,而文中提出了一种基于图模型的方法进行关键词提取和摘要的协同抽取。该方法首先利用文档中词、主题和句子之间的6种关系,包括词和词、主题和主题、句子和句子、词和主题、主题和句子、词和句子,进行图的构建;然后利用文档中词和句子的统计特征对图中各顶点的先验重要性进行评价;接着采用迭代的方式对词和句子进行打分;最后根据词和句子的得分,得到关键词和摘要。为验证所提方法的效果,文中在中英文数据集上进行关键词提取和摘要抽取实验,发现该方法不管是在关键词提取还是摘要抽取任务上都取得了良好的效果。 展开更多
关键词 关键词提取 摘要抽取 图模型 主题覆盖
下载PDF
基于事件的多主题文本自动文摘方法 被引量:1
19
作者 廖涛 刘宗田 王先传 《计算机工程》 CAS CSCD 2013年第3期236-240,共5页
通过对自动文摘技术的研究,针对叙事类文本,以事件作为基本语义单元,提出一种基于事件的多主题文本自动文摘方法。利用事件和事件间的关系构建事件网络文本表示模型,使用社区划分算法解决子事件主题划分问题。实验结果表明,该方法提取... 通过对自动文摘技术的研究,针对叙事类文本,以事件作为基本语义单元,提出一种基于事件的多主题文本自动文摘方法。利用事件和事件间的关系构建事件网络文本表示模型,使用社区划分算法解决子事件主题划分问题。实验结果表明,该方法提取出的摘要准确率、召回率及F值较高,能更好地概括文本的内容。 展开更多
关键词 多主题文本 自动文摘 文本表示 图结构 事件网络 主题划分
下载PDF
基于最小描述长度原则的属性图概要方法
20
作者 张陶 于炯 +1 位作者 廖彬 毕雪华 《计算机工程与应用》 CSCD 北大核心 2021年第15期124-132,共9页
图概要技术是管理、分析和可视化大规模图的关键技术之一。如何综合结构和属性信息进行图概要是一个挑战。大部分现有的图概要方法或者只考虑结构或属性某一方面的信息,或者要求属性的表现形式是一致的。结合信息论中最小描述长度原则,... 图概要技术是管理、分析和可视化大规模图的关键技术之一。如何综合结构和属性信息进行图概要是一个挑战。大部分现有的图概要方法或者只考虑结构或属性某一方面的信息,或者要求属性的表现形式是一致的。结合信息论中最小描述长度原则,对属性图概要问题建模,将其转化为求解最小表示代价问题,以实现图压缩和图概要的双重目标。提出了一种计算节点属性相似性的方法,该属性度量方法对节点属性的限制较小,并且将节点间的相似性统一为存储代价,实现了节点结构相似和属性相似的协同考虑。提出了两种求解最小代价表示的图概要算法。在真实和合成的数据集上实验,验证了提出算法的有效性。 展开更多
关键词 图概要 图聚集 最小描述长度 属性图 节点相似性
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部