-
题名基于词向量与TextRank的关键词提取方法
被引量:23
- 1
-
-
作者
周锦章
崔晓晖
-
机构
武汉大学国家网络安全学院
-
出处
《计算机应用研究》
CSCD
北大核心
2019年第4期1051-1054,共4页
-
基金
中央高校基本科研业务费专项资金资助项目(2042017gf0035)
-
文摘
针对词汇语义的差异性对TextRank算法的影响进行了研究,提出一种基于词向量与TextRank的关键词抽取方法。利用FastText将文档集进行词向量表征,基于隐含主题分布思想和利用词汇间语义性的差异,构建TextRank的转移概率矩阵,最后进行词图的迭代计算和关键词抽取。实验结果表明,该方法的抽取效果相比于传统方法有明显提升,同时证明利用词向量能简单而有效地改善TextRank算法的性能。
-
关键词
抽取
语义差异性
TextRank
词向量
隐含主题分布
-
Keywords
keyword extraction
semantic difference
TextRank
word vector
implied subject distribution
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
TP301.6
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于隐含狄利克雷分配模型的图像分类算法
被引量:9
- 2
-
-
作者
杨赛
赵春霞
-
机构
南京理工大学计算机科学与技术学院
-
出处
《计算机工程》
CAS
CSCD
2012年第14期181-183,共3页
-
基金
国家自然科学基金资助重大项目(90820306)
-
文摘
概率隐含语义分析模型不适用于大规模图像数据集,为此,提出一种基于隐含狄利克雷分配模型(LDA)的图像分类算法。以BOF特征作为图像内容的初始描述,利用Gibbs抽样算法近似估算LDA模型参数,得到图像的隐含主题分布特征,并采用k近邻算法对图像进行分类。实验结果表明,与基于概率隐含语义分析模型的分类算法相比,该算法的分类性能较优。
-
关键词
BOF模型
中层语义特征
隐含狄利克雷分配模型
隐含主题分布特征
K近邻算法
图像分类
-
Keywords
Bag-of-Features(BOF) model
middle-level semantic feature
Latent Dirichlet Allocation(LDA) model
latent topic distribution feature
k Nearest Neighbor(kNN) algorithm
image classification
-
分类号
TP341.94
[自动化与计算机技术—计算机系统结构]
-