-
题名LDA特征扩展的多类SVM短文本分类方法研究
被引量:5
- 1
-
-
作者
郑腾
吴雨川
-
机构
武汉纺织大学机械工程与自动化学院
-
出处
《武汉纺织大学学报》
2019年第2期72-76,共5页
-
基金
国家自然科学基金面上项目(61271008)
-
文摘
针对短文本信息量少、特征稀疏的特点,提出一种基于LDA主题扩展的多类SVM短文本分类方法。在短文本基础上,利用LDA主题模得到文档的主题分布,将主题中的词扩充到原短文本的特征中,在特征空间上使用基于经典权重计算方法的多类SVM分类器进行分类。实验结果表明,在各个类别上的查准率、查全率和F1值都有所提高,验证了该方法的可行性。
-
关键词
短文本分类
特征扩展
SVM
lda
-
Keywords
short text classification
feature expansion
laten dirichlet allocation(lda)
SVM
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-
-
题名基于LDA特征扩展的短文本分类方法研究
被引量:4
- 2
-
-
作者
胡朝举
徐永峰
-
机构
华北电力大学控制与计算机工程学院
-
出处
《软件导刊》
2018年第3期63-66,共4页
-
文摘
针对短文本信息篇幅短、信息量少、特征稀疏的特点,提出一种基于LDA(Laten Dirichlet Allocation)主题模型特征扩展的短文本分类方法。该方法利用LDA模型得到文档的主题分布,然后将对应主题下的词扩充到原来短文本的特征中,作为新的部分特征词,最后利用SVM分类方法进行分类。实验结果表明,相比于传统的基于VSM模型的分类方法,基于LDA特征扩展的短文本分类方法克服了特征稀疏的问题,在各个类别上的查准率、查全率和F1值都有所提高,充分验证了该方法对短文本分类的可行性。
-
关键词
短文本分类
隐含狄利克雷分布(lda)
特征扩展
SVM
-
Keywords
short text classification
laten dirichlet allocation (lda)
feature expansion
SVM
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-