期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
结合半监督学习和LDA模型的文本分类方法 被引量:7
1
作者 韩栋 王春华 肖敏 《计算机工程与设计》 北大核心 2018年第10期3265-3271,共7页
针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表... 针对样本集中具有较少标记样本情况下的文本分类问题,提出一种结合半监督学习(SSL)和隐含狄利克雷分配(LDA)主题模型的标记样本扩展方法(SSL-LDA),并整合朴素贝叶斯(NB)分类器构建一种文本分类方法。使用LDA主题模型生成主题分布,以表示所有样本;根据训练集中已标记样本,通过一种简化粒子群优化(SPSO)算法获得SSL-LDA自训练模型的最优参数;基于SSL-LDA自训练模型对训练集中一些未标记样本进行标记,扩展训练集;基于扩展后的训练集,训练NB文本分类器。在3个数据集上的实验结果表明,该方法能够很好地应对标记样本较少的情况,获得了较高的分类精确度。 展开更多
关键词 文本分类 半监督学习 LDA主题模型 简化粒子群优化 标记样本扩展
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部