摘要
针对传统文本处理中非作用词的存在影响主题的可解释性,以及短文本篇幅短小、特征不明显等问题,提出了一种基于LDA模型的主题分类的改进算法。该算法通过信息的增益来过滤文本,同时与最优主题的选择方法相结合,利用算法建立起的分类规则对文本进行分类。实验结果表明,该方法通过改变作用词占比、特征词典的大小,可以有效的提升文本分类的准确性。
作者
李贤阳
邱桂华
阳建中
李长彬
LI Xianyang;QIU Guihua;YANG Jianzhong;LI Changbin
出处
《荆楚理工学院学报》
2019年第6期5-8,13,共5页
Journal of Jingchu University of Technology
基金
广西高校中青年教师科研基础能力提升项目(2017KY0795)。