摘要
传统文本表示模型多为稀疏矩阵,文本规模的增长导致维度灾难。文中提出一种结合神经网络的文本降维方法,利用随机映射、非负矩阵分解、隐含语义分析等方法实现文本降维,使用自建微博文本数据集比较其效率和准确率,并在最优降维方案的基础上使用自组织神经网络算法进行聚类。实验结果表明,该方案准确率相比传统不降维的K-means聚类方法有一定提升。
出处
《福建轻纺》
2020年第3期26-28,共3页
The Light & Textile Industries of Fujian
基金
福建省教育厅自然科学研究项目——基于分布式并行平台的PTD&EDD大数据研究及数据挖掘应用(项目编号:JAT160316)