期刊文献+

结合神经网络的文本降维方法

下载PDF
导出
摘要 传统文本表示模型多为稀疏矩阵,文本规模的增长导致维度灾难。文中提出一种结合神经网络的文本降维方法,利用随机映射、非负矩阵分解、隐含语义分析等方法实现文本降维,使用自建微博文本数据集比较其效率和准确率,并在最优降维方案的基础上使用自组织神经网络算法进行聚类。实验结果表明,该方案准确率相比传统不降维的K-means聚类方法有一定提升。
出处 《福建轻纺》 2020年第3期26-28,共3页 The Light & Textile Industries of Fujian
基金 福建省教育厅自然科学研究项目——基于分布式并行平台的PTD&EDD大数据研究及数据挖掘应用(项目编号:JAT160316)
  • 相关文献

参考文献3

二级参考文献81

  • 1陈卫刚,戚飞虎.可行方向算法与模拟退火结合的NMF特征提取方法[J].电子学报,2003,31(z1):2190-2193. 被引量:6
  • 2LlU Weixiang ZHENG Nanning YOU Qubo.Nonnegative matrix factorization and its applications in pattern recognition[J].Chinese Science Bulletin,2006,51(1):7-18. 被引量:22
  • 3Guha S,Rastogi R,Shim K.CURE:An Efficient Clustering Algorithm for Large Databases[C].Seattle:Proceedings of the ACM SIGMOD Conference,1998.73-84. 被引量:1
  • 4Guha S,Rastogi R,Shim K.ROCK:A Robust Clustering Algorithm for Categorical Attributes[C].Sydney:Proceedings of the 15th ICDE,1999.512-521. 被引量:1
  • 5Karypis G,Han E-H,Kumar V.CHAMELEON:A Hierarchical Clustering Algorithm Using Dynamic Modeling[J].IEEE Computer,1999,32(8):68-75. 被引量:1
  • 6Ester M,Kriegel H-P,Sander J,et al.A Density-based Algorithm for Discovering Clusters in Large Spatial Databases with Noise[C].Portland:Proceedings of the 2nd ACM SIGKDD,1996.226-231. 被引量:1
  • 7Hinneburg A,Keim D.An Efficient Approach to Clustering Large Multimedia Databases with Noise[C].New York:Proceedings of the 4th ACM SIGKDD,1998.58-65. 被引量:1
  • 8Wang W,Yang J,Muntz R.STING:A Statistical Information Grid Approach to Spatial Data Mining[C].Athens:Proceedings of the 23rd Conference on VLDB,1997.186-195. 被引量:1
  • 9Wang W,Yang J,Muntz R R.STING+:An Approach to Active Spatial Data Mining[C].Sydney:Proceedings of the 15th ICDE,1999.116-125. 被引量:1
  • 10Agrawal R,Gehrke J,Gunopulos D,et al.Automatic Subspace Clustering of High Dimensional Data for Data Mining Applications[C].Seattle:Proceedings of the ACM SIGMOD Conference,1998.94-105. 被引量:1

共引文献332

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部