期刊文献+

一种改进的基于潜在语义索引的文本聚类算法 被引量:3

An Improved Text Clustering Algorithm Based on Latent Semantic Indexing
下载PDF
导出
摘要 提出一种改进的基于潜在语义索引的文本聚类算法。算法引入潜在语义索引理论,改进传统的SOM算法。用潜在语义索引理论表示文本特征向量,挖掘文本中词与词之间隐藏的语义结构关系,从而消除词语之间的相关性,实现特征向量的降维。改进传统的SOM算法的局限性,准确给出聚类类别数目的值。实验结果表明,本算法的聚类效果更好,聚类时间更少。 This paper presents an improved text clustering algorithm based on latent semantic indexing .This algorithm introduces the theory of latent semantic index , improves the traditional SOM algorithm .By using the latent semantic indexing text feature vector representation theory , we mine the semantic structure relationships hidden among the words in text , thereby eliminating the correlation among words , to reduce the feature vector dimension .The limitations of the traditional SOM algorithm are improved to accurately give the number of clustering classes .Experimental results show that the clustering effect of this algorithm is better , and the clustering time is less .
作者 侯泽民 巨筱
出处 《计算机与现代化》 2014年第7期24-27,共4页 Computer and Modernization
基金 郑州市科技局自然科学基金资助项目(201210439)
关键词 文本聚类 潜在语义索引 自组织映射 text clustering latent semantic index self-organizing maps
  • 相关文献

参考文献17

  • 1王礼礼..基于潜在语义索引的文本聚类算法研究[D].西南交通大学,2008:
  • 2罗克刚..基于自组织映射的文本聚类研究[D].哈尔滨工业大学,2007:
  • 3郭武斌,周宽久,张世荣.基于潜在语义索引的SVM文本分类模型[J].情报学报,2009,28(6):827-833. 被引量:3
  • 4廖一星.一种新的监督潜在语义模型[J].计算机工程与应用,2009,45(33):117-119. 被引量:1
  • 5常利伟..基于多系统融合的潜在语义分析技术研究[D].沈阳航空航天大学,2013:
  • 6吴志媛..基于潜在语义索引的Web文本挖掘[D].江南大学,2013:
  • 7刘远超..基于动态自组织映射模型的文本聚类研究[D].哈尔滨工业大学,2006:
  • 8刘旭政,张春荣,陈水生.基于模糊神经网络的拉索耐久性评价模型[J].华东交通大学学报,2010,27(2):8-12. 被引量:5
  • 9刘云峰..基于潜在语义分析的中文概念检索研究[D].华中科技大学,2005:
  • 10Alahakoon D, Halgamuge S K, Srinivasan B.Dynamic self-organizing maps with controlled growth for knowledge discovery[J].IEEE Transactions on Neural Networks, 2000,11(3):601-614. 被引量:1

二级参考文献65

共引文献31

同被引文献12

引证文献3

二级引证文献6

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部