摘要
云计算的产生为大规模数据处理提供了良好支持,而要获取其中有用的数据信息还需要借助数据挖掘算法。基于此,本文从云计算视域出发,探究了Hadoop分布式系统结构,分析了现有K-means数据挖掘算法工作过程与存在的主要不足,并提出了优化的K-means数据挖掘算法。通过实验对比结果表明,优化后的算法在处理各个数据簇样本时,不管是数据收集覆盖率,还是数据中心点确定准确率都更好。同时,优化的K-means数据挖掘算法在不正确数据数量上要更低。由此证明,优化的K-means数据挖掘算法具有良好的应用效果。
出处
《信息记录材料》
2024年第1期23-25,共3页
Information Recording Materials