云计算视域下数据挖掘算法探讨被引量：2

下载PDF

导出

摘要云计算的产生为大规模数据处理提供了良好支持,而要获取其中有用的数据信息还需要借助数据挖掘算法。基于此,本文从云计算视域出发,探究了Hadoop分布式系统结构,分析了现有K-means数据挖掘算法工作过程与存在的主要不足,并提出了优化的K-means数据挖掘算法。通过实验对比结果表明,优化后的算法在处理各个数据簇样本时,不管是数据收集覆盖率,还是数据中心点确定准确率都更好。同时,优化的K-means数据挖掘算法在不正确数据数量上要更低。由此证明,优化的K-means数据挖掘算法具有良好的应用效果。

作者杨小龙

机构地区福州软件职业技术学院智能产业学院

出处《信息记录材料》 2024年第1期23-25,共3页 Information Recording Materials

关键词云计算数据挖掘算法 K-MEANS

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献7

1陈勇.一种基于云计算的大数据关联规律挖掘分析方法[J].无线电工程,2017,47(3):8-11. 被引量：13
2张捷,封俊红,朱晓姝.云计算环境下海量数据挖掘的优化方法研究[J].玉林师范学院学报,2017,38(5):146-151. 被引量：6
3李颖.基于云计算的分布式数据挖掘系统设计与实现[J].电子技术与软件工程,2016(15):204-204. 被引量：6
4于连城,张译,张广德,徐欣杰,吴彬.基于canopy-k-means算法的电网数据挖掘算法的研究[J].国外电子测量技术,2018,37(7):35-39. 被引量：12
5申燕萍,顾苏杭,郑丽霞.基于云计算平台的仿生优化聚类数据挖掘算法[J].计算机科学,2019,46(11):247-250. 被引量：25
6黄潮.云计算环境下的海量光纤通信故障数据挖掘算法研究[J].激光杂志,2017,38(1):96-100. 被引量：37
7何清,庄福振,曾立,赵卫中,谭庆.PDMiner:基于云计算的并行分布式数据挖掘工具平台[J].中国科学：信息科学,2014,44(7):871-885. 被引量：28

二级参考文献84

1李晓毅,徐兆棣.关联规则挖掘的算法分析[J].辽宁工程技术大学学报（自然科学版）,2006,25(2):318-320. 被引量：18
2耿晓中,张冬梅.数据挖掘综述[J].长春师范学院学报（自然科学版）,2006,25(3):24-27. 被引量：13
3王轶,达新宇.分布式并行数据挖掘计算框架及其算法研究[J].微电子学与计算机,2006,23(9):223-225. 被引量：9
4宋晓云,苏宏升.一种并行决策树学习方法研究[J].现代电子技术,2007,30(2):141-144. 被引量：4
5张云,冯博琴,麻首强,刘连梦.蚁群-遗传融合的文本聚类算法[J].西安交通大学学报,2007,41(10):1146-1150. 被引量：15
6Han J W, Kamber M, Pei J. Data Mining: Concepts and Techniques. 3rd ed. San Francisco: Morgan Kaufmann, 2011. 被引量：1
7Luo P, Lu K, Huang R, et al. A heterogeneous computing system for data mining workflows in multi-agent environ- ments. Expert Syst, 2006, 23:258-272. 被引量：1
8Zhuang F Z, He Q, Shi Z Z. Multi-agent based on automatic evaluation system for classification algorithm. In: Proceedings of International Conference on Information Automation, Zhangjiajie, 2008. 264-269. 被引量：1
9Hameenanttila T, Guan X L, Carothers J D, et al. The flexible hypercube: a new fault-tolerant architecture for parallel computing. J Parallel Distr Com, 1996, 37:213-220. 被引量：1
10Goudreau M W, Lang K, Rao S B, et al. Portable and efficient parallel computing using the BSP model. IEEE Trans Comput, 1999, 48:670-689. 被引量：1

共引文献120

1胡聪,徐敏,洪德华,刘翠玲,薛晓茹,王海鑫.基于改进K-medoids聚类和SVM的异常用电模式在线检测方法[J].国外电子测量技术,2022,41(2):53-59. 被引量：9
2夏黎明.脑脓肿9例CT误诊原因分析[J].中国基层医药,2000,7(1):65-65.
3孙定华,许宪中.论材料特性与变压器的抗短路能力——写在新世纪到来之际[J].变压器,2000,37(2):15-20. 被引量：3
4李学龙,龚海刚.大数据系统综述[J].中国科学：信息科学,2015,45(1):1-44. 被引量：459
5王永.基于云计算的数据挖掘平台架构及其关键技术探讨[J].中国新通信,2015,17(10):69-69. 被引量：7
6丁伟,万定生,樊龙.并行数据挖掘方法在水利普查成果分析中的应用[J].计算机与现代化,2015(10):107-111.
7何清,敖翔,庄福振,罗平.一种基于Hadoop的大数据挖掘云服务及应用[J].信息通信技术,2015,9(6):42-49. 被引量：13
8李洪成,吴晓平,陈燕.MapReduce框架下支持差分隐私保护的k-means聚类方法[J].通信学报,2016,37(2):124-130. 被引量：24
9林媛.非结构化网络中有价值信息数据挖掘研究[J].计算机仿真,2017,34(2):414-417. 被引量：22
10陈小莉.基于大数据的计算机数据挖掘技术在档案管理系统中的研究应用[J].激光杂志,2017,38(2):142-145. 被引量：49

同被引文献5

1宋杰.基于云计算与数据挖掘技术的网络安全监测与预警研究[J].信息系统工程,2023(10):138-141. 被引量：3
2刘柯倩.基于云计算的企业财务数据挖掘方法[J].信息与电脑,2023,35(14):203-205. 被引量：2
3杨如惠,王维尚,陈喜军.大数据与云计算时代动力设备的管理探析[J].设备管理与维修,2023(19):9-11. 被引量：1
4姜宇,黄芳.大数据时代下计算机软件技术的运用[J].数字技术与应用,2023,41(12):34-36. 被引量：3
5董婷,吴疆.云计算环境下的大数据存储与处理优化策略分析[J].石河子科技,2024(1):42-45. 被引量：8

引证文献2

1袁若兰.数据挖掘算法在生物数据库中重复数据探测的运用概述[J].电子元器件与信息技术,2024,8(6):98-100.
2戴昀.云计算环境下的数据挖掘技术研究[J].信息与电脑,2024,36(10):106-108.

1王翔.高并发访问下的分布式系统架构设计[J].智能城市,2023,9(3):5-7. 被引量：3
2徐建伟,刘巧梦,王文杰.基于GEO数据库筛选影响同种异体肾移植术后肾功能的关键基因及生物学因素[J].国际泌尿系统杂志,2023,43(6):1076-1080.
3郑钧元,王奕然,王慧,秦一帆,田玉静,崔荣军,赵福阳,杨旭芳.基于生物信息学筛选三阴性乳腺癌潜在预后相关基因[J].牡丹江医学院学报,2023,44(5):17-22.
4刘宏芳,陈王若尘,张海丹,吴剑波.电厂空气预热器漏风率算法探讨和改进[J].锅炉技术,2023,54(6):28-33. 被引量：2
5毛永佳,罗鹏,毛诗贤,叶德鑫,龙蓉,卢春远,张江萍.急性缺血性脑卒中早期神经功能恶化预测模型构建及评价[J].现代预防医学,2024,51(1):166-172.
6朱鸿,刘洋,王俊祎,袁羽佳,方彦鹏.基于机器学习算法探讨医护人员心脏超声中E/A比值的影响因素[J].中文科技期刊数据库（全文版）医药卫生,2023(12):1-6.
7王凤琳,王爱民,黄一铭,徐雅琪,张文婧,石福艳,王素珍.利用机器学习算法分析影响阿尔兹海默病的脂蛋白及代谢物[J].现代预防医学,2023,50(23):4225-4230.
8武乐,柳江枫,梁万丰,杨晔宏,胡刚,杨俊涛.真核翻译延伸因子1家族成员在肺腺癌发生发展中的作用[J].中国医学科学院学报,2023,45(6):867-885.
9刘伟.无人机测绘数据处理技术及其应用探讨[J].中文科技期刊数据库（全文版）工程技术,2024(1):0064-0067.
10潘伟健,胡钰绅,李伟,周珺,罗钦.基于B/S架构的列车运行图智能编制系统设计与开发[J].铁路计算机应用,2024,33(1):89-93.

信息记录材料

2024年第1期

浏览历史

内容加载中请稍等...

云计算视域下数据挖掘算法探讨被引量：2

参考文献7

二级参考文献84

共引文献120

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

云计算视域下数据挖掘算法探讨 被引量：2

参考文献7

二级参考文献84

共引文献120

同被引文献5

引证文献2

相关作者

相关机构

相关主题

浏览历史

云计算视域下数据挖掘算法探讨被引量：2