数据流上基于K-median聚类的算法研究被引量：3

Research on Algorithms for K-median Clustering over Data Streams

下载PDF

导出

摘要文章研究和分析了数据流上的K-median聚类算法技术,包括:(1)流模型和K-median问题定义;(2)基于流的K-median聚类基本决策和内在机理;(3)理论上有性能保证的流算法。对于每一特征,这种技术能在没有实际保留任何数据流对象的情形下有效地确定聚类点。它通过一个聚类块的一分为二或相邻聚类块的合二为一来动态地生成聚类点,从而实现上述目标。作为结果,这种技术所确定的聚类点将比其他常规方法更准确。在数据流环境中,这种技术能够在产生高质量聚类结果的同时非常有效地执行。 K-median Technique that employs clustering algorithms for a data stream is studied and analyzed here, including: (1) the definition of stream model and k-median problem;(2) the fundamental decisions and inner mechanism of k-median clustering on streams;(3) streaming algorithms with theoretical performance guarantees. For each feature, its clusters can be effectively found upon without maintaining any object of the data stream physically. For the purpose, clusters are dynamically generated by splitting a cluster into two clusters or merging two adjacent clusters into one cluster. As a result, the studied technique can find clusters more correctly than other conventional methods. It can perform very efficiently in the data stream environment while producing clustering results of very high quality.

作者郑广寰林锦贤

机构地区福州大学数学与计算机科学学院福州大学网络与信息中心

出处《微电子学与计算机》 CSCD 北大核心 2006年第z1期190-192,共3页 Microelectronics & Computer

基金福建省自然科学基金项目(A0410011) 福建省科技专项经费项目(2005K007)

关键词数据流 K-Median聚类算法理念 Data stream, K-median clustering, Algorithm, Idea

分类号 TP31 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献4

1[1]S Guha,R Motwani N Mishra,L O'Callaghan.Clustering data streams.In Proc.41th Annu.IEEE Sympos.Found.Comput.Sci.,2000:359～366 被引量：1
2[2]O'Callaghan L,Mishra N,Meyerson A.Streaming-data algorithms for high-quality clustering[A].ICDE Conference,San Jose,California,USA,2002:685～699 被引量：1
3[3]A Meyerson.Online facility location.Proc.ACM Symp.Foundations of Computer Science,2001. 被引量：1
4[4]Datar M,Gionis A,Indyk P,Motwani R.Maintaining stream statistics over sliding windows.In:Eppstein D,ed.Proc.of the 13th Annual ACM-SIAM Symp.on Discrete Algorithms.San Francisco:ACM/SIAM,2002:635～644 被引量：1

同被引文献12

1郭延斌,张国峰,戴树岭.虚拟战场环境下基于Agent技术的指挥实体研究[J].系统仿真学报,2004,16(10):2302-2304. 被引量：5
2易东,陈庆虎.基于多分类器组合的笔迹验证[J].计算机应用,2006,26(1):172-173. 被引量：8
3朱根标,张凤鸣,董群立.基于核函数和相似度的动态聚类算法[J].微电子学与计算机,2006,23(3):178-179. 被引量：8
4邹艳珍,谢冰,钱金蕾.一种支持多领域构件描述的分类描述模型[J].南京大学学报（自然科学版）,2006,42(2):111-119. 被引量：2
5王勇,李战怀,张阳,蒋芸.基于相反分类器的数据流分类方法[J].计算机科学,2006,33(8):206-209. 被引量：2
6苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：386
7李文立,邓贵仕,何晖光.基于CORBA的分布式计算模型设计[J].计算机应用,2001,21(10):9-10. 被引量：9
8赵谊虹,程国华,史习智.多分类器融合中一种新的加权算法[J].上海交通大学学报,2002,36(6):765-768. 被引量：10
9王正群,孙兴华,杨静宇.多分类器组合研究[J].计算机工程与应用,2002,38(20):84-85. 被引量：6
10寇忠宝,张长水.基于Multi-Agent的分类器融合[J].计算机学报,2003,26(2):174-179. 被引量：17

引证文献3

1王德鹏,李凡长.Agent普适机器学习分类器[J].南京大学学报（自然科学版）,2008,44(2):164-170. 被引量：3
2王世卿,张真,陈本华.一种基于概率统计的自适应网格聚类算法[J].微电子学与计算机,2008,25(5):173-175. 被引量：3
3邱保志,陈本华,张真.一种新的快速混合聚类算法[J].微电子学与计算机,2008,25(7):78-80. 被引量：6

二级引证文献12

1孟娜娜,徐振明.一种基于划分的无监督优化算法[J].计算机工程,2011,37(S1):168-170. 被引量：1
2张炯,李凡长.基于流形学习的纤维丛模型研究[J].南京大学学报（自然科学版）,2008,44(5):477-485. 被引量：5
3何书萍,李凡长.一个基于量子群的分子对接药物设计算法[J].南京大学学报（自然科学版）,2008,44(5):512-519. 被引量：6
4张红梅,丁伟,范艳峰.一种改进的层次聚类算法在面包品质检验中的应用[J].微电子学与计算机,2009,26(7):187-190. 被引量：3
5黄斌,黄文明.基于Gabor滤波器人体血液图像中粘连细胞的分割[J].微电子学与计算机,2009,26(11):95-97.
6王德鹏,李璐.一种Agent普适机器学习分类器在Smart-It中的应用[J].电脑知识与技术,2009,5(11):8761-8762.
7张丽,崔卫东,邱保志.基于划分与层次方法的混合聚类算法[J].计算机工程与应用,2010,46(16):127-129. 被引量：2
8何佃伟,杨承志,张荣,吴宏超.一种基于改进网格聚类的雷达信号分选算法[J].雷达与对抗,2011,31(2):43-45. 被引量：11
9朱会东,段赵磊.一种面向非规则数据的差别预取策略[J].微电子学与计算机,2013,30(6):34-37. 被引量：1
10黄辰.几种典型聚类方法在雷达信号分选中的应用浅析[J].电子信息对抗技术,2017,32(5):1-4. 被引量：6

1王玉靖.实现综合信息数据库管理方法的研究[J].河北省科学院学报,2005,22(2):11-13.
2刘勇,陆亚维.利用VB流输入/输出SQL Server数据库Image型数据[J].计算机与现代化,2004(7):78-79.
3李云峰,廖伯仁.MIS系统JPEG格式图象的存取[J].中国人民公安大学学报（自然科学版）,2001,7(3):43-45.
4刘玉成.用jsp实现整个目录上传案例[J].金融科技时代,2017,25(2):52-54. 被引量：1
5周毅仁,王克鸿,韩杰.基于ADO的SQL Server图形数据库的存取方法[J].机械制造与自动化,2005,34(3):119-120. 被引量：1
6蒋华伟,李战升.利用Delphi的流对象对多媒体文件进行操作[J].电脑编程技巧与维护,2004(12):19-21.
7何涛,张世禄,汪杭军.基于SQL Server用C#实现文件夹中图片存储到数据库的研究与应用[J].计算机与信息技术,2009(10):52-54. 被引量：1
8李国辉.分布异构环境下的多媒体系统服务结构[J].计算机工程与应用,1998,34(1):31-33.
9高阳,曾锦麒.基于XML的数据持久化[J].电脑开发与应用,2003,16(4):64-66.
10张伟民,王亚林.ADO.NET访问数据库的技巧探讨[J].微计算机信息,2011,27(11):135-137. 被引量：2

微电子学与计算机

2006年第z1期

浏览历史

内容加载中请稍等...

数据流上基于K-median聚类的算法研究被引量：3

参考文献4

同被引文献12

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

数据流上基于K-median聚类的算法研究 被引量：3

参考文献4

同被引文献12

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

数据流上基于K-median聚类的算法研究被引量：3