-
题名多阈值BIRCH聚类算法及其应用
被引量:17
- 1
-
-
作者
邵峰晶
张斌
于忠清
-
机构
青岛大学信息工程学院
青岛大学软件技术研究所
-
出处
《计算机工程与应用》
CSCD
北大核心
2004年第12期174-176,195,共4页
-
文摘
BIRCH算法是针对大规模数据集的聚类算法。文章针对该算法在聚类精度和效率方面存在的不足,在原有算法的基础上进行了改进,提出了可变多阈值聚类特征树方法,实现了基于该方法的聚类分析器,最后将该算法应用于图像分割技术当中,验证算法的有效性。
-
关键词
簇
聚类特征
聚类特征树
B+树
条目
-
Keywords
Cluster,Clustering Feature,cf-tree,B+tree,Entry
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名一种基于CF树的k-medoids聚类算法
被引量:3
- 2
-
-
作者
曹丹阳
杨炳儒
李广原
刘英华
-
机构
北京科技大学信息工程学院
北方工业大学信息工程学院
-
出处
《计算机应用研究》
CSCD
北大核心
2011年第9期3260-3263,共4页
-
基金
北京市科技计划专项课题
国家自然科学基金资助项目(60875029
+1 种基金
51075423)
北京市属市管高等学校人才强教计划资助项目(PHR20100509)
-
文摘
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。
-
关键词
聚类
K-中心点
cf树
微簇
-
Keywords
clustering
k-medoids
cf-tree
micro-cluster
-
分类号
TP311.138
[自动化与计算机技术—计算机软件与理论]
TP301.6
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于Web日志挖掘的用户模式识别研究
- 3
-
-
作者
倪曼蒂
覃拥军
-
机构
湖南商务职业技术学院
中兴软件技术有限公司
-
出处
《现代计算机》
2013年第11期14-17,共4页
-
文摘
为提高聚类算法的准确性,通过先对数据集抽样,再对样本数据进行K-means聚类,选出聚类中心,然后为整个数据集中的每个簇单独设置一个阈值的方法对传统的BIRCH算法进行改进。实验表明,在同等条件下,改进后的算法相比传统的BIRCH算法精确度更高,耗时更少。
-
关键词
WEB挖掘
用户模式识别
聚类特征
聚类特征树
-
Keywords
Web Mining
Users Patterns Discovery
Clustering Feature
cf-tree
-
分类号
TP311.13
[自动化与计算机技术—计算机软件与理论]
-
-
题名基于重复热点数据的CF广播结构改进算法
被引量:1
- 4
-
-
作者
孙金津
朱玉全
陈耿
-
机构
江苏大学计算机科学与通信工程学院
南京审计学院信息科学学院
-
出处
《计算机应用研究》
CSCD
北大核心
2010年第12期4698-4700,4704,共4页
-
基金
江苏省"青蓝工程"
江苏省六大人才高峰项目(07-E-025)
+2 种基金
江苏省高校自然科学重大基金研究(08KJA520001)
国家中小企业创新基金资助项目(09C26213203797)
国家自然科学基金资助项目(70971067)
-
文摘
针对现有广播结构构建中对数据访问概率倾斜度考虑不足的问题,在CF索引树的基础上提出了一种基于数据倾斜度的广播构建算法。该算法充分考虑热点数据的请求,根据数据在CF索引树中所处位置的不同,在一个广播周期内重复广播热点数据及其对应的索引节点,尽量减少移动用户的访问时间。最后通过实验验证了改进后广播结构的有效性。
-
关键词
移动计算
数据广播
cf索引树
广播结构
-
Keywords
mobile computing
data broadcast
cf index tree
broadcasting structure
-
分类号
TP393
[自动化与计算机技术—计算机应用技术]
-
-
题名基于DVTD的移动用户出行模式识别研究
被引量:2
- 5
-
-
作者
詹益旺
胡斌杰
-
机构
华南理工大学电子信息学院
广州杰赛科技股份有限公司
-
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第7期72-76,共5页
-
基金
国家发改委移动互联网及第四代移动通信(TD-LTE)产业化专项基金资助项目(发改办高技[2014]2328号)
粤港关键领域重点突破基金资助项目(2011A011305001)
-
文摘
针对移动用户出行模式识别过于复杂的问题,提出一种基于密度与动态阈值的任意形状聚类挖掘算法。利用数据预处理技术提取移动用户在各路段的速度,通过MCFT树构造用户速度分类模型,采用DBSCAN方法进行核心子聚类合并,最终生成MCFT树任意形状的聚类结果,从而达到利用动态速度阈值有效识别用户出行模式的目的。实验结果表明,通过DVTD算法得到动态速度阈值识别用户出行模式具有较高的可行性,提高了用户出行识别的准确性。
-
关键词
DVTD算法
聚类特征树
簇
用户出行模式
动态速度阈值
-
Keywords
DVTD algorithm
Clustering Feature (cf) tree
cluster
user travel pattern
dynamic speed threshold
-
分类号
TP391.4
[自动化与计算机技术—计算机应用技术]
-
-
题名基于连通距离和连通强度的BIRCH改进算法
被引量:7
- 6
-
-
作者
樊仲欣
王兴
苗春生
-
机构
南京信息工程大学大气与环境实验教学中心
南京信大气象科技有限公司
-
出处
《计算机应用》
CSCD
北大核心
2019年第4期1027-1031,共5页
-
文摘
为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值,还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、 pendigits数据集上的实验结果表明,该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高,尤其在大数据集上比密度改进BIRCH准确率提高6个百分点,耗时降低61%。说明该算法能够适用于在线实时增量数据,可以识别非球形簇和体积不均匀簇,具有去噪功能,且时间和空间复杂度明显降低。
-
关键词
层次聚类
在线算法
BIRCH
聚类特征
聚类特征树
-
Keywords
hierarchical clustering
on-line algorithm
Balanced Iterative Reducing and Clustering using Hierarchies(BIRCH)
Cluster Feature(cf)
Cluster Feature tree(cf tree)
-
分类号
TP312
[自动化与计算机技术—计算机软件与理论]
-