期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
多阈值BIRCH聚类算法及其应用 被引量:17
1
作者 邵峰晶 张斌 于忠清 《计算机工程与应用》 CSCD 北大核心 2004年第12期174-176,195,共4页
BIRCH算法是针对大规模数据集的聚类算法。文章针对该算法在聚类精度和效率方面存在的不足,在原有算法的基础上进行了改进,提出了可变多阈值聚类特征树方法,实现了基于该方法的聚类分析器,最后将该算法应用于图像分割技术当中,验证算法... BIRCH算法是针对大规模数据集的聚类算法。文章针对该算法在聚类精度和效率方面存在的不足,在原有算法的基础上进行了改进,提出了可变多阈值聚类特征树方法,实现了基于该方法的聚类分析器,最后将该算法应用于图像分割技术当中,验证算法的有效性。 展开更多
关键词 聚类特征 聚类特征树 B+树 条目
下载PDF
一种基于CF树的k-medoids聚类算法 被引量:3
2
作者 曹丹阳 杨炳儒 +1 位作者 李广原 刘英华 《计算机应用研究》 CSCD 北大核心 2011年第9期3260-3263,共4页
当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,... 当存在噪声和离群点时,k-medoids算法具有较好的鲁棒性,但是对于大数据集,算法的计算代价比较高。CF树是Birch算法中常用的一种结构,对于大数据集的聚类有较好的可伸缩性,但是对于非球形的数据,聚类结果较差。因此,在两种算法的基础上,提出一种基于CF树的k-medoids算法,先用数据集构建CF树,形成微簇,改进了欧式距离计算式,最后使用k-medoids算法对微簇进行聚类。当数据点较多时,改进算法比k-medoids算法运行速度快了近2倍。实验表明,改进算法具有较高的性能和可伸缩性。 展开更多
关键词 聚类 K-中心点 cf 微簇
下载PDF
基于Web日志挖掘的用户模式识别研究
3
作者 倪曼蒂 覃拥军 《现代计算机》 2013年第11期14-17,共4页
为提高聚类算法的准确性,通过先对数据集抽样,再对样本数据进行K-means聚类,选出聚类中心,然后为整个数据集中的每个簇单独设置一个阈值的方法对传统的BIRCH算法进行改进。实验表明,在同等条件下,改进后的算法相比传统的BIRCH算法精确... 为提高聚类算法的准确性,通过先对数据集抽样,再对样本数据进行K-means聚类,选出聚类中心,然后为整个数据集中的每个簇单独设置一个阈值的方法对传统的BIRCH算法进行改进。实验表明,在同等条件下,改进后的算法相比传统的BIRCH算法精确度更高,耗时更少。 展开更多
关键词 WEB挖掘 用户模式识别 聚类特征 聚类特征树
下载PDF
基于重复热点数据的CF广播结构改进算法 被引量:1
4
作者 孙金津 朱玉全 陈耿 《计算机应用研究》 CSCD 北大核心 2010年第12期4698-4700,4704,共4页
针对现有广播结构构建中对数据访问概率倾斜度考虑不足的问题,在CF索引树的基础上提出了一种基于数据倾斜度的广播构建算法。该算法充分考虑热点数据的请求,根据数据在CF索引树中所处位置的不同,在一个广播周期内重复广播热点数据及其... 针对现有广播结构构建中对数据访问概率倾斜度考虑不足的问题,在CF索引树的基础上提出了一种基于数据倾斜度的广播构建算法。该算法充分考虑热点数据的请求,根据数据在CF索引树中所处位置的不同,在一个广播周期内重复广播热点数据及其对应的索引节点,尽量减少移动用户的访问时间。最后通过实验验证了改进后广播结构的有效性。 展开更多
关键词 移动计算 数据广播 cf索引树 广播结构
下载PDF
基于DVTD的移动用户出行模式识别研究 被引量:2
5
作者 詹益旺 胡斌杰 《计算机工程》 CAS CSCD 北大核心 2016年第7期72-76,共5页
针对移动用户出行模式识别过于复杂的问题,提出一种基于密度与动态阈值的任意形状聚类挖掘算法。利用数据预处理技术提取移动用户在各路段的速度,通过MCFT树构造用户速度分类模型,采用DBSCAN方法进行核心子聚类合并,最终生成MCFT树任意... 针对移动用户出行模式识别过于复杂的问题,提出一种基于密度与动态阈值的任意形状聚类挖掘算法。利用数据预处理技术提取移动用户在各路段的速度,通过MCFT树构造用户速度分类模型,采用DBSCAN方法进行核心子聚类合并,最终生成MCFT树任意形状的聚类结果,从而达到利用动态速度阈值有效识别用户出行模式的目的。实验结果表明,通过DVTD算法得到动态速度阈值识别用户出行模式具有较高的可行性,提高了用户出行识别的准确性。 展开更多
关键词 DVTD算法 聚类特征树 用户出行模式 动态速度阈值
下载PDF
基于连通距离和连通强度的BIRCH改进算法 被引量:7
6
作者 樊仲欣 王兴 苗春生 《计算机应用》 CSCD 北大核心 2019年第4期1027-1031,共5页
为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个... 为解决利用层次方法的平衡迭代规约和聚类(BIRCH)算法聚类结果依赖于数据对象的添加顺序,且对非球状的簇聚类效果不好以及受簇直径阈值的限制每个簇只能包含数量相近的数据对象的问题,提出一种改进的BIRCH算法。该算法用描述数据对象个体间连通性的连通距离和连通强度阈值替代簇直径阈值,还将簇合并的步骤加入到聚类特征树的生成过程中。在自定义及iris、wine、 pendigits数据集上的实验结果表明,该算法比多阈值BIRCH、密度改进BIRCH等现有改进算法的聚类准确率更高,尤其在大数据集上比密度改进BIRCH准确率提高6个百分点,耗时降低61%。说明该算法能够适用于在线实时增量数据,可以识别非球形簇和体积不均匀簇,具有去噪功能,且时间和空间复杂度明显降低。 展开更多
关键词 层次聚类 在线算法 BIRCH 聚类特征 聚类特征树
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部