期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
一种基于数据流的软子空间聚类算法 被引量:31
1
作者 朱林 雷景生 +1 位作者 毕忠勤 杨杰 《软件学报》 EI CSCD 北大核心 2013年第11期2610-2627,共18页
针对高维数据的聚类研究表明,样本在不同数据簇往往与某些特定的数据特征子集相对应.因此,子空间聚类技术越来越受到关注.然而,现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究... 针对高维数据的聚类研究表明,样本在不同数据簇往往与某些特定的数据特征子集相对应.因此,子空间聚类技术越来越受到关注.然而,现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究中.为此,利用模糊可扩展聚类框架,与熵加权软子空间聚类算法相结合,提出了一种有效的熵加权流数据软子空间聚类算法——EWSSC(entropy-weighting streaming subspace clustering).该算法不仅保留了传统软子空间聚类算法的特性,而且利用了模糊可扩展聚类策略,将软子空间聚类算法应用于流数据的聚类分析中.实验结果表明,EWSSC算法对于高维数据流可以得到与批处理软子空间聚类方法近似一致的实验结果. 展开更多
关键词 子空间聚类 数据流聚类 可扩展聚类 模糊聚类 文本聚类
下载PDF
一种用于网站用户行为分析数据的可扩展协同聚类算法 被引量:5
2
作者 库波 晁学鹏 《科技通报》 北大核心 2013年第2期67-69,共3页
网站通常从用户中分析挖掘出其中隐含的规律,为其创造更多的价值。随着互联网的普及,互联网的用户成指数级增长给互联网传统的分析算法带来了极大地挑战。本文针对网站中存在的海量用户数据,设计了基于MapReduce分布式编程框架的协同聚... 网站通常从用户中分析挖掘出其中隐含的规律,为其创造更多的价值。随着互联网的普及,互联网的用户成指数级增长给互联网传统的分析算法带来了极大地挑战。本文针对网站中存在的海量用户数据,设计了基于MapReduce分布式编程框架的协同聚类算法。该算法是分布式并行地统计聚类信息,更加高效地分析处理用户数据,完成网站中的用户行为分析工作。实验表明,本文提出的算法不仅具有很高的加速比,而且具有很好的可扩展性。 展开更多
关键词 数据挖掘 可扩展 HADOOP 协同聚类 用户行为
下载PDF
面向超大规模数据的自适应谱聚类算法
3
作者 毕志臻 杨德刚 冯骥 《智能系统学报》 CSCD 北大核心 2023年第2期251-259,共9页
针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximate natural nearest neighbor based self-adaptive ultra-scalable spectral clustering algorithm, ... 针对超大规模数据聚类过程中人为设定邻域参数及计算量庞大等问题,提出了一种基于近似自然近邻的自适应超大规模谱聚类算法(approximate natural nearest neighbor based self-adaptive ultra-scalable spectral clustering algorithm, AN^(3)-SUSC)。该算法首先通过混合代表选取缩小数据规模,在此基础上利用近似自然近邻自适应地确定局部邻域参数并构建相似矩阵,最后运用二部图进行迁移分割将数据空间映射到原超大规模数据空间中并完成谱聚类分析。超大规模数据集实验结果表明,该算法对超大规模数据集聚类效果有所提升,并且降低计算规模同时具有较高的鲁棒性和较强的自适应性。 展开更多
关键词 数据聚类 超大规模 近似自然近邻 谱聚类 自然邻居 二部图 自适应 无参数
下载PDF
模糊加权流数据软子空间的聚类算法 被引量:1
4
作者 朱林 雷景生 +1 位作者 毕忠勤 徐菲菲 《上海电力学院学报》 CAS 2013年第6期553-557,共5页
现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结... 现有的软子空间聚类算法都是基于批处理技术的聚类算法,不能很好地应用于高维数据流或大规模数据的聚类研究.利用模糊可扩展聚类框架,与模糊加权软子空间聚类算法相结合,提出了一种有效的模糊加权流数据软子空间聚类算法(FWSSC).实验结果表明,FWSSC对于高维流数据可以得到与批处理软子空间聚类方法近似一致的实验结果. 展开更多
关键词 子空间聚类 数据流聚类 可扩展聚类 模糊聚类
下载PDF
Traffic Engineering in Dynamic Hybrid Segment Routing Networks 被引量:2
5
作者 Yingya Guo Kai Huang +2 位作者 Cheng Hu Jiangyuan Yao Siyu Zhou 《Computers, Materials & Continua》 SCIE EI 2021年第7期655-670,共16页
The emergence of Segment Routing(SR)provides a novel routing paradigm that uses a routing technique called source packet routing.In SR architecture,the paths that the packets choose to route on are indicated at the in... The emergence of Segment Routing(SR)provides a novel routing paradigm that uses a routing technique called source packet routing.In SR architecture,the paths that the packets choose to route on are indicated at the ingress router.Compared with shortest-path-based routing in traditional distributed routing protocols,SR can realize a flexible routing by implementing an arbitrary flow splitting at the ingress router.Despite the advantages of SR,it may be difficult to update the existing IP network to a full SR deployed network,for economical and technical reasons.Updating partial of the traditional IP network to the SR network,thus forming a hybrid SR network,is a preferable choice.For the traffic is dynamically changing in a daily time,in this paper,we propose a Weight Adjustment algorithm WASAR to optimize routing in a dynamic hybrid SR network.WASAR algorithm can be divided into three steps:firstly,representative Traffic Matrices(TMs)and the expected TM are obtained from the historical TMs through ultrascalable spectral clustering algorithm.Secondly,given the network topology,the initial network weight setting and the expected TM,we can realize the link weight optimization and SR node deployment optimization through a Deep Reinforcement Learning(DRL)algorithm.Thirdly,we optimize the flow splitting ratios of SR nodes in a centralized online manner under dynamic traffic demands,in order to improve the network performance.In the evaluation,we exploit historical TMs to test the performance of the obtained routing configuration in WASAR.The extensive experimental results validate that our proposed WASAR algorithm has superior performance in reducing Maximum Link Utilization(MLU)under the dynamic traffic. 展开更多
关键词 Traffic engineering routing optimization segment routing deep reinforcement learning ultra-scalable spectral clustering
下载PDF
面向海量病毒样本家族聚类方法的研究
6
作者 赵跃华 林聚伟 《计算机工程与应用》 CSCD 2014年第18期118-121,共4页
计算机反病毒厂商每天接收成千上万的病毒样本,如何快速有效地将这些海量样本家族化是一个亟待解决的问题。提出了一种可伸缩性的聚类方法,面对输入海量的病毒样本向量化特征集,使用局部敏感哈希索引技术进行初次快速聚类,使用扩展K均... 计算机反病毒厂商每天接收成千上万的病毒样本,如何快速有效地将这些海量样本家族化是一个亟待解决的问题。提出了一种可伸缩性的聚类方法,面对输入海量的病毒样本向量化特征集,使用局部敏感哈希索引技术进行初次快速聚类,使用扩展K均值算法进行二次细致聚类。实验表明该聚类方法在有限牺牲准确度的情况下,大为提高了病毒聚类的时间效率。 展开更多
关键词 病毒家族 可伸缩性聚类 局部敏感哈希 扩展K均值
下载PDF
一种基于半监督的大规模数据集聚类算法 被引量:1
7
作者 申彦 宋顺林 朱玉全 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2011年第4期372-382,共11页
待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚... 待挖掘数据集规模的不断增长,以往的聚类算法由于需要多次扫描原始数据集而不再适用,现阶段,一遍扫描原始数据集即完成聚类的算法成为了首要的研究目标.但是,现有针对大规模数据集的算法容易受到初始化参数以及原始数据集分布的影响,聚类结果质量不高,并且也不稳定.对此,吸收半监督聚类的思想,提出了基于标记集的半监督一遍扫描K均值算法,该算法利用驻留主存的标记集指导聚类过程,使得聚类效率以及聚类结果的质量得到了进一步的提高.在人工生成数据集以及1998KDD数据集上验证了该算法的有效性. 展开更多
关键词 大规模数据集聚类 半监督聚类 聚类数据压缩 数据挖掘 K均值聚类
下载PDF
Performance Analysis of an Enhanced Load Balancing Scheme for Wireless Sensor Networks
8
作者 Adeniran Oluwaranti Dauda Ayanda 《Wireless Sensor Network》 2011年第8期275-282,共8页
Research interest in sensor networks routing largely considers minimization of energy consumption as a major performance criterion to provide maximum sensors network lifetime. When considering energy conservation, rou... Research interest in sensor networks routing largely considers minimization of energy consumption as a major performance criterion to provide maximum sensors network lifetime. When considering energy conservation, routing protocols should also be designed to achieve fault tolerance in communications. Moreover, due to dynamic topology and random deployment, incorporating reliability into protocols for WSNs is very important. Hence, we propose an improved scalable clustering-based load balancing scheme (SCLB) in this paper. In SCLB scheme, scalability is achieved by dividing the network into overlapping multihop clusters each with its own cluster head node. Simulation results show that the proposed scheme achieves longer network lifetime with desirable reliability at the initial state compare with the existing multihop load balancing approach. 展开更多
关键词 Wireless Sensor Networks Energy CONSUMPTION scalable clustering-Based Load Balancing SCHEME Reliability
下载PDF
一种基于语义距离的关键词获取方法
9
作者 石爱萍 《计算机与现代化》 2010年第12期18-20,24,共4页
关键词作为文本的概要信息,是信息检索,特别是针对海量Web信息处理的基础。由于手工分配关键词是一项耗时性的工作,因此不需要训练集的非监督关键词获取方法研究受到了关注。本文以语义聚类为模型,以词在给定语境和词义本身两种语义距... 关键词作为文本的概要信息,是信息检索,特别是针对海量Web信息处理的基础。由于手工分配关键词是一项耗时性的工作,因此不需要训练集的非监督关键词获取方法研究受到了关注。本文以语义聚类为模型,以词在给定语境和词义本身两种语义距离的计算为基础,给出一种关键词获取算法。实验结果表明,该算法得到较好的查准率。 展开更多
关键词 词共现 聚类 语义距离 关键词获取
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部