期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
聚类有效性研究综述 被引量:110
1
作者 周开乐 杨善林 +1 位作者 丁帅 罗贺 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2014年第9期2417-2431,共15页
聚类是一个无监督学习过程,因此确定最佳聚类数是一项困难的工作.聚类有效性研究是通过建立聚类有效性指标,评价聚类质量并确定最佳聚类数的过程.首先,介绍了聚类的数学描述和聚类有效性指标的分类;然后,基于指标构成成分的不同,分别评... 聚类是一个无监督学习过程,因此确定最佳聚类数是一项困难的工作.聚类有效性研究是通过建立聚类有效性指标,评价聚类质量并确定最佳聚类数的过程.首先,介绍了聚类的数学描述和聚类有效性指标的分类;然后,基于指标构成成分的不同,分别评述了12个仅考虑数据集几何结构信息的聚类有效性指标、6个仅考虑隶属度的聚类有效性指标以及9个同时考虑数据集几何结构信息和隶属度的聚类有效性指标,分析了不同类型指标的研究现状;接着,简要总结了外部性指标和稳定性指标等其他聚类有效性指标的研究现状;最后,总结并展望了聚类有效性研究面临的挑战和发展方向. 展开更多
关键词 聚类 聚类有效性 聚类有效性指标 最佳聚类数
原文传递
洪水聚类有效性分析 被引量:13
2
作者 卢正波 侯召成 《南水北调与水利科技》 CAS CSCD 2007年第2期87-90,共4页
在聚类分析中,聚类数是一个非常重要的参数,最佳聚类数的确定问题是聚类分析研究的热点之一。在模糊聚类迭代模型的基础上,首先提出了基于类间相关系数的聚类有效性指标确定最佳聚类数,并给出了最佳聚类数的确定步骤。随后以IRIS和Rusp... 在聚类分析中,聚类数是一个非常重要的参数,最佳聚类数的确定问题是聚类分析研究的热点之一。在模糊聚类迭代模型的基础上,首先提出了基于类间相关系数的聚类有效性指标确定最佳聚类数,并给出了最佳聚类数的确定步骤。随后以IRIS和Ruspini数据集作为分析样本验证了所提聚类有效性指标的有效性。以双牌水库的45场典型洪水过程和碧流河水库的13场典型洪水过程为例,重点进行了洪水聚类分析,进一步验证了所提公式的有效性。碧流河水库洪水聚类,遵循了成因分析和聚类分析相结合的原则,其目的是确定各类主要天气系统的典型代表过程,以便进行水库防洪分类预报调度设计。 展开更多
关键词 模糊聚类 洪水聚类 聚类有效性分析 最佳聚类数
下载PDF
一种改进的简化均值粒子群K-means聚类算法 被引量:11
3
作者 靳雁霞 齐欣 +1 位作者 张晋瑞 程琦甫 《微电子学与计算机》 北大核心 2020年第5期69-74,共6页
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局... 针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果. 展开更多
关键词 粒子群优化算法 简化粒子群 邻域最优粒子 K-MEANS聚类 聚类数 初始聚类中心
下载PDF
基于层次划分的密度优化聚类算法 被引量:7
4
作者 逄琳 刘方爱 《计算机应用》 CSCD 北大核心 2016年第6期1634-1638,共5页
针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集... 针对传统的聚类算法对数据集反复聚类,且在大型数据集上计算效率欠佳的问题,提出一种基于层次划分的最佳聚类数和初始聚类中心确定算法——基于层次划分密度的聚类优化(CODHD)。该算法基于层次划分,对计算过程进行研究,不需要对数据集进行反复聚类。首先,扫描数据集获得所有聚类特征的统计值;其次,自底向上地生成不同层次的数据划分,计算每个划分数据点的密度,将最大密度点定为中心点,计算中心点距离更高密度点的最小距离,以中心点密度与最小距离乘积之和的平均值为有效性指标,增量地构建一条关于不同层次划分的聚类质量曲线;最后,根据曲线的极值点对应的划分估计最佳聚类数和初始聚类中心。实验结果表明,所提CODHD算法与预处理阶段的聚类优化(COPS)算法相比,聚类准确度提高了30%,聚类算法效率至少提高14.24%。所提算法具有较强的可行性和实用性。 展开更多
关键词 聚类算法 层次划分 最佳聚类数 初始聚类中心 聚类有效性指标
下载PDF
The upper bound of the optimal number of clusters in fuzzy clustering 被引量:6
5
作者 于剑 程乾生 《Science in China(Series F)》 2001年第2期119-125,共7页
The upper bound of the optimal number of clusters in clustering algorithm is studied in this paper. A new method is proposed to solve this issue. This method shows that the rule cmax≤N^(1/N), which is popular in curr... The upper bound of the optimal number of clusters in clustering algorithm is studied in this paper. A new method is proposed to solve this issue. This method shows that the rule cmax≤N^(1/N), which is popular in current papers, is reasonable in some sense. The above conclusion is tested and analyzed by some typical examples in the literature, which demonstrates the validity of the new method. 展开更多
关键词 clustering algorithm cluster validity the optimal number of clusters UNCERTAINTY fuzzy clustering.
原文传递
一种无线传感器网络的簇数目优化方法 被引量:6
6
作者 郝晓辰 房艳 +2 位作者 刘浩然 窦晶晶 刘彬 《传感技术学报》 CAS CSCD 北大核心 2008年第8期1432-1436,共5页
针对LEACH算法中无线传感器网络分簇数目的确定问题,提出了一种节点服从泊松分布的情况下最优簇数目的计算方法。该方法利用节点的通信能耗模型,从能耗最小的角度给出了网络的最优簇数目,并证明最优簇数目与监测区域面积、节点数目和泊... 针对LEACH算法中无线传感器网络分簇数目的确定问题,提出了一种节点服从泊松分布的情况下最优簇数目的计算方法。该方法利用节点的通信能耗模型,从能耗最小的角度给出了网络的最优簇数目,并证明最优簇数目与监测区域面积、节点数目和泊松分布强度有关,而不是LEACH算法中的固定值,从而为优化网络簇头数提供了一定的依据。仿真表明,在该方法上设计的LEACH算法减少了网络的总能量消耗,有效延长了网络生命周期。 展开更多
关键词 无线传感器网络 最优簇数目 能耗模型 网络生命周期
下载PDF
关于马氏距离模糊聚类的有效性指标研究 被引量:6
7
作者 祖志文 李秦 《陕西理工大学学报(自然科学版)》 2018年第2期33-38,共6页
为了研究基于马氏距离模糊聚类算法的有效性,首先对比分析了基于数据集模糊划分与几何结构的模糊聚类有效性指标,确定了将紧致度、分离度与清晰度结合的有效性研究方向,然后针对基于马氏距离的模糊聚类提出新的度量标准,构造有效性指标... 为了研究基于马氏距离模糊聚类算法的有效性,首先对比分析了基于数据集模糊划分与几何结构的模糊聚类有效性指标,确定了将紧致度、分离度与清晰度结合的有效性研究方向,然后针对基于马氏距离的模糊聚类提出新的度量标准,构造有效性指标,最后结合算法在真实数据集上进行实验,结果表明新指标能准确识别马氏距离模糊聚类算法在多维数据上的最佳聚类数目。 展开更多
关键词 马氏距离 模糊聚类 有效性指标 最佳聚类数
下载PDF
Optimized air-ground data fusion method for mine slope modeling
8
作者 LIU Dan HUANG Man +4 位作者 TAO Zhigang HONG Chenjie WU Yuewei FAN En YANG Fei 《Journal of Mountain Science》 SCIE CSCD 2024年第6期2130-2139,共10页
Refined 3D modeling of mine slopes is pivotal for precise prediction of geological hazards.Aiming at the inadequacy of existing single modeling methods in comprehensively representing the overall and localized charact... Refined 3D modeling of mine slopes is pivotal for precise prediction of geological hazards.Aiming at the inadequacy of existing single modeling methods in comprehensively representing the overall and localized characteristics of mining slopes,this study introduces a new method that fuses model data from Unmanned aerial vehicles(UAV)tilt photogrammetry and 3D laser scanning through a data alignment algorithm based on control points.First,the mini batch K-Medoids algorithm is utilized to cluster the point cloud data from ground 3D laser scanning.Then,the elbow rule is applied to determine the optimal cluster number(K0),and the feature points are extracted.Next,the nearest neighbor point algorithm is employed to match the feature points obtained from UAV tilt photogrammetry,and the internal point coordinates are adjusted through the distanceweighted average to construct a 3D model.Finally,by integrating an engineering case study,the K0 value is determined to be 8,with a matching accuracy between the two model datasets ranging from 0.0669 to 1.0373 mm.Therefore,compared with the modeling method utilizing K-medoids clustering algorithm,the new modeling method significantly enhances the computational efficiency,the accuracy of selecting the optimal number of feature points in 3D laser scanning,and the precision of the 3D model derived from UAV tilt photogrammetry.This method provides a research foundation for constructing mine slope model. 展开更多
关键词 Air-ground data fusion method Mini batch K-Medoids algorithm Ebow rule optimal cluster number 3D laser scanning UAV tilt photogrammetry
下载PDF
基于改进磷虾群算法的K-means算法 被引量:4
9
作者 刘唐 周炜 +1 位作者 李志鹏 权文 《探测与控制学报》 CSCD 北大核心 2019年第1期76-81,共6页
针对磷虾群算法易陷入局部最优、搜索能力弱及K-means算法易受初始聚类中心选择影响等问题,提出一种基于改进磷虾群算法的K-means算法。该算法通过混沌初始化、动态分群、精英引领和随机变异等策略改进磷虾群算法,并引入最佳聚类数自适... 针对磷虾群算法易陷入局部最优、搜索能力弱及K-means算法易受初始聚类中心选择影响等问题,提出一种基于改进磷虾群算法的K-means算法。该算法通过混沌初始化、动态分群、精英引领和随机变异等策略改进磷虾群算法,并引入最佳聚类数自适应机制,提高了算法的综合寻优能力。实验通过6种基准函数检验了改进磷虾群算法的有效性,用UCI机器学习数据集及人造数据集测试验证了基于改进磷虾群算法的K-means算法的性能。验证结果表明,改进磷虾群算法在保证较快收敛速度的基础上提升了全局寻优能力,与其他算法相比,该算法各方面性能显著提升。 展开更多
关键词 磷虾群算法 聚类算法 精英引领 最佳聚类数 动态分群
下载PDF
新的模糊聚类有效性指标 被引量:4
10
作者 郑宏亮 徐本强 +1 位作者 赵晓慧 邹丽 《计算机应用》 CSCD 北大核心 2014年第8期2166-2169,共4页
在经典的模糊C均值(FCM)算法中,聚类数需要预先给出,否则算法无法工作,这在一定程度上限制了FCM算法的应用范围。针对FCM算法中聚类数需要预先设定问题,提出了一种新的模糊聚类有效性指标。首先,通过运行FCM算法得到隶属度矩阵;然后,通... 在经典的模糊C均值(FCM)算法中,聚类数需要预先给出,否则算法无法工作,这在一定程度上限制了FCM算法的应用范围。针对FCM算法中聚类数需要预先设定问题,提出了一种新的模糊聚类有效性指标。首先,通过运行FCM算法得到隶属度矩阵;然后,通过隶属度矩阵计算类内紧密性和类间重叠性;最后,利用类内的紧密性和类间的重叠性定义了一个新的聚类有效性指标。该指标克服了FCM算法中类数需要预先设定的缺点,利用该指标可以发现最符合数据自然分布的类的数目。通过对人工数据集和实际数据集的测试表明,对于模糊因子取1.8,2.0和2.2三个不同的常用值,均能发现最优聚类数。 展开更多
关键词 模糊聚类 模糊C均值算法 有效性指标 模糊因子 最佳聚类数
下载PDF
复杂生物数据集的聚类数自动确定方法 被引量:3
11
作者 高翠芳 吴小俊 《生物信息学》 2010年第4期295-298,共4页
聚类数目是影响聚类效果的关键参数,通常需要人工确定,对于较难获得这一先验知识的复杂生物数据集,聚类分析会因此受到限制。针对这一问题,文章提出一种自动确定最佳聚类数目的方法,该方法利用体现"类内紧凑类间离散"思想的... 聚类数目是影响聚类效果的关键参数,通常需要人工确定,对于较难获得这一先验知识的复杂生物数据集,聚类分析会因此受到限制。针对这一问题,文章提出一种自动确定最佳聚类数目的方法,该方法利用体现"类内紧凑类间离散"思想的优化聚类算法来执行主要计算,结合目标函数二阶差分的判定准则,通过聚类算法的自学习来确定最佳聚类数。实验结果显示,该方法能在复杂数据集上自动得到合理的聚类数目。 展开更多
关键词 无监督聚类 模糊散度矩阵 二阶差分 最佳聚类数目
下载PDF
基于模糊控制的环形WSN多跳分簇路由算法 被引量:2
12
作者 张雁东 赵宏伟 +1 位作者 王出航 杨兴旺 《吉林大学学报(信息科学版)》 CAS 2020年第4期467-473,共7页
为解决环形无线传感器网络能量空洞和能量最小问题,提出一种基于模糊控制的分簇路由算法FCRA(Fuzzy logic control based Clustering Routing Algorithm)。首先将网络分为宽度相等的环,以每环能耗最小为目标函数,计算出各环的最优簇数... 为解决环形无线传感器网络能量空洞和能量最小问题,提出一种基于模糊控制的分簇路由算法FCRA(Fuzzy logic control based Clustering Routing Algorithm)。首先将网络分为宽度相等的环,以每环能耗最小为目标函数,计算出各环的最优簇数。然后设计簇头选举模糊控制器,其输入为节点剩余能量和到基站距离,输出为节点成为簇头概率。最后,采用簇间多跳模式进行数据传输,基于节点剩余能量、下一跳距离以及到基站跳数确定每条传输路径的权重函数,获得最优下一跳中继节点。仿真结果表明FCRA能有效减小网络能耗、延长网络生命周期。 展开更多
关键词 环形无线传感器网络 模糊控制 最优簇数 多跳路由
下载PDF
突发自然灾害聚类准则函数 被引量:1
13
作者 李柏年 张孔生 《衡水学院学报》 2011年第4期106-109,共4页
针对谱系聚类的有效性,提出了一个新的聚类准则用于汶川地震灾害评估,并选用经典的Iris花蕾数据和Wine葡萄酒数据与流行的模糊C均值聚类准则比较,结果表明新准则计算简单且更符合实际情况.
关键词 谱系聚类 最佳聚类数 模糊C均值聚类
下载PDF
确定最佳聚类数的二阶差分统计法 被引量:1
14
作者 崔建斌 姬安召 张科 《安徽大学学报(自然科学版)》 CAS 北大核心 2017年第2期61-67,共7页
多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统... 多元统计数据的聚类是分析数据的一类非常重要方法,但是如何确定最佳聚类数往往是比较困难的.针对分析多元统计数据中应用最广泛的方法之一——K均值聚类方法,提出了一种新的二阶差分统计确定最佳聚类数的方法,并将其与CH统计法、Gap统计法进行了对比.实证分析表明,论文所提方法更为简单而且有效. 展开更多
关键词 二阶差分 聚类 最佳聚类数 仿真实验
下载PDF
基于均匀抽样的二阶差分聚类数确定方法 被引量:1
15
作者 陈艳 陈光 +1 位作者 易叶青 刘强 《计算机与现代化》 2017年第10期49-52,65,共5页
目标函数二阶差分方法利用目标函数值随类别数的梯度变化作为判定准则,直接利用目标函数值与聚类数的关系,实现在不同数据集上自动得到正确的聚类数,但计算最佳聚类数会占用一定时间。当样本总数较大时,采用该方法得到最佳聚类数计算量... 目标函数二阶差分方法利用目标函数值随类别数的梯度变化作为判定准则,直接利用目标函数值与聚类数的关系,实现在不同数据集上自动得到正确的聚类数,但计算最佳聚类数会占用一定时间。当样本总数较大时,采用该方法得到最佳聚类数计算量非常大。针对此问题,本文提出基于均匀抽样的二阶差分聚类数确定方法,首先采用改进的均匀抽样设计,然后在所得到的数据子集上进行二阶差分设计。实验结果表明,该方法在减少计算量的同时达到了期望的正确判断。 展开更多
关键词 二阶差分 最佳聚类数 均匀抽样设计
下载PDF
基于机会信号的区块模型的能效最优簇数的研究
16
作者 刘东 熊召新 《现代电子技术》 北大核心 2018年第19期19-22,26,共5页
依据无线传感网络(WSNs)中WiFi、声或可见光的机会信号,提出基于最优簇数的区块模型(CML)。区块模型为衰落模型,反映机会信号随传播距离的衰减变化。为了减少总体能耗,利用区块模型的泰勒级数展开的不同阶次计算最优簇数。最后利用移动... 依据无线传感网络(WSNs)中WiFi、声或可见光的机会信号,提出基于最优簇数的区块模型(CML)。区块模型为衰落模型,反映机会信号随传播距离的衰减变化。为了减少总体能耗,利用区块模型的泰勒级数展开的不同阶次计算最优簇数。最后利用移动手机、无线接入点、声和光信号建立真实的实验平台,分析最优簇数。实验数据表明,相比Exponential模型和对数Log模型,CML的能耗分别下降约6%和8%。此外,相比于WiFi和声信号,可见光信号的能效提高近12%。 展开更多
关键词 无线传感网络 能效 机会信号 区块模型 最优簇数
下载PDF
一种新的模糊聚类有效性指标
17
作者 梁鲜 曲福恒 +1 位作者 才华 杨勇 《微型机与应用》 2015年第8期74-75,79,共3页
针对模糊C均值(FCM)算法聚类数需要预先设定的问题,提出了一种新的模糊聚类有效性指标。首先,计算簇中每个属性的方差,给方差较小的属性赋予较大的权值,给方差较大的属性赋予较小的权值,得到一种基于属性加权的FCM算法;然后,根据FCM改... 针对模糊C均值(FCM)算法聚类数需要预先设定的问题,提出了一种新的模糊聚类有效性指标。首先,计算簇中每个属性的方差,给方差较小的属性赋予较大的权值,给方差较大的属性赋予较小的权值,得到一种基于属性加权的FCM算法;然后,根据FCM改进算法得到的隶属度矩阵计算类内紧致性和类间分离性;最后,利用类内紧致性和类间分离性定义一个新的聚类有效性指标。实验结果表明,该指标可以找到符合数据自然分布的类的数目。基于属性加权的FCM算法可以识别不同属性的重要程度,增加聚类结果的准确率,使用FCM改进算法得到的隶属度矩阵定义的有效性指标,能够发现正确的聚类个数,实现聚类无监督的学习过程。 展开更多
关键词 模糊聚类 模糊C均值算法 有效性指标 最佳聚类数
下载PDF
基于二分K-means的无线传感器网络分簇方法 被引量:12
18
作者 张本宏 江贺训 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2020年第1期39-44,123,共7页
好的分簇方法可以通过有效提高网络能量利用率均衡网络负载延长网络生命周期,文章提出一种基于二分K-means的均匀分簇算法(uniform clustering optimization algorithm,UCOA)。该算法首先基于对网络能耗的理论分析确定网络最优簇头数目... 好的分簇方法可以通过有效提高网络能量利用率均衡网络负载延长网络生命周期,文章提出一种基于二分K-means的均匀分簇算法(uniform clustering optimization algorithm,UCOA)。该算法首先基于对网络能耗的理论分析确定网络最优簇头数目,然后基于最优簇头数目利用二分K-means算法对整个网络均匀分簇,加入节点剩余能量和距离因子改进簇头选举阈值公式,并且在簇头与基站通信时采用单跳和多跳相结合的数据传输方式。仿真实验表明UCOA分簇算法能有效提高节点耗能均衡性,延长网络生存时间。 展开更多
关键词 无线传感网络(WSN) 最优簇头数 二分K-means 均匀分簇
下载PDF
无线传感器网络LEACH路由协议的研究 被引量:5
19
作者 王琳 乔礼惠 《科学技术与工程》 2010年第17期4278-4282,共5页
对于无线传感器网络(WSN)来说,网络层协议负责路由发现和维护,是无线传感器网络的重要因素,网络层路由协议的好坏直接影响到整个网络的性能。LEACH路由协议在众多无线传感器网络协议中有一定优势,对LEACH低功耗自适应分簇路由协议进行研... 对于无线传感器网络(WSN)来说,网络层协议负责路由发现和维护,是无线传感器网络的重要因素,网络层路由协议的好坏直接影响到整个网络的性能。LEACH路由协议在众多无线传感器网络协议中有一定优势,对LEACH低功耗自适应分簇路由协议进行研究,通过计算仿真,确定LEACH协议中最优簇数,达到优化网络性能的目的。 展开更多
关键词 无线传感器网络 LEACH协议 低功耗 最优簇数
下载PDF
基于检索日志的检索词推荐研究 被引量:4
20
作者 边鹏 苏玉召 《图书情报工作》 CSSCI 北大核心 2012年第9期31-36,41,共7页
为了满足检索用户对推荐服务日益迫切的需求,结合检索词推荐需求研究推荐理论。基于三种典型推荐方法:基于内容的过滤、基于规则的过滤和基于协作的过滤,提出一种检索词的混合推荐方法,并基于检索日志构建一种"脱机预处理和挖掘、... 为了满足检索用户对推荐服务日益迫切的需求,结合检索词推荐需求研究推荐理论。基于三种典型推荐方法:基于内容的过滤、基于规则的过滤和基于协作的过滤,提出一种检索词的混合推荐方法,并基于检索日志构建一种"脱机预处理和挖掘、联机推荐"的检索词推荐模型。最后,在NSTL嵌入式系统上进行实证研究。基于检索日志数据,以简单检索方式下的检索词推荐为突破口,设计一套原型系统,验证检索词的推荐效果并在原型系统上检验一种改进的BWP方法的效果。 展开更多
关键词 WEB日志挖掘 推荐系统 个性化 最佳聚类数
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部