期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
粗糙K-Modes聚类算法 被引量:5
1
作者 李仁侃 叶东毅 《计算机应用》 CSCD 北大核心 2011年第1期97-100,共4页
Michael K.Ng等人提出了新K-Modes聚类算法,它采用基于相对频率的启发式相异度度量方法,有效地提高了聚类精度,但不足的是在计算各类的属性分类值频率时假定类中样本对聚类的贡献相同。为了考虑类中样本对类中心的不同影响,提出一种粗糙... Michael K.Ng等人提出了新K-Modes聚类算法,它采用基于相对频率的启发式相异度度量方法,有效地提高了聚类精度,但不足的是在计算各类的属性分类值频率时假定类中样本对聚类的贡献相同。为了考虑类中样本对类中心的不同影响,提出一种粗糙K-Modes算法,通过粗糙集的上、下近似度量数据样本在类内的重要性程度,不仅可以获得比新K-Modes算法更好的聚类效果,而且可以在保证聚类效果的基础上降低白亮等人提出的基于粗糙集改进的K-Modes算法的计算复杂度。对几个UCI的数据集的测试实验结果显示出新算法的优良性能。 展开更多
关键词 聚类 kmodes算法 粗糙集 类中心 聚类精度
下载PDF
科研众包项目运行模式与平台类型划分研究 被引量:3
2
作者 曹嘉君 王曰芬 +1 位作者 恢光平 范圆圆 《情报理论与实践》 CSSCI 北大核心 2022年第5期165-172,共8页
[目的/意义]为了有效地推动知识交流与科技创新,探讨新兴的科研众包项目运行模式的构建、科研众包平台类型的划分与特点的解析。[方法/过程]文章从科研众包项目的需求及其支撑要素的视角,一方面,归纳科研众包项目参与主体,设计科研众包... [目的/意义]为了有效地推动知识交流与科技创新,探讨新兴的科研众包项目运行模式的构建、科研众包平台类型的划分与特点的解析。[方法/过程]文章从科研众包项目的需求及其支撑要素的视角,一方面,归纳科研众包项目参与主体,设计科研众包流程并解析知识流向,构建知识转移为核心的项目运作模式;另一方面,归纳平台的主要特征作为分类要素,单维度划分类型并进行属性间关联分析,同时,通过K-modes算法进行综合聚类,多维度划分平台类别。[结果/结论]研究结果表明科研众包运行模式中发包方和接包方之间存在知识双向多次转移的现象,依据系统结构和功能角度进行平台类型划分中主要以服务层面平台特征最为明显,自主专建型与非专项型关联紧密,嵌入式拓展型与专项领域型关联紧密;综合聚类划分平台为11个类别时效果最佳。 展开更多
关键词 科研众包 科研众包平台 分类体系 多元层次分析 k-modes聚类
原文传递
非独立同分布下的K-Modes算法
3
作者 周慧鑫 姜合 王艳梅 《计算机工程与设计》 北大核心 2023年第1期182-187,共6页
传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分... 传统的K-Modes算法中,初始聚类中心是随机选取的,聚类结果过分依赖初始聚类中心的选择,影响聚类效果。在很多K-Modes算法的研究中假设数据是独立同分布的,在现实的数据中,数据对象和属性之间是根据某些耦合关系彼此关联的,是非独立同分布的。针对这两方面问题,通过基于层次聚类进行预聚类的方法改进选取初始中心的方法,引入非独立同分布思想计算相异度量,进行实验验证。实验结果表明,通过改进初始中心的选取方法和相异度量的计算方法很好改进了K-Modes算法,提高了算法的聚类精度。 展开更多
关键词 k-modes算法 初始中心 独立同分布 非独立同分布 耦合关系 层次聚类 相异度度量
下载PDF
基于分类型矩阵对象数据的MD fuzzy k-modes聚类算法 被引量:10
4
作者 李顺勇 张苗苗 曹付元 《计算机研究与发展》 EI CSCD 北大核心 2019年第6期1325-1337,共13页
传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,... 传统的聚类算法一般是对单值属性数据进行聚类.但在许多实际应用中,每个对象通常被多个特征向量所描述.例如,顾客在购物时可能同时购买多个产品.由多个特征向量描述的对象称为矩阵对象,由矩阵对象构成的数据集称为矩阵对象数据集.目前,针对矩阵对象数据聚类算法的研究相对较少,还有很多问题有待解决.利用fuzzy k-modes算法的聚类过程,提出一种基于矩阵对象数据的matrix-object data fuzzy k-modes(MD fuzzy k-modes)聚类算法.该算法结合模糊集的概念引入模糊因子β,重新定义了矩阵对象间的相异性度量,并给出类中心的启发式更新算法.最后,在5个真实数据集上验证了MD fuzzy k-modes算法的有效性,并分析了模糊因子β与隶属度w之间的关系.大数据时代,利用MD fuzzy k-modes算法对多条记录进行聚类,能更易发现顾客的消费偏好,从而做出更有针对性的推荐. 展开更多
关键词 矩阵对象数据 MD FUZZY k-modes算法 相异性度量 类中心 聚类
下载PDF
符号数据最佳聚类个数的确定方法
5
作者 赵兴旺 梁吉业 曹付元 《广西师范大学学报(自然科学版)》 CAS 北大核心 2009年第3期130-133,共4页
在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出一... 在聚类分析中,如何选择恰当的聚类个数是一个非常复杂而又必须面对的问题。尽管针对数值型数据聚类个数的选择算法已经进行了广泛地研究,但如何确定符号型数据的聚类个数仍然是一个富有挑战性的问题。结合划分和层次聚类的思想,提出一种符号数据聚类个数的确定算法。在UC I数据集上的实验结果表明该方法是有效的。 展开更多
关键词 k-modes聚类算法 聚类个数 初始类中心 划分聚类 层次聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部