期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
3
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于K-prototypes的混合属性数据聚类算法改进
1
作者
倪丹
李泽文
《科技创新与应用》
2024年第28期31-34,38,共5页
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或...
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或者在计算时没有进行任何改变,很可能提高分类数据在聚类中的影响,并且分类型数据并未进一步地细分,不能满足不同要求的混合属性聚类。该文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进K-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。
展开更多
关键词
K-prototypes算法
混合属性
类型数据
相异
度
系数
加权属性
下载PDF
职称材料
基于簇内簇间相异度的k-modes算法
被引量:
1
2
作者
贾子琪
宋玲
《计算机工程与设计》
北大核心
2021年第9期2492-2500,共9页
为提高k-modes算法的精度并解决初始簇中心选择问题,提出一种基于簇内簇间相异度的k-modes算法(IKMCA)。基于簇内簇间相似性对相异度系数进行改进,给出初始簇中心自主选择的具体方法。提出的簇内簇间相异度系数考虑特征值本身的相异性...
为提高k-modes算法的精度并解决初始簇中心选择问题,提出一种基于簇内簇间相异度的k-modes算法(IKMCA)。基于簇内簇间相似性对相异度系数进行改进,给出初始簇中心自主选择的具体方法。提出的簇内簇间相异度系数考虑特征值本身的相异性与其它相关特征对它们的区分性。提出的初始簇中心自主选择方法可以自动确定聚类个数和初始簇中心位置。实验结果表明,提出算法在聚类精度、纯度、召回率上均优于经典k-modes算法及其变体算法。
展开更多
关键词
k模式算法
簇内簇间相似性
分类型数据
频率
相异
度
系数
下载PDF
职称材料
一种面向混合型数据聚类的k-prototypes聚类算法
被引量:
7
3
作者
贾子琪
宋玲
《小型微型计算机系统》
CSCD
北大核心
2020年第9期1845-1852,共8页
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高...
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性.
展开更多
关键词
k-prototypes
混合型
相异
度
系数
熵
分类型数据
数值型数据
混合型数据
下载PDF
职称材料
题名
基于K-prototypes的混合属性数据聚类算法改进
1
作者
倪丹
李泽文
机构
广州市城市更新规划设计研究院有限公司
出处
《科技创新与应用》
2024年第28期31-34,38,共5页
文摘
属性数据分为数值型数据和分类型数据,一般情况下对于数值型数据运算前要进行标准化处理,但是对于数值型数据差异大的数据,由于大数掩盖小数的影响,按照K-prototypes聚类算法,数值型数据标准化后而且不对相应的分类数据有任何预处理或者在计算时没有进行任何改变,很可能提高分类数据在聚类中的影响,并且分类型数据并未进一步地细分,不能满足不同要求的混合属性聚类。该文在将数值型数据标准化的基础上,将分类数据细分为二元数据和类型数据,并用相异度系数距离计算分类数据之间的距离,并且赋予二元和类型数据相应的权重,来改进K-prototypes聚类算法,使该算法满足不同要求的混合属性数据聚类,最后通过C#语言,在ArcEngine2010版本上实现。
关键词
K-prototypes算法
混合属性
类型数据
相异
度
系数
加权属性
Keywords
K-prototypes algorithm
mixed attributes
type data
dissimilarity coefficient
weighted attributes
分类号
TP311.1 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于簇内簇间相异度的k-modes算法
被引量:
1
2
作者
贾子琪
宋玲
机构
南阳理工学院计算机与软件学院
广西大学计算机与电子信息学院
出处
《计算机工程与设计》
北大核心
2021年第9期2492-2500,共9页
基金
国家自然科学基金项目(61762030)
广西创新驱动重大专项基金项目(桂科AA17204017)
广西重点研发计划基金项目(桂科AB19110050、桂科AB18126094)。
文摘
为提高k-modes算法的精度并解决初始簇中心选择问题,提出一种基于簇内簇间相异度的k-modes算法(IKMCA)。基于簇内簇间相似性对相异度系数进行改进,给出初始簇中心自主选择的具体方法。提出的簇内簇间相异度系数考虑特征值本身的相异性与其它相关特征对它们的区分性。提出的初始簇中心自主选择方法可以自动确定聚类个数和初始簇中心位置。实验结果表明,提出算法在聚类精度、纯度、召回率上均优于经典k-modes算法及其变体算法。
关键词
k模式算法
簇内簇间相似性
分类型数据
频率
相异
度
系数
Keywords
k-modes algorithm
intra-cluster and inter-cluster similarity
categorical data
frequency
dissimilarity coefficient
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
一种面向混合型数据聚类的k-prototypes聚类算法
被引量:
7
3
作者
贾子琪
宋玲
机构
广西大学计算机与电子信息学院
广西多媒体通信与网络技术重点实验室
出处
《小型微型计算机系统》
CSCD
北大核心
2020年第9期1845-1852,共8页
基金
国家自然科学基金项目(61762030)资助
广西创新驱动重大专项项目(桂科AA17204017)资助
广西重点研发计划项目(桂科AB19110050,桂科AB18126094)资助。
文摘
同时包含数值型和分类型数据的混合型数据集在实际应用中普遍存在.经典的k-prototypes算法通过人为设置参数γ来调节分类型数据和数值型数据之间的占比,γ对聚类结果影响很大.为了避免不同类型数据之间的特征转换和参数调整以及处理高维混合型数据聚类中的特征加权问题,提出了基于熵权的分类型相异度系数,量化的数值型相异度系数和适用于混合型数据聚类的混合型相异度系数.提出的相异度系数充分考虑了分类型特征值的重要性和数值型特征值的平均值,并具统一的准则,可以更客观的计算数据对象与簇之间的相异度.此外,将加权的混合型相异度系数应用到经典的k-prototypes算法中,提出了一种面向混合型数据聚类的k-prototypes聚类算法(KPMD).使用UCI真实数据集进行实验,结果验证了KPMD算法的有效性和鲁棒性.
关键词
k-prototypes
混合型
相异
度
系数
熵
分类型数据
数值型数据
混合型数据
Keywords
k-prototypes algorithm
mixed dissimilarity coefficient
entropy
categorical data
numerical data
mixed data
分类号
TP181 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于K-prototypes的混合属性数据聚类算法改进
倪丹
李泽文
《科技创新与应用》
2024
0
下载PDF
职称材料
2
基于簇内簇间相异度的k-modes算法
贾子琪
宋玲
《计算机工程与设计》
北大核心
2021
1
下载PDF
职称材料
3
一种面向混合型数据聚类的k-prototypes聚类算法
贾子琪
宋玲
《小型微型计算机系统》
CSCD
北大核心
2020
7
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部