期刊文献+
共找到76篇文章
< 1 2 4 >
每页显示 20 50 100
支持本地化差分隐私保护的k-modes聚类方法 被引量:11
1
作者 彭春春 陈燕俐 荀艳梅 《计算机科学》 CSCD 北大核心 2021年第2期105-113,共9页
如何在保护数据隐私的同时进行可用性的数据挖掘已成为热点问题。鉴于在很多实际应用场景中,很难找到一个真正可信的第三方对用户的敏感数据进行处理,文中首次提出了一种支持本地化差分隐私技术的聚类方案——LDPK-modes(Local Differen... 如何在保护数据隐私的同时进行可用性的数据挖掘已成为热点问题。鉴于在很多实际应用场景中,很难找到一个真正可信的第三方对用户的敏感数据进行处理,文中首次提出了一种支持本地化差分隐私技术的聚类方案——LDPK-modes(Local Differential Privacy K-modes)。与传统的基于中心化差分隐私的聚类算法相比,其不再需要一个可信的第三方对数据进行收集和处理,而由用户担任数据隐私化的工作,极大地降低了第三方窃取用户隐私的可能性。用户使用满足本地d-隐私(带有距离度量的本地差分隐私技术)定义的随机响应机制对敏感数据进行扰动,第三方收集到用户扰动数据后,恢复其统计特征,生成合成数据集,并进行k-modes聚类。在聚类过程中,将数据集上频繁出现的特征分配给初始聚类中心点,进一步提高了聚类结果的可用性。理论分析和实验结果表明了LDPK-modes的隐私性和聚类可用性。 展开更多
关键词 本地化差分隐私 k-modes d-隐私 聚类 隐私保护
下载PDF
一种改进的K-Modes聚类算法 被引量:7
2
作者 贾彬 梁毅 苏航 《软件导刊》 2019年第6期60-64,69,共6页
为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法... 为了改善传统K-Modes聚类算法相异度度量公式弱化了类内相似性,忽略了属性间差异,以及单一属性值的Modes忽视了某一属性可能存在多属性值组合,且算法受初始中心点影响很大的缺点,基于多属性值Modes的相异度度量方法提出MAV-K-Modes算法,并采用一种基于预聚类的初始中心选取方法。使用UCI数据集进行实验,结果表明,MAV-K-Modes算法相比于传统K-Modes算法,其正确率、类精度和召回率都有明显提升,且MAV-K-Modes算法适合于并行化改造。 展开更多
关键词 聚类算法 相异度度量 初始中心点 多属性值modes k-modes
下载PDF
面向不完备分类型矩阵数据的集对k-modes聚类算法 被引量:4
3
作者 张春英 高瑞艳 +4 位作者 王佳昊 陈松 刘凤春 任静 冯晓泽 《小型微型计算机系统》 CSCD 北大核心 2021年第9期1837-1844,共8页
为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑... 为了解决具有不完备、分类型矩阵数据集的聚类问题,同时考虑样本和类簇间的不确定关系,提出了一种面向不完备分类型矩阵数据的集对k-modes聚类算法.首先,基于集对信息粒的相关理论,定义了不完备矩阵样本间的集对距离度量方法;其次,考虑样本和类簇间的不确定关系,给出了类内平均距离的定义和判断样本是否属于多个类簇的阈值计算公式,进而形成包含正同域,边界域和负反域的集对聚类结果;最后,通过选取的3个矩阵数据集与四个对比算法进行实验评价,实验结果表明集对k-modes聚类算法可以有效处理不完备分类型矩阵数据集,并且在准确率、召回率、调整兰德系数和标准化互信息等指标上均有良好的聚类性能. 展开更多
关键词 不完备分类型矩阵数据 集对信息粒 k-modes 集对距离 集对k-modes
下载PDF
基于k-modes聚类算法的混洗差分隐私方法
4
作者 祁富 陈丽敏 《牡丹江师范学院学报(自然科学版)》 2024年第2期6-13,共8页
首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将... 首次提出一种基于k-modes聚类算法的混洗差分隐私保护方案(简称SDPk-modes).SDPk-modes根据每个数据之间的距离划分为不同的组,得到足够的细粒度优化效用,采用基于梯度随机扰动技术使计算最优概率耗时更短;在k-modes聚类过程中,通过将数据中频繁出现的特征向量作为聚类中心点,基于属性熵的距离度量方法,加快算法收敛至聚类中心的速度,解决原始算法聚类速度慢、易陷入局部最优等问题,显著提高聚类的效果.实验验证表明,本文提出的方案优于当前同类方案. 展开更多
关键词 混洗差分隐私 k-modes 随机响应机制 隐私保护
下载PDF
一种基于属性值权重的k-modes聚类分析算法 被引量:1
5
作者 郝荣丽 胡立华 《计算机与数字工程》 2023年第5期1001-1004,1119,共5页
针对k-modes方法未考虑各属性值在属性空间的分布特征而导致分类变量间差异性度量不准确的问题,提出了一种基于属性值权重的k-modes聚类分析算法。该算法利用属性值之间的差异和属性值的权重,重新定义了相异度度量公式;采用属性值频率... 针对k-modes方法未考虑各属性值在属性空间的分布特征而导致分类变量间差异性度量不准确的问题,提出了一种基于属性值权重的k-modes聚类分析算法。该算法利用属性值之间的差异和属性值的权重,重新定义了相异度度量公式;采用属性值频率和各属性值的权重,给出一种聚类中心更新迭代公式,有效地体现了属性值在属性空间中的分布特征和属性之间的重要性差异;采用UCI数据集,验证了算法的有效性。 展开更多
关键词 聚类分析 k-modes 属性值权重 属性值频率 相异度度量
下载PDF
乡村民宿同质化现象的调查研究——以浙江省杭州市、温州市及嘉兴市为例
6
作者 周清萍 姜家昆 +1 位作者 赵晓繁 刘鑫鑫 《中文科技期刊数据库(文摘版)社会科学》 2024年第6期0092-0096,共5页
民宿之于乡村,就像一扇窗户,打开了绿水青山和乡村旅游的崭新世界。随着“千村示范,万村整治”工程的深入实施,浙江省乡村民宿产业快速发展,但与此同时,乡村民宿同质化问题也逐渐凸显出来,成为了阻碍民宿更好发展的障碍。为解决乡村民... 民宿之于乡村,就像一扇窗户,打开了绿水青山和乡村旅游的崭新世界。随着“千村示范,万村整治”工程的深入实施,浙江省乡村民宿产业快速发展,但与此同时,乡村民宿同质化问题也逐渐凸显出来,成为了阻碍民宿更好发展的障碍。为解决乡村民宿同质化问题,温州理工学院调查小组运用问卷调查、实地考察、定性访谈相结合的方法,对浙江省杭州市、温州市和嘉兴市的9个区县的27个乡村的135家民宿展开调查。运用描述性统计分析了解民宿发展情况;基于多重响应分析及K-modes聚类分析掌握乡村民宿同质化现象的具体表现;利用因子分析,建立SEM模型,分析影响乡村民宿同质化现象的成因,进而提出“集树成林”发展体系,助力乡村振兴。 展开更多
关键词 乡村民宿 同质化 k-modes SEM模型 “集树成林”发展体系
下载PDF
基于K-modes的安全算法抵御SSDF攻击
7
作者 陈玲玲 沈宣 《电脑与电信》 2023年第7期27-30,共4页
为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低... 为保障频谱感知安全,针对协作频谱感知中频谱感知数据篡改攻击,在集中式认知无线电网络中提出了一种基于K-modes的安全算法抵御此类攻击。利用K-modes算法对在融合中心收集到的次用户感知报告进行分类,在识别并剔除攻击者后,最后通过低复杂度的传统投票规则获得更高的网络感知性能。通过Python仿真,分析该算法在不同条件下对攻击者的识别性能,并验证该算法比传统防御算法的检测概率提高了约37%。 展开更多
关键词 认知无线电 集中式协作频谱感知 SSDF k-modes 传统防御算法
下载PDF
基于K-modes聚类算法的安徽历史文化名村分类及保护发展策略
8
作者 张泉 薛珊珊 邹成东 《华中建筑》 2023年第1期23-27,共5页
以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形... 以安徽省44个省级以上历史文化名村为研究对象,分析其空间分布特征与保护管理现状,并探讨影响其类型划分的具体因素。同时,借鉴学者关于历史文化名村和传统村落分类的研究,以地理条件、产业经济、社会生活、历史文化为主要维度,构建形成安徽历史文化名村类型划分的指标体系。基于此,运用K-modes聚类算法,将安徽历史文化名村划分为生态宜居型、文旅资源型、特色民俗型、综合发展型四种类型,并总结各类历史文化名村的典型特征,进而提出相应的保护与发展策略。 展开更多
关键词 历史文化名村 k-modes 聚类算法 保护发展策略 安徽
下载PDF
一种基于最大信息系数预处理的k-modes聚类方法 被引量:2
9
作者 李明媚 文成林 胡绍林 《系统仿真学报》 CAS CSCD 北大核心 2022年第10期2204-2212,共9页
为解决现有k-modes聚类方法因忽略了变量属性之间的弱相关性,常造成其在实际应用中聚类性能不佳的问题,提出一种包含属性弱相关性的新k-modes聚类方法。引入最大信息系数(maximum information coefficient,MIC)度量数据集中变量属性之... 为解决现有k-modes聚类方法因忽略了变量属性之间的弱相关性,常造成其在实际应用中聚类性能不佳的问题,提出一种包含属性弱相关性的新k-modes聚类方法。引入最大信息系数(maximum information coefficient,MIC)度量数据集中变量属性之间的相关性;将得到的MIC值与原有距离进行融合,建立包含属性弱相关性信息的新度量方法,以增强变量属性间相关信息的完备性,建立更加精细的k-modes聚类方法;调用3种不同的数据集,将新方法与原有的k-modes聚类方法和其他改进k-modes聚类方法的性能进行对比,并通过仿真结果表明了新方法的有效性。 展开更多
关键词 聚类方法 k-modes 最大信息系数 距离度量 变量属性
下载PDF
混合属性数据聚类初始点选择的改进 被引量:3
10
作者 赵立江 黄永青 《广西师范大学学报(自然科学版)》 CAS 北大核心 2007年第4期220-223,共4页
k-prototypes和模糊k-prototypes是处理数值属性和分类属性混合数据主要的聚类算法。但这两种聚类算法不足之处是对初值有明显的依赖。对初值选取方法进行了分析和研究,提出一种新的改进方法,可在一定程度上减少随机性。实际数据集仿真... k-prototypes和模糊k-prototypes是处理数值属性和分类属性混合数据主要的聚类算法。但这两种聚类算法不足之处是对初值有明显的依赖。对初值选取方法进行了分析和研究,提出一种新的改进方法,可在一定程度上减少随机性。实际数据集仿真结果表明改进算法有更高的稳定性和较强的伸缩性。 展开更多
关键词 聚类 kmodes k—prototypes 分类型数据 相异度
下载PDF
基于互信息量的改进K-Modes聚类方法 被引量:3
11
作者 吴润秀 《统计与决策》 CSSCI 北大核心 2012年第6期89-91,共3页
文章提出了一种基于互信息量的改进K-Modes聚类方法,采用样本互信息来刻画数据对象属性之间的相互关系。在此基础上提出了一种新的距离度量,该距离度量方法既考虑了对象某个属性值本身的不同,又考虑了对象其它属性对该属性值的影响,使... 文章提出了一种基于互信息量的改进K-Modes聚类方法,采用样本互信息来刻画数据对象属性之间的相互关系。在此基础上提出了一种新的距离度量,该距离度量方法既考虑了对象某个属性值本身的不同,又考虑了对象其它属性对该属性值的影响,使之更符合实际问题情况。实验结果表明,聚类方法有效地提高了聚类精度。 展开更多
关键词 互信息量 kmodes 聚类方法
下载PDF
基于Hadoop物联网数据挖掘的算法分析与应用 被引量:1
12
作者 陈娟 《计算机时代》 2018年第6期29-31,34,共4页
介绍了物联网数据处理的若干关键技术,如大数据采集、大数据存储、大数据的分析与挖掘等。以Hadoop为平台对物联网数据进行挖掘与分析,为了提高处理庞大数据的实效性,基于Map Reduce架构采用了朴素贝叶斯分类算法、K-modes聚类算法以及E... 介绍了物联网数据处理的若干关键技术,如大数据采集、大数据存储、大数据的分析与挖掘等。以Hadoop为平台对物联网数据进行挖掘与分析,为了提高处理庞大数据的实效性,基于Map Reduce架构采用了朴素贝叶斯分类算法、K-modes聚类算法以及ECLAT算法。分析认为,应用这三类算法,提高了数据分类效率,优化了类内对象之间的相似性以及类间对象之间的关联性,为更高效的数据挖掘提供了很好的思路。 展开更多
关键词 物联网 HADOOP 朴素贝叶斯 k-modes ECLAT
下载PDF
基于MapReduce的并行k-modes算法
13
作者 郭涛 丁祥武 《智能计算机与应用》 2015年第1期43-45,共3页
k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心。为了使k-modes能够处理大规模分类数... k-modes是一种代表性的分类数据的聚类算法。首先对k-modes聚类算法的实现过程进行了改进:通过在分配数据对象到簇时更新这个簇中各个属性项的次数,使得在遍历一次全部数据对象就能计算出新的簇中心。为了使k-modes能够处理大规模分类数据,在Hadoop平台上用MapReduce并行计算模型实现了k-modes算法。实验表明:在处理大量数据时,并行k-modes比串行k-modes极大地缩短了聚类时间,取得了较好的加速比。 展开更多
关键词 分类数据 k-modes 并行聚类 MAPREDUCE
下载PDF
分类属性数据的泛化中心聚类算法
14
作者 武森 张桂琼 +1 位作者 潘静 全敏 《运筹与管理》 CSSCI CSCD 北大核心 2014年第6期37-43,共7页
针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给... 针对采用经典划分思想的聚类算法以一个点来代表类的局限,提出一种基于泛化中心的分类属性数据聚类算法。该算法通过定义包含多个点的泛化中心来代表类,能够体现出类的数据分布特征,并进一步提出泛化中心距离及类间距离度量的新方法,给出泛化中心的确定方法及基于泛化中心进行对象到类分配的聚类策略,一般只需一次划分迭代就能得到最终聚类结果。将泛化中心算法应用到四个基准数据集,并与著名的划分聚类算法K-modes及其两种改进算法进行比较,结果表明泛化中心算法聚类正确率更高,迭代次数更少,是有效可行的。 展开更多
关键词 聚类算法 泛化中心 分类属性 k-modes
下载PDF
地理加权的K-Modes算法在城市餐饮空间分析中的应用
15
作者 李智 魏东岚 《绿色科技》 2020年第24期250-251,255,共3页
通过Python获取大连市餐饮空间数据,在SPSS中采用K-Modes聚类分析算法进行了第一次基础聚类,以经纬度作为地理权重进行二次聚类,在Arcgis中分析了大连市线上餐饮业空间消费规律。通过划定消费区间,在固定区间内实现附加地理权重的K-Mode... 通过Python获取大连市餐饮空间数据,在SPSS中采用K-Modes聚类分析算法进行了第一次基础聚类,以经纬度作为地理权重进行二次聚类,在Arcgis中分析了大连市线上餐饮业空间消费规律。通过划定消费区间,在固定区间内实现附加地理权重的K-Modes聚类,将线上餐饮消费空间差异程度进一步放大。研究发现:附带地理权重的K-Modes聚类算法能更精准地体现餐饮消费规律地理空间上的差异性。 展开更多
关键词 k-modes 聚类分析 地理加权 GIS SPSS 线上餐饮
下载PDF
一种基于k-modes的冷启动问题解决算法 被引量:1
16
作者 肖文杰 《福建电脑》 2018年第8期28-29,78,共3页
冷启动问题是协同过滤推荐算法无法回避的问题。本文回顾了解决冷启动问题的策略,在基于用户属性以及k-means算法解决冷启动问题的基础上,考虑到用户属性的数据类型属于分类数据,不适合k-means算法,因而提出应用k-modes算法解决冷启动... 冷启动问题是协同过滤推荐算法无法回避的问题。本文回顾了解决冷启动问题的策略,在基于用户属性以及k-means算法解决冷启动问题的基础上,考虑到用户属性的数据类型属于分类数据,不适合k-means算法,因而提出应用k-modes算法解决冷启动问题的方案。通过对聚类数k设置不同值进行实验,实验结果表明,在总共9个实验k值下,基于k-modes算法有7种k值实验的误差优于k-means算法。 展开更多
关键词 冷启动问题 k-modes 协同过滤推荐
下载PDF
基于形态距离的日负荷数据自适应稳健聚类算法 被引量:27
17
作者 李阳 刘友波 +5 位作者 刘俊勇 程明畅 马铁丰 魏文涛 尹龙 宁世超 《中国电机工程学报》 EI CSCD 北大核心 2019年第12期3409-3419,共11页
为克服传统划分式聚类算法的聚类数k值难以确定以及聚类结果稳定性较差的问题,提出一种基于日负荷曲线形态距离的自适应稳健聚类方法。利用差分算法和分位数对原始日负荷曲线进行特征提取,将其转化为描述负荷曲线形态特征的离散类属性数... 为克服传统划分式聚类算法的聚类数k值难以确定以及聚类结果稳定性较差的问题,提出一种基于日负荷曲线形态距离的自适应稳健聚类方法。利用差分算法和分位数对原始日负荷曲线进行特征提取,将其转化为描述负荷曲线形态特征的离散类属性数据,用曲线形态差异度量替代对负荷数据的欧氏距离度量,避免数据标幺化可能带来的信息缺失;进一步引入特征属性加权和隶属度惩罚,根据样本形态特征,提出基于动态层次Fuzzy U-K-modes的自适应聚类算法,通过多阶段聚类和构建聚类系谱,自适应地确定聚类中心和k值,在不过多损失效率的前提下,使聚类结果的稳定性大幅提升;最后以某地区4869个用户的日负荷数据为研究对象,验证了所提算法的有效性。 展开更多
关键词 形态距离 特征提取 差异度量 动态层次Fuzzy U-k-modes 聚类系谱图 自适应稳健聚类
下载PDF
基于改进K-modes聚类的KNN分类算法 被引量:23
18
作者 王志华 刘绍廷 罗齐 《计算机工程与设计》 北大核心 2019年第8期2228-2234,共7页
为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出... 为解决K-modes算法初始化k簇时误差率较高和KNN(K最近邻算法)算法面对大样本数据量时分类不准确的现状,分析传统的K-modes算法从k簇的初始化到簇中心不再变化的全过程和KNN(K最近邻算法)算法在面对大样本数据时执行效率低下的问题,提出改进的K-modes-KNN算法。使用字符串核函数初始化k簇,字符串核函数迭代计算样本到簇中心的距离来动态改变簇中心,利用改进的K-modes算法将数据集进行分簇处理后,在每个子簇中建立KNN(K最近邻算法)分类模型。通过真实数据验证了所提算法在一定程度上优于同种分类算法。 展开更多
关键词 k-modes算法 kNN算法 分类 簇中心 k-modes-kNN算法 字符串核函数
下载PDF
基于离散小波变换和模糊K-modes的负荷聚类算法 被引量:21
19
作者 张江林 张亚超 +2 位作者 洪居华 高红均 刘俊勇 《电力自动化设备》 EI CSCD 北大核心 2019年第2期100-106,122,共8页
为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的... 为了研究智能电网背景下用户的用电模式,考虑到现有聚类算法的不足,提出了一种基于离散小波变换的模糊K-modes聚类算法。利用离散小波变换将时域的负荷曲线转换到频域,从而将负荷曲线的不同特征隔离在不同的频域水平,并利用低阶近似的思想选取原始曲线的有效分量曲线;对所选的分量曲线进行趋势编码,将连续负荷数据转化为离散类属性数据;基于平均密度确定初始聚类条件,利用模糊K-modes聚类算法对曲线进行形态聚类,得到负荷曲线模板;将所提算法与传统K-means算法及层次聚类算法进行比较,从而验证了所提算法的有效性。 展开更多
关键词 智能电网 负荷聚类 离散小波变换 模糊k-modes聚类算法 用电模式
下载PDF
基于粗糙集的改进K-Modes聚类算法 被引量:15
20
作者 白亮 梁吉业 曹付元 《计算机科学》 CSCD 北大核心 2009年第1期162-164,176,共4页
传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Mo... 传统的K-Modes算法采用简单匹配的方法来计算对象之间的距离,并没有充分考虑同一属性下的两个不同值之间的相似性。基于粗糙集中的上、下近似,提出了一种新的距离度量,并重新定义了类中心,对传统K-Modes算法进行了改进。与其他改进K-Modes算法进行了比较,实验结果表明,基于粗糙集的改进K-Modes算法有效地提高了聚类精度。 展开更多
关键词 聚类算法 粗糙集 距离度量 k-modes算法
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部