期刊文献+
共找到19篇文章
< 1 >
每页显示 20 50 100
基于k-prototype聚类的差分隐私混合数据发布算法 被引量:8
1
作者 屈晶晶 蔡英 +1 位作者 范艳芳 夏红科 《计算机科学与探索》 CSCD 北大核心 2021年第1期109-118,共10页
差分隐私是一种提供强大隐私保护的模型。在非交互式框架下,数据管理者可发布采用差分隐私保护技术处理的数据集供研究人员进行挖掘分析。但是在数据发布过程中需要加入大量噪声,会破坏数据可用性。因此,提出了一种基于k-prototype聚类... 差分隐私是一种提供强大隐私保护的模型。在非交互式框架下,数据管理者可发布采用差分隐私保护技术处理的数据集供研究人员进行挖掘分析。但是在数据发布过程中需要加入大量噪声,会破坏数据可用性。因此,提出了一种基于k-prototype聚类的差分隐私混合数据发布算法。首先改进k-prototype聚类算法,按数据类型的不同,对数值型属性和分类型属性分别选用不同的属性差异度计算方法,将混合数据集中更可能相关的记录分组,从而降低差分隐私敏感度;结合聚类中心值,采用差分隐私保护技术对数据记录进行处理保护,针对数值型属性使用Laplace机制,分类型属性使用指数机制;从差分隐私的概念及组合性质两方面对该算法进行隐私分析证明。实验结果表明:该算法能够有效提高数据可用性。 展开更多
关键词 差分隐私 混合数据集 k-prototype 聚类 数据发布
下载PDF
基于原型提取和聚类的光伏电站快速集群划分方法
2
作者 陈文进 杨晓丰 +4 位作者 祁炜雯 王建军 赵峰 陈建国 王健 《浙江电力》 2024年第4期74-84,共11页
在光伏发电渗透率不断提高的背景下,针对光伏电站集群划分效果差、耗时长的问题,提出一种基于原型提取和聚类的光伏电站快速集群划分方法。首先,对光伏数据进行预处理,消除不同数据在量级与量纲上的差异性;然后,基于Pearson相关系数法... 在光伏发电渗透率不断提高的背景下,针对光伏电站集群划分效果差、耗时长的问题,提出一种基于原型提取和聚类的光伏电站快速集群划分方法。首先,对光伏数据进行预处理,消除不同数据在量级与量纲上的差异性;然后,基于Pearson相关系数法筛选出对光伏出力影响较大的因素,然后通过设置随机抽样、k-means++和改进谱聚类3个环节,分别实现光伏电站的抽样、原型提取和原型聚类;继而基于枚举法和分层优化的思想,搜索上述环节的最优超参数;最后,设置不同场景进行算例对照,计算聚类内外指标和聚类时间指标,通过综合分析,验证了所提方法在解决大规模光伏电站快速聚类问题上的有效性。 展开更多
关键词 光伏电站 改进谱聚类算法 原型聚类 Pearson相关系数
下载PDF
基于类原型的复杂网络重叠社区发现方法 被引量:6
3
作者 姜雅文 贾彩燕 于剑 《模式识别与人工智能》 EI CSCD 北大核心 2013年第7期648-659,共12页
社区结构是复杂网络的重要拓扑特性之一.在现实世界中,网络的社区结构常具有重叠性.如何从网络中发掘出可靠的重叠社区是目前复杂网络社区发现研究的难点之一.直接优化Qov评价函数是一种解决重叠社区发现问题的方法,然而该方法易产生局... 社区结构是复杂网络的重要拓扑特性之一.在现实世界中,网络的社区结构常具有重叠性.如何从网络中发掘出可靠的重叠社区是目前复杂网络社区发现研究的难点之一.直接优化Qov评价函数是一种解决重叠社区发现问题的方法,然而该方法易产生局部最优解.为解决该问题,利用类原型聚类算法的思想和概念,通过计算网络节点的类原型归属度信息,设计一个基于类原型的复杂网络重叠社区发现方法的框架,并将该框架应用于几种常见的聚类算法.实验结果表明,相比其它网络重叠社区发现算法,该方法不仅避免产生局部最优解,且具有适用性好、精度高的优点. 展开更多
关键词 复杂网络 重叠社区发现 模块性 类原型 聚类算法 节点相似度
下载PDF
量子原型聚类
4
作者 刘翔 祝静 +2 位作者 仲国强 顾永建 崔丽媛 《计算机科学》 CSCD 北大核心 2023年第8期27-36,共10页
经典机器学习算法的量子化重构是量子机器学习领域的一个重要研究方向。聚类作为一类在机器学习领域被广泛应用的算法,其量子化重构也拥有较高的研究价值。目前的量子机器学习算法大多存在复现难度大、难以与经典算法形成直观对比等问... 经典机器学习算法的量子化重构是量子机器学习领域的一个重要研究方向。聚类作为一类在机器学习领域被广泛应用的算法,其量子化重构也拥有较高的研究价值。目前的量子机器学习算法大多存在复现难度大、难以与经典算法形成直观对比等问题。为解决这些问题,提出了一种量子原型聚类算法(Quantum Prototype Clustering,QPC),该算法可以很方便地在现有的通用性量子计算设备上部署。该方法首先结合单量子位旋转特性,寻找信息损失最小的特征映射方式,使用双维度特征数据制造单量子位旋转;然后,基于多量子位纠缠及纠缠系统坍缩的特性,设计了一种用于制造特定量子纠缠系统和测量纠缠系统坍缩结果的量子线路。根据纠缠系统中受控量子位旋转角和纠缠系统坍缩结果的关系,并结合闵可夫斯基距离的定义,推导了一种用于评估输入样本相似性的量子距离。该量子距离测量模块与经典计算机中的距离计算模块具有相同的输入输出形式,可以不加修改地替换掉原型聚类中的闵可夫斯基距离计算,从而将经典的原型聚类算法重构为QPC。在来自kaggle和scikit-learn的多组公开数据集上进行的多次重复实验表明,在平均样本中心距等评价指标上,QPC与经典的原型聚类算法无明显差别。 展开更多
关键词 量子计算 量子机器学习 聚类算法 原型聚类
下载PDF
基于外形特征的三维模型聚类方法研究 被引量:2
5
作者 李健 莫蓉 +2 位作者 石源 苏媛媛 郑丹晨 《计算机集成制造系统》 EI CSCD 北大核心 2010年第3期502-506,共5页
针对实际应用中三维模型数据集的模型分类管理、检索聚类预处理等聚类问题,提出了一种基于划分方法的无监督聚类模型。该模型通过以傅里叶矩不变算法为基础的特征提取算法,综合运用了现有聚类算法,将特征提取和聚类计算有效结合起来,充... 针对实际应用中三维模型数据集的模型分类管理、检索聚类预处理等聚类问题,提出了一种基于划分方法的无监督聚类模型。该模型通过以傅里叶矩不变算法为基础的特征提取算法,综合运用了现有聚类算法,将特征提取和聚类计算有效结合起来,充分考虑了聚类模型数据格式的敏感性问题。计算结果表明,该方法对有一定类结构的数据集在有整体聚类效果的情况下有一定的局部最优性。 展开更多
关键词 特征提取 预处理 类原型 聚类模型 三维模型 聚类算法
下载PDF
基于K-prototype与SVM的短期电力负荷预测 被引量:2
6
作者 孙聪 李川 李英娜 《信息技术》 2019年第4期27-32,38,共7页
电力负荷受多种不确定因素的影响,所以通过使用一种聚类方式选取相似日来进行短期电力负荷预测,以提高预测精度和速度。K-prototype聚类算法继承了k均值算法所以具有k均值优点。通过建立映射数据库将气温、湿度、天气、星期类型、季节... 电力负荷受多种不确定因素的影响,所以通过使用一种聚类方式选取相似日来进行短期电力负荷预测,以提高预测精度和速度。K-prototype聚类算法继承了k均值算法所以具有k均值优点。通过建立映射数据库将气温、湿度、天气、星期类型、季节等不同量纲的值通过无量纲化处理,使得不同的量纲在数值上具有可比性。然后运用聚类方法选取预测日的相似日,借助SVM模型对相似日样本进行预测,实现更加精准预测的目的。利用某地区真实数据进行验证,结果表明该方法可以有效地提高短期电力负荷的预测精度。 展开更多
关键词 短期电力负荷预测 K-prototype 聚类 支持向量机
下载PDF
基于原型的EM朴素贝叶斯模型在直接营销中的应用 被引量:1
7
作者 吴陈 王万川 《计算机应用与软件》 CSCD 北大核心 2012年第9期178-181,194,共5页
针对连锁型零售企业直接营销中的问题,基于原型理论的挖掘模型选择方法,提出基于EM聚类朴素贝叶斯模型,通过实验证明了该模型在客户购买行为的预测性能上明显优于基于K-means聚类朴素贝叶斯模型和无聚类的朴素贝叶斯模型。最后,利用该... 针对连锁型零售企业直接营销中的问题,基于原型理论的挖掘模型选择方法,提出基于EM聚类朴素贝叶斯模型,通过实验证明了该模型在客户购买行为的预测性能上明显优于基于K-means聚类朴素贝叶斯模型和无聚类的朴素贝叶斯模型。最后,利用该模型检验了直接营销中的对新客户进行分类预测的有效性。 展开更多
关键词 数据挖掘 原型模型 EM聚类 朴素贝叶斯 直接营销
下载PDF
云计算平台的海量数据知识提取框架 被引量:1
8
作者 邹裕 《计算机系统应用》 2016年第11期216-220,共5页
针对从海量数据中分析与提取知识计算时间高的问题,提出一种基于Hadoop的知识提取算法.本文结合Hadoop的并行处理能力与分布式存储特点,设计了一种知识提取框架,可兼容不同的原型约简方法.基于Map Reduce编程方法将约简方法并行化处理,... 针对从海量数据中分析与提取知识计算时间高的问题,提出一种基于Hadoop的知识提取算法.本文结合Hadoop的并行处理能力与分布式存储特点,设计了一种知识提取框架,可兼容不同的原型约简方法.基于Map Reduce编程方法将约简方法并行化处理,并且设计了分类准确率高、计算速度快的原型约简组合规则.最终基于真实UCI大数据集进行实验,本框架将最近邻分类器的分类时间提高两个数量级. 展开更多
关键词 海量数据 知识提取 原型约简 云计算 并行计算 数据聚类
下载PDF
基于K-prototype聚类的学生教育画像分析 被引量:10
9
作者 翟鸣宇 程建 +1 位作者 王苏桐 王延章 《大连理工大学学报(社会科学版)》 CSSCI 北大核心 2021年第6期22-31,共10页
针对包含类别数据与数值数据的高校教育大数据,采用基于汉明距离与欧式距离混合度量的K-prototype进行聚类,并通过轮廓系数对聚类效果进行评价,与常用的k-means、DBSCAN进行对比,实验结果表明:基于K-prototype的聚类在教育大数据的处理... 针对包含类别数据与数值数据的高校教育大数据,采用基于汉明距离与欧式距离混合度量的K-prototype进行聚类,并通过轮廓系数对聚类效果进行评价,与常用的k-means、DBSCAN进行对比,实验结果表明:基于K-prototype的聚类在教育大数据的处理上更具优势。基于聚类结果,采用词云图构建了4类学生教育画像。画像从基本属性、生活消费、生活规律等维度将学生群体划分为“思想积极型学生”“夜猫子游戏型学生”“规律作息型学生”“节俭好学型学生”4类,为学生教育管理人员提供相应的决策支持。 展开更多
关键词 学生教育画像 K-prototype聚类 词云图
下载PDF
DCKPDP:改进k-prototype聚类的差分隐私混合属性数据发布方法 被引量:7
10
作者 张星 张兴 《计算机应用研究》 CSCD 北大核心 2022年第1期249-253,共5页
当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算... 当前混合属性数据发布中隐私保护方法大多存在隐私保护效果不佳或数据效用较差的问题,采用差分隐私与优化的k-prototype聚类方法相结合,提出改进k-prototype聚类的差分隐私混合属性数据发布方法(DCKPDP)。为解决传统k-prototype聚类算法没有考虑不同数值型属性对聚类结果有较大影响的问题,利用信息熵为每个数值型属性添加属性权重;为解决聚类初始中心点人为规定或者由随机算法随机确定,导致聚类结果精确度不高的问题,结合数据对象的局部密度和高密度对聚类过程中初始中心点进行自适应选择;为解决数据信息泄露风险较高的问题,对聚类中心值进行差分隐私保护。实验结果表明,DCKPDP算法满足差分隐私保护所需的噪声量更小,数据的可用性更好。 展开更多
关键词 差分隐私 混合属性数据 k-prototype聚类 密度优化 信息熵
下载PDF
基于卷积原型网络的断路器故障诊断方法研究 被引量:2
11
作者 沙浩源 刘佩 +4 位作者 王之赫 孙毅 赵贺 邓凯 朱超 《电器与能效管理技术》 2024年第2期56-65,共10页
针对现有断路器故障诊断研究中无法有效区分未知类样本的问题,提出了一种基于卷积原型网络的断路器故障诊断算法。首先,以聚类的思想构建分类函数,通过各类故障的原型样本点特征空间距离约束来划分概率空间,实现对包含未知类故障样本集... 针对现有断路器故障诊断研究中无法有效区分未知类样本的问题,提出了一种基于卷积原型网络的断路器故障诊断算法。首先,以聚类的思想构建分类函数,通过各类故障的原型样本点特征空间距离约束来划分概率空间,实现对包含未知类故障样本集的识别。同时,以原型样本点为聚类中心,将样本特征的空间距离作为卷积特征自提取网络的优化目标,以有效改善样本特征的类内聚集性及类间的分散性,提高模型对样本的分类准确度。最后,基于110 kV断路器现场实验数据,对所提算法的有效性和准确性进行验证。结果表明,所提算法能够准确区分测试样本中的未知故障,并有效改善了故障样本特征的空间分布。 展开更多
关键词 断路器 故障诊断 原型卷积网络 聚类 未知类 智能运维
下载PDF
DP-IMKP:满足个性化差分隐私的数据发布保护方法 被引量:1
12
作者 张星 张兴 王晴阳 《计算机工程与应用》 CSCD 北大核心 2023年第10期288-298,共11页
差分隐私因能提供强大的隐私保证,广泛应用于解决数据发布中的隐私保护问题。但是经差分隐私保护后的数据注入大量噪音,降低了数据可用性,且已有方法中,针对混合属性数据集发布的隐私保护研究成果较少和存在隐私预算分配不合理的问题。... 差分隐私因能提供强大的隐私保证,广泛应用于解决数据发布中的隐私保护问题。但是经差分隐私保护后的数据注入大量噪音,降低了数据可用性,且已有方法中,针对混合属性数据集发布的隐私保护研究成果较少和存在隐私预算分配不合理的问题。因此,提出一种基于个性化隐私预算分配的差分隐私混合属性数据发布方法(DP-IMKP)。利用互信息与属性之间关联关系,提出一种敏感属性分级策略,使用户各属性重要程度得以量化,为不同级别的属性匹配对应的隐私保护程度;结合最优匹配理论,构造隐私预算与敏感属性之间的二部图,为各级敏感属性分配合理的隐私预算;结合信息熵和密度优化思想,对经典k-prototype算法中初始中心的选择和相异度度量方法进行改进,并对原始数据集进行聚类,利用各敏感属性分配的隐私预算,对聚类中心值进行差分隐私保护,防止隐私数据信息泄露。通过实验验证,DP-IMKP方法与同类方法相比,在提高数据可用性和降低数据泄露风险方面有明显优势。 展开更多
关键词 差分隐私 k-prototype聚类 属性分级 隐私预算分配 互信息 混合数据
下载PDF
一种基于k-prototype的多层次聚类改进算法 被引量:1
13
作者 李士进 朱跃龙 刘净 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第3期342-347,共6页
针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进... 针对k-prototype算法在处理复杂的数据集时,常出现一些纯度不高的簇,影响了聚类质量的问题,提出一种基于k-prototype的多层次聚类改进算法,利用属性自动选择的方法将一些纯度不高的簇进行再聚类,以提高聚类质量.以UCI标准测试数据集进行实验,实验结果表明,该改进算法能够明显提高混合型数据集的聚类质量,并且在数据约简方面有良好表现. 展开更多
关键词 聚类 混合数据 多层次聚类 k-prototype聚类
下载PDF
基于BCALoD的FPSO软刚臂系泊系统疲劳分析
14
作者 罗起航 武文华 +1 位作者 吕柏呈 郭冲冲 《中国海洋平台》 2024年第2期63-71,108,共10页
针对软刚臂系泊系统铰节点在服役过程中出现的疲劳损伤问题,提出一种基于原型监测和局部密度双向聚类算法(Bidirectional Clustering Algorithm based on Local Density,BCALoD)的疲劳寿命计算方法。采用BCALoD算法对获得的船体六自由... 针对软刚臂系泊系统铰节点在服役过程中出现的疲劳损伤问题,提出一种基于原型监测和局部密度双向聚类算法(Bidirectional Clustering Algorithm based on Local Density,BCALoD)的疲劳寿命计算方法。采用BCALoD算法对获得的船体六自由度进行工况分类,运用多体动力学将运动数据转算为受力时程,将其作为铰节点疲劳寿命分析的载荷谱。采用Abaqus软件建立各铰节点有限元模型以计算热点应力,结合Miner线性疲劳累积损伤理论和雨流计数方法计算疲劳寿命。进一步分析评估基于实测数据的铰节点疲劳设计指标,指出该FPSO软刚臂上铰节点的疲劳寿命不足以支持其完成服役,且各铰节点难以统一维护和更换。本研究可为在役软刚臂系泊系统的疲劳寿命计算提供一种新的载荷处理方法,为未来海洋平台的设计提供参考。 展开更多
关键词 软刚臂单点系泊系统 疲劳寿命 原型监测 局部密度双向聚类算法 多体动力学 铰节点
下载PDF
基于混合聚类的海运通道非传统安全风险空间划分
15
作者 吕靖 张晨 班豪 《上海海事大学学报》 北大核心 2023年第1期81-87,103,共8页
为保障海上运输安全,实现有效的海上风险预警,对影响国际海运通道安全最主要的非传统安全风险的时空分布模式进行探索。海上运输非传统安全风险主要包括海盗、海上恐怖主义和海上偷渡,对这3类风险发生的影响因素进行分析并结合风险特征... 为保障海上运输安全,实现有效的海上风险预警,对影响国际海运通道安全最主要的非传统安全风险的时空分布模式进行探索。海上运输非传统安全风险主要包括海盗、海上恐怖主义和海上偷渡,对这3类风险发生的影响因素进行分析并结合风险特征构建特征指标体系。基于国际海事组织全球航运信息集成系统(Global Integrated Shipping Information System,GISIS),应用K原型聚类模型,并以轮廓系数法进行模型校正,对2015—2020年全球海运通道非传统安全风险进行空间划分。试验结果表明:东马来西亚沿岸、苏禄海、苏拉威西海是马六甲海峡周边海域海上袭击的高风险区;非洲沿岸港口始终是偷渡的高风险区,拉丁美洲海上偷渡发生地逐渐南移,地中海沿岸港口海上偷渡频率显著上升。研究成果表明该方法可实现对区域内不同海上非传统安全风险的细致划分。 展开更多
关键词 海上运输 非传统安全风险 空间划分 K原型聚类 混合聚类
下载PDF
数据挖掘中的聚类算法分析 被引量:2
16
作者 段琪 《信息与电脑》 2019年第15期39-40,共2页
随着计算机网络的飞速发展,各行各业每天都产生大量数据。为了大量数据中提取有效信息,衍生了数据挖掘技术。聚类分析是数据挖掘领域的一项重要工具,广泛应用于不同领域,比如模式识别、医药、统计学等。现实生活中的数据有数值型数据、... 随着计算机网络的飞速发展,各行各业每天都产生大量数据。为了大量数据中提取有效信息,衍生了数据挖掘技术。聚类分析是数据挖掘领域的一项重要工具,广泛应用于不同领域,比如模式识别、医药、统计学等。现实生活中的数据有数值型数据、分类型数据和混合型数据。基于此,针对这三种数据分别介绍k-means、k-modes和k-prototype算法,以提高聚类分析效率。 展开更多
关键词 聚类分析 K-MEANS算法 k-modes算法 k-prototype算法
下载PDF
可能性匹配知识迁移原型聚类算法 被引量:1
17
作者 聂飞 高艳丽 +1 位作者 邓赵红 王士同 《智能系统学报》 CSCD 北大核心 2020年第5期978-989,共12页
针对迁移原型聚类的优化问题,本文以模糊知识匹配迁移原型聚类为基础,介绍了聚类场景中从源域到目标域的迁移学习机制,明确了源域聚类中心辅助目标域得到更好的聚类效果。但目前此类迁移机制依然面临如下的挑战:1)如何克服已有迁移原型... 针对迁移原型聚类的优化问题,本文以模糊知识匹配迁移原型聚类为基础,介绍了聚类场景中从源域到目标域的迁移学习机制,明确了源域聚类中心辅助目标域得到更好的聚类效果。但目前此类迁移机制依然面临如下的挑战:1)如何克服已有迁移原型聚类方法中不同类别间的知识强制性匹配带来的负作用。2)当源域与目标域相似度较低时,如何避免模糊强制性匹配的不合理性以及过于依赖源域知识的缺陷被放大。为此,研究了一种新的迁移原型聚类机制,即可能性匹配知识迁移原型机制,并基于此实现了2个具体的迁移聚类算法。借鉴可能性匹配的思想,该算法可以自动选择和偏重有用的源域知识,克服了源域和目标域之间的强制性匹配限制,具有较好的可调节性。研究结果表明:在不同迁移场景下模拟数据集和真实NG20groups数据集上的实验研究表明,提出的算法较已有的相关算法展现了更好的性能。 展开更多
关键词 迁移原型聚类 迁移学习机制 强制性匹配 可能性匹配 原型聚类 可调节性
下载PDF
混合类型数据的聚类算法综述
18
作者 陈绪 严金戈 《信息与电脑》 2018年第7期136-138,共3页
在所有数据挖掘的算法中,聚类算法尤为重要。在实际应用中,数据大多是混合型的数据,既包含数值型,又包含分类型数据。因此,对混合数据进行聚类分析越来越重要。笔者首先介绍了聚类的定义,然后详细阐述了K-prototype聚类算法的基本原理,... 在所有数据挖掘的算法中,聚类算法尤为重要。在实际应用中,数据大多是混合型的数据,既包含数值型,又包含分类型数据。因此,对混合数据进行聚类分析越来越重要。笔者首先介绍了聚类的定义,然后详细阐述了K-prototype聚类算法的基本原理,最后详细介绍了近年来各学者对混合类型数据的聚类算法的研究现状和其具体应用。 展开更多
关键词 混合数据类型 聚类 数据挖掘 K-prototype聚类算法
下载PDF
一种采用直方图小波变换的纹理分割算法
19
作者 付金仙 吴波 《上饶师范学院学报》 2007年第3期44-47,55,共5页
提出了一种采用直方图小波变换获得初始聚类原型的图像纹理分割模糊算法;多纹理图像采用自相关函数作为纹理测度,再对图像自相关函数直方图作小波多分辨分析得到初始聚类原型,利用模糊C-均值聚类算法进行纹理分割;对合成纹理图像的实验... 提出了一种采用直方图小波变换获得初始聚类原型的图像纹理分割模糊算法;多纹理图像采用自相关函数作为纹理测度,再对图像自相关函数直方图作小波多分辨分析得到初始聚类原型,利用模糊C-均值聚类算法进行纹理分割;对合成纹理图像的实验结果表明了该算法的有效性。 展开更多
关键词 小波变换 聚类原型 模糊C-均值聚类
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部