期刊文献+
共找到69篇文章
< 1 2 4 >
每页显示 20 50 100
YCgCr与YCgCb颜色空间的肤色检测 被引量:15
1
作者 张争珍 石跃祥 《计算机工程与应用》 CSCD 北大核心 2010年第34期167-170,共4页
自然界存在很多和肤色相似的颜色,给人脸检测带来了很多的困难。提出了结合Cg-Cb颜色空间的圆形肤色聚类分布和Cg-Cr颜色空间的平行四边形肤色聚类分布的肤色检测法。实验结果发现在人脸处于复杂背景的条件下,该方法简单易行,检测速度快... 自然界存在很多和肤色相似的颜色,给人脸检测带来了很多的困难。提出了结合Cg-Cb颜色空间的圆形肤色聚类分布和Cg-Cr颜色空间的平行四边形肤色聚类分布的肤色检测法。实验结果发现在人脸处于复杂背景的条件下,该方法简单易行,检测速度快,能去除大量的非肤色,并且极好地保留了肤色。 展开更多
关键词 YCGCR颜色空间 YCgCb颜色空间 分布 人脸检测
下载PDF
基于自助平均的朴素贝叶斯文本分类器 被引量:5
2
作者 白莉媛 黄晖 +1 位作者 刘素华 阎秋玲 《计算机工程》 CAS CSCD 北大核心 2007年第15期190-192,共3页
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对序列构造规模相当的样本集,并将估计出的参数... 针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题,在概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对序列构造规模相当的样本集,并将估计出的参数的平均值作为训练得到的参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,该文提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。 展开更多
关键词 分布 文本分 朴素贝叶斯分 自助平均
下载PDF
球边界偏移判别结合空间分布聚类的故障诊断 被引量:3
3
作者 王力敏 金敏 《电子测量与仪器学报》 CSCD 2012年第10期877-882,共6页
针对目前支持向量机和支持向量数据描述多分类方法,无法有效处理新类别样本的难题,提出一种自适应的故障诊断方法。首先,在支持向量数据描述多分类器中,增加一种新的球边界偏移判别条件,使诊断模型具有识别新的未知样本的能力;其次,根... 针对目前支持向量机和支持向量数据描述多分类方法,无法有效处理新类别样本的难题,提出一种自适应的故障诊断方法。首先,在支持向量数据描述多分类器中,增加一种新的球边界偏移判别条件,使诊断模型具有识别新的未知样本的能力;其次,根据未知样本的空间分布情况,进行样本的聚类学习,建立新的故障类别描述域,完成诊断模型的自更新。以混凝土泵车柱塞泵为研究对象进行仿真实验,结果表明:与传统多分类方法相比,该方法有更好的识别精度,特别是测试样本包含未知类别故障时,识别精度仍大于95%,显示了更好的适应能力。 展开更多
关键词 球边界偏移判别 空间分布 故障诊断
下载PDF
内蒙古啮齿动物分布聚类区初步探讨 被引量:1
4
作者 赵天飙 《中国媒介生物学及控制杂志》 CAS CSCD 1995年第1期28-32,共5页
本文将内蒙古55种啮齿动物在本自治区8个动物地理省中的有或无分布作为二元属性,表征动物地理省间种类组成的相似性用联合系数表示,并以类平均法进行聚类。根据聚类结果,讨论了分布聚类与动物地理区划的关系。
关键词 分布 地理分布 啮齿目
下载PDF
基于Bootstrap Averaging的贝叶斯分类算法 被引量:1
5
作者 白莉媛 肖乐 +1 位作者 黄晖 丁伟 《计算机应用与软件》 CSCD 北大核心 2007年第9期189-190,199,共3页
针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题。在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计... 针对单词簇上训练朴素贝叶斯文本分类器概率估计偏差较大所导致的分类精度较低问题。在使用概率分布聚类算法得到的单词簇的基础上,根据单词与簇间互信息建立有序单词子序列,采用有放回随机抽样对单词序列构造规模相当的样本集并将估计出的参数的平均值作为训练得到的最终参数对未知文本进行分类。公共文本实验数据集上的实验结果表明,提出的训练方法相对于传统的朴素贝叶斯分类器训练方法能够获得更高的分类精度且过程相对简单。 展开更多
关键词 概率分布 文本分 朴素贝叶斯分 自助平均
下载PDF
基于抽样的多模态分布聚类算法研究 被引量:1
6
作者 刘建伟 李双成 罗雄麟 《计算机工程》 CAS CSCD 北大核心 2010年第24期153-155,共3页
针对处理高维海量数据时聚类算法用时太长的问题,提出基于抽样的多模态分布聚类优化算法,该算法随机地抽取少量样本进行循环校正,减少聚类时间,通过大量实验找出算法的最优配置参数,结果证明,该优化算法以11.8%的聚类运行时间得到了88%... 针对处理高维海量数据时聚类算法用时太长的问题,提出基于抽样的多模态分布聚类优化算法,该算法随机地抽取少量样本进行循环校正,减少聚类时间,通过大量实验找出算法的最优配置参数,结果证明,该优化算法以11.8%的聚类运行时间得到了88%的聚类准确性,为高时间成本的应用环境提供了最优的聚类方案。 展开更多
关键词 多模态分布 高时间成本 最优参数
下载PDF
利用S变换局部奇异值的同调机组识别方法
7
作者 倪艳荣 徐珂 王卫东 《电测与仪表》 北大核心 2018年第11期45-51,共7页
文中提出一种利用S变换局部奇异值的同调机组识别方法。将广域测量系统(Wide Area Measurement System,WAMS)采集到的系统发电机功角信息进行S变换,得到每台发电机的时频信息模值矩阵,将矩阵分割成块,计算各个子块的最大奇异值,利用时... 文中提出一种利用S变换局部奇异值的同调机组识别方法。将广域测量系统(Wide Area Measurement System,WAMS)采集到的系统发电机功角信息进行S变换,得到每台发电机的时频信息模值矩阵,将矩阵分割成块,计算各个子块的最大奇异值,利用时频信息模值矩阵中各个子块最大奇异值构造机组特征矩阵,采用分布聚类法对特征矩阵进行聚类分群。IEEE-39节点系统算例表明,该方法能够有效提取功角信息特征,具有很强的抗噪性,能够在不同故障类型下准确识别同调机组。 展开更多
关键词 广域测量系统 同调机组 S变换 分布
下载PDF
面向海量用户用电特性感知的分布式聚类算法 被引量:67
8
作者 朱文俊 王毅 +3 位作者 罗敏 林国营 程将南 康重庆 《电力系统自动化》 EI CSCD 北大核心 2016年第12期21-27,共7页
智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集... 智能电表的普及促进了配用电大数据的发展。通过对用户用电数据的挖掘和用电特性的感知,能够有效识别用户用电模式、评估需求响应潜力、指导电价制定等。然而,用户用电数据一方面随时间不断更新,增长迅速,呈海量态势;另一方面,数据采集点分布在用户侧,具有极强的分散性。针对海量、分散的用电数据带来的挑战,文中提出一种新的分布式聚类算法。首先利用自适应k-means聚类算法对分布在各区域的用电数据进行局部聚类分析,提取各局部数据的典型负荷曲线,构建局部模型;然后利用传统聚类算法对获取的局部模型进行二次聚类分析,获取全局的典型负荷曲线,构建全局模型;最后向局部数据中心反馈全局聚类结果,实现全局聚类分析。通过爱尔兰实际量测用电数据证明了所提出算法的有效性。 展开更多
关键词 分布 自适应k-means 算法 大数据 负荷曲线 态势感知
下载PDF
基于MapReduce的Canopy-Kmeans改进算法 被引量:65
9
作者 毛典辉 《计算机工程与应用》 CSCD 2012年第27期22-26,68,共6页
针对分布式Canopy-Kmeans算法中Canopy选取的随机性问题,采用"最小最大原则"对该算法进行了改进,避免了Cannopy选取的盲目性;采用MapReduce并行计算框架对算法进行了并行扩展,使之能够充分利用集群的计算和存储能力,从而适应... 针对分布式Canopy-Kmeans算法中Canopy选取的随机性问题,采用"最小最大原则"对该算法进行了改进,避免了Cannopy选取的盲目性;采用MapReduce并行计算框架对算法进行了并行扩展,使之能够充分利用集群的计算和存储能力,从而适应海量数据的应用场景。以海量互联网新闻信息聚类作为应用背景,对改进后的算法进行了实验分析。实验结果表明:该方法较随机挑选Canopy策略在分类准确率以及抗噪能力上都明显提高,而且在处理海量数据时表现出较大的性能优势。 展开更多
关键词 Canopy-Kmeans算法 MAPREDUCE 分布
下载PDF
基于分位数半径动态K-means的分布式负荷聚类算法 被引量:27
10
作者 刘季昂 刘友波 +1 位作者 程明畅 余莉娜 《电力系统保护与控制》 EI CSCD 北大核心 2019年第24期15-22,共8页
针对电力负荷曲线聚类中传统的K-means算法对初始值敏感以及需给定类数目的缺陷,将一种基于分位数半径的动态K-means算法应用到日负荷曲线的聚类分析中,并进行了分布式的改进以优化计算效率。此算法结合了两种思想:分布式聚类中的局部... 针对电力负荷曲线聚类中传统的K-means算法对初始值敏感以及需给定类数目的缺陷,将一种基于分位数半径的动态K-means算法应用到日负荷曲线的聚类分析中,并进行了分布式的改进以优化计算效率。此算法结合了两种思想:分布式聚类中的局部聚类与全局聚类,以及层次K-means中以多次k取定值时K-means运算所得到的中心点来表示该类。将多次的K-means运算分配到不同子站点,并使每次K-means运算中k不断改变。再从类的几何特征出发,引入了分位数半径的概念,规定样本点与各类中心点间距的分位数表示该类的半径,于主站点中对各类的中心点间距与类的半径进行大小比较,并进行筛选融合来获得新的类,从而实现较为快速地识别类数目,并且得到新的聚类初始中心与结果。最终以某地区606个用户某月的日负荷数据为研究对象,验证了该算法在电力负荷曲线聚类分析中的有效性。 展开更多
关键词 电力大数据 分析 负荷曲线 分位数半径 分布
下载PDF
一种基于局部密度的分布式聚类挖掘算法 被引量:19
11
作者 倪巍伟 陈耿 +1 位作者 吴英杰 孙志挥 《软件学报》 EI CSCD 北大核心 2008年第9期2339-2348,共10页
分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的... 分布式聚类挖掘技术是解决数据集分布环境下聚类挖掘问题的有效方法.针对数据水平分布情况,在已有分布式密度聚类算法DBDC(density based distributed clustering)的基础上,引入局部密度聚类和密度吸引子等概念,提出一种基于局部密度的分布式聚类算法——LDBDC(local density based distributed clustering).算法适用于含噪声数据和数据分布异常情况,对高雏数据有着良好的适应性.理论分析和实验结果表明,LDBDC算法在聚类质量和算法效率方面优于已有的DBDC算法和SDBDC(scalable dellsity-based distributed clustering)算法.算法是有效、可行的. 展开更多
关键词 分布 局部密度局部模型 密度吸引子 高维数据
下载PDF
基于向量内积不等式的分布式k均值聚类算法 被引量:15
12
作者 倪巍伟 陆介平 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第9期1493-1497,共5页
聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这... 聚类分析是数据挖掘领域的一项重要研究课题.随着数据量的急剧增加,针对大数据集的聚类分析成为一个难点.虽然k均值算法具有易实现、复杂度与数据集大小成线性关系的优点,将其应用于大数据集时仍然存在效率低的问题.分布式聚类是解决这一问题的有效方法.在已有分布式聚类算法kDMeans基础上,结合向量内积不等式关系对算法加以优化,提出分布式聚类算法kDCBIP.理论分析和实验结果表明,算法kDCBIP优于kDMeans,可以有效地解决大数据集聚类问题,算法是有效可行的. 展开更多
关键词 分布 数据点的模 向量内积 向量内积不等式
下载PDF
分布式环境中聚类问题算法研究综述 被引量:13
13
作者 海沫 张书云 马燕林 《计算机应用研究》 CSCD 北大核心 2013年第9期2561-2564,共4页
传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储的数据集中提取分类模式,因此能满足此需求。针对分布式聚类算法进行综述和分析。首先对现有的分布式... 传统的集中式聚类是对集中存放在单个站点的数据集进行聚类,但不能解决数据分布存储环境下的聚类问题,而分布式聚类算法是从分布存储的数据集中提取分类模式,因此能满足此需求。针对分布式聚类算法进行综述和分析。首先对现有的分布式聚类算法进行了分类,然后对每类算法的基本思想和优缺点进行了比较,最后采用Iris和Wine两个数据集对几种分布式聚类算法从聚类精度和聚类时间两方面进行了比较。 展开更多
关键词 集中式 分布 精度 时间
下载PDF
一种基于密度的分布式聚类算法 被引量:10
14
作者 郑苗苗 吉根林 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第5期536-543,共8页
对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低... 对基于密度的分布式聚类算法DBDC(density based distributed clustering)进行改进,提出了一种基于密度的分布式聚类算法DBDC*.该算法在局部筛选代表点时结合贝叶斯信息准则BIC,得到少量精准反映局部站点数据分布的BIC核心点,有效降低了分布式聚类过程中的数据通信量,全局聚类时综合考虑了各站点数据的分布情况.实验结果表明,算法DBDC*的效率优于DBDC,聚类效果好. 展开更多
关键词 分布 基于密度的算法(DBSCAN) 分布算法(DBDC)
下载PDF
基于大数据平台的居民负荷变尺度画像技术实现与应用 被引量:10
15
作者 孙煜华 吴永欢 +4 位作者 林志波 梁林森 蔡珑 顾洁 金之俭 《供用电》 2019年第8期41-48,共8页
传统的负荷曲线描述方法难以全面描述负荷变化特征。文章尝试采用用户画像技术进行居民负荷多尺度立体化的用电特性研究。首先,基于大数据平台中的可用数据资源,建立了表征居民负荷用电特性的标签体系。为了快速高效地获取各类典型用户... 传统的负荷曲线描述方法难以全面描述负荷变化特征。文章尝试采用用户画像技术进行居民负荷多尺度立体化的用电特性研究。首先,基于大数据平台中的可用数据资源,建立了表征居民负荷用电特性的标签体系。为了快速高效地获取各类典型用户特征,应用标签体系,在大数据平台支撑下,应用分布式聚类算法对海量居民用户用电数据进行聚类分析。最后,针对每类用户,文章绘制了四季的典型日和典型月负荷曲线以及年持续负荷曲线并进行了对比,同时分析了每类用户的负荷波动率和需求响应水平,以构建包含用户的用电时序规律和用电弹性特征的变时间尺度用户画像。分析结果能够可视化地描述居民负荷的时间分布特性及用户用电特性,可为合理制定电价套餐及优化用电模式提供参考。 展开更多
关键词 居民负荷 大数据平台 变尺度画像 分布 负荷曲线
下载PDF
基于MapReduce的分布式网络数据聚类算法 被引量:9
16
作者 陈东明 刘健 +1 位作者 王冬琦 徐晓伟 《计算机工程》 CAS CSCD 2013年第7期76-82,共7页
时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利... 时空复杂度较高以及物理机器内存不足,会导致传统聚类算法不能有效地分析处理大规模数据网络。针对该问题,在MapReduce分布式模型的基础上,提出一种网络数据分布式聚类算法。根据MRC理论设计有限MapReduce轮数,控制混洗过程所需时间,利用Map内合并技术对网络流量进行控制,在进行中间结果合并时仅对社团合并,而不考虑社团内部节点,以控制内存开销。使用模拟生成的数据在集群中进行实验,结果表明,当数据规模和集群规模增大时,该算法具有较好的加速比和扩展性。 展开更多
关键词 算法 分布 MapReduce编程模型 数据挖掘 社团结构
下载PDF
DK-Means——分布式聚类算法K-Dmeans的改进 被引量:9
17
作者 郑苗苗 吉根林 《计算机研究与发展》 EI CSCD 北大核心 2007年第z2期84-88,共5页
随着网络的广泛应用,大量的数据将分布存在.由于网络带宽、站点存储量等一系列限制,分布式聚类分析成为具有挑战性的研究课题.人们已经提出了若干分布式聚类方法,但这些方法效率低下.对分布式聚类算法k-Dmeans进行改进,提出了分布式聚... 随着网络的广泛应用,大量的数据将分布存在.由于网络带宽、站点存储量等一系列限制,分布式聚类分析成为具有挑战性的研究课题.人们已经提出了若干分布式聚类方法,但这些方法效率低下.对分布式聚类算法k-Dmeans进行改进,提出了分布式聚类算法Dk-means. 该算法只传送各站点的聚簇信息,有效降低了分布式聚类过程中的数据通信量.理论分析和实验结果表明,算法Dk-means的效率优于k-Dmeans,并且可达到与k-means等效的聚类质量. 展开更多
关键词 分布 K-MEANS k-Dmeans
下载PDF
基于分布式聚类的有向传感器网络移动目标跟踪算法研究 被引量:9
18
作者 左现刚 张志霞 贾蒙 《传感技术学报》 CAS CSCD 北大核心 2016年第7期1096-1101,共6页
针对有向传感器网络DSN(Directional Sensor Networks)中,传感器节点部署数量对目标跟踪精度、网络寿命和能效问题的影响方面,提出了一个分布式聚类算法,该算法在优化活跃传感器和节点的直接通信过程中,由分布式集群来负责协调成员间的... 针对有向传感器网络DSN(Directional Sensor Networks)中,传感器节点部署数量对目标跟踪精度、网络寿命和能效问题的影响方面,提出了一个分布式聚类算法,该算法在优化活跃传感器和节点的直接通信过程中,由分布式集群来负责协调成员间的节点,通过传输给Sink的定位信息及从多个节点聚集的传感数据来准确定位目标的位置。基于该理论的目标跟踪机制,提高了目标跟踪精度、增加了网络寿命和网络剩余能量。并进行了仿真验证,结果表明该方法能实现更高的跟踪性能。 展开更多
关键词 有向传感器网络 目标跟踪 分布 生命时间
下载PDF
基于特征向量的分布式聚类算法 被引量:6
19
作者 李锁花 孙志挥 周晓云 《计算机应用》 CSCD 北大核心 2006年第2期379-382,共4页
提出了一种新的表达数据集的方法———特征向量,它通过坐标和密度描述了某一密集空间,以较少的数据量反映站点数据的分布特性。在此基础上提出了一种基于特征向量的分布式聚类算法———DCBFV(D istributed C lustering Based on Featu... 提出了一种新的表达数据集的方法———特征向量,它通过坐标和密度描述了某一密集空间,以较少的数据量反映站点数据的分布特性。在此基础上提出了一种基于特征向量的分布式聚类算法———DCBFV(D istributed C lustering Based on Feature Vector),该算法可有效降低网络通信量,能够对任意形状分布的数据进行聚类,提高了分布式聚类的时空效率和性能。理论分析和实验结果表明DCBFV是高效可行的。 展开更多
关键词 数据挖掘 分布 特征向量
下载PDF
基于密度的分布式聚类算法研究 被引量:5
20
作者 郑金彬 卓义宝 《计算机工程》 CAS CSCD 北大核心 2008年第17期65-67,70,共4页
大量复杂异构数据分布于各个网络站点上,分布式聚类是海量数据处理的一个重要应用。该文针对基于密度的分布式聚类(DBDC)算法提出一种改进算法,利用局部聚类获取更佳的代表对象,将代表对象集附带相关信息传送至主站点,用增强的基于密度... 大量复杂异构数据分布于各个网络站点上,分布式聚类是海量数据处理的一个重要应用。该文针对基于密度的分布式聚类(DBDC)算法提出一种改进算法,利用局部聚类获取更佳的代表对象,将代表对象集附带相关信息传送至主站点,用增强的基于密度的聚类算法进行全局聚类,并更新子站点聚类。理论分析和实验结果表明,该算法在聚类质量和算法效率方面优于DBDC算法。 展开更多
关键词 数据挖掘 分布 特殊核心对象
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部