期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
一种新的数据流模糊聚类方法 被引量:22
1
作者 孙力娟 陈小东 +1 位作者 韩崇 郭剑 《电子与信息学报》 EI CSCD 北大核心 2015年第7期1620-1625,共6页
针对数据流上的聚类任务受到时间、空间限制等问题,该文提出一种基于权值衰减的数据流模糊微簇聚类算法(WDSMC)。该算法使用改进的带权值的模糊C均值算法进行处理,并采用微簇结构和权值时间衰减结构提高聚类质量。实验表明,相对于现有... 针对数据流上的聚类任务受到时间、空间限制等问题,该文提出一种基于权值衰减的数据流模糊微簇聚类算法(WDSMC)。该算法使用改进的带权值的模糊C均值算法进行处理,并采用微簇结构和权值时间衰减结构提高聚类质量。实验表明,相对于现有的数据流加权模糊C均值聚类(SWFCM)算法和Stream KM++算法而言,WDSMC算法具有更好的聚类精度。 展开更多
关键词 数据挖掘 数据流 模糊C均值聚类 权值衰减 微簇聚类
下载PDF
On Density-Based Data Streams Clustering Algorithms: A Survey 被引量:10
2
作者 Amineh Amini Teh Ying Wah Hadi Saboohi 《Journal of Computer Science & Technology》 SCIE EI CSCD 2014年第1期116-141,共26页
Clustering data streams has drawn lots of attention in the last few years due to their ever-growing presence. Data streams put additional challenges on clustering such as limited time and memory and one pass clusterin... Clustering data streams has drawn lots of attention in the last few years due to their ever-growing presence. Data streams put additional challenges on clustering such as limited time and memory and one pass clustering. Furthermore, discovering clusters with arbitrary shapes is very important in data stream applications. Data streams are infinite and evolving over time, and we do not have any knowledge about the number of clusters. In a data stream environment due to various factors, some noise appears occasionally. Density-based method is a remarkable class in clustering data streams, which has the ability to discover arbitrary shape clusters and to detect noise. Furthermore, it does not need the nmnber of clusters in advance. Due to data stream characteristics, the traditional density-based clustering is not applicable. Recently, a lot of density-based clustering algorithms are extended for data streams. The main idea in these algorithms is using density- based methods in the clustering process and at the same time overcoming the constraints, which are put out by data streanFs nature. The purpose of this paper is to shed light on some algorithms in the literature on density-based clustering over data streams. We not only summarize the main density-based clustering algorithms on data streams, discuss their uniqueness and limitations, but also explain how they address the challenges in clustering data streams. Moreover, we investigate the evaluation metrics used in validating cluster quality and measuring algorithms' performance. It is hoped that this survey will serve as a steppingstone for researchers studying data streams clustering, particularly density-based algorithms. 展开更多
关键词 data stream density-based clustering grid-based clustering micro-clustering
原文传递
具有层次结构的K-means聚类算法研究 被引量:7
3
作者 王吉源 孟祥茂 廖列法 《微电子学与计算机》 CSCD 北大核心 2015年第12期63-67,共5页
提出一种改进的基于层次微聚类的K-means聚类算法,并重新构造准则函数S(k).通过层次聚类生成一颗层次聚类树,根据微聚类思想在该聚类树上动态更新中心点,利用改进的准则函数S(k)选择合理聚类个数K和对应中心点,使得聚类结果达到全局最优... 提出一种改进的基于层次微聚类的K-means聚类算法,并重新构造准则函数S(k).通过层次聚类生成一颗层次聚类树,根据微聚类思想在该聚类树上动态更新中心点,利用改进的准则函数S(k)选择合理聚类个数K和对应中心点,使得聚类结果达到全局最优.标准数据集上的实验结果表明,与传统K-means聚类算法相比,改进后K-means聚类算法的聚类效果和聚类精度都有较大提高. 展开更多
关键词 K-MEANS聚类 层次结构 微聚类 准则函数 全局最优
下载PDF
结合微聚类和主动学习的流分类方法
4
作者 尹春勇 陈双双 《计算机工程与应用》 CSCD 北大核心 2023年第20期254-265,共12页
数据流分类是数据挖掘中重要的研究内容,但是数据流中的概念漂移和标记成本昂贵的问题给分类带来了巨大的挑战。现有的研究工作大多采用基于主动学习的在线分类技术,一定程度上缓解了概念漂移和有限标签的问题,但是这些方法的分类效率较... 数据流分类是数据挖掘中重要的研究内容,但是数据流中的概念漂移和标记成本昂贵的问题给分类带来了巨大的挑战。现有的研究工作大多采用基于主动学习的在线分类技术,一定程度上缓解了概念漂移和有限标签的问题,但是这些方法的分类效率较低,并且忽略了内存开销的问题。针对这些问题提出了一种结合微聚类和主动学习的流分类方法(a data stream classification method combining micro-clustering and active learning,CALC)。提出一种新的主动学习混合查询策略,将其与基于错误的表示学习相结合,从而在维护过程中衡量每个微聚类的重要性,通过动态维护一组微聚类以适应数据流中产生的概念漂移。采用基于微聚类的惰性学习方法,实现对数据流的分类,并完成对缓存微聚类的在线更新。使用三个真实数据集和三个人工合成数据集进行实验,结果显示CALC在分类准确率和内存开销方面优于现有的数据流分类算法。与基准模型(online reliable semi-supervised learning on evolving data streams,ORSL)相比,CALC的分类准确率有一定的提升,在六个数据集上的平均准确率分别提高了5.07、2.41、1.04、1.03、3.47、0.64个百分点。 展开更多
关键词 主动学习 数据流分类 微聚类 概念漂移
下载PDF
VoIP压缩码流说话人识别研究 被引量:2
5
作者 唐晖 李弼程 +1 位作者 屈丹 张连海 《计算机工程》 CAS CSCD 北大核心 2009年第7期180-182,共3页
研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GM... 研究基于微聚类算法的VoIP压缩码流说话人识别算法。给出直接从G.729,G.723.1(6.3Kb/s),G.723.1(5.3Kb/s)压缩语音的码流中提取识别参数,以微聚类算法作为识别结构的说话人识别算法。实验结果表明,对比在压缩码流中使用同样识别参数的GMM模型,微聚类算法在识别正确率和效率上都有很大的提高。 展开更多
关键词 说话人识别 微聚类 压缩参数
下载PDF
SCMR:a semantic-based coherence micro-cluster recognition algorithm for hybrid web data stream 被引量:2
6
作者 王珉 Wang Yongbin Li Ying 《High Technology Letters》 EI CAS 2016年第2期224-232,共9页
Data aggregation from various web sources is very significant for web data analysis domain. In ad- dition, the recognition of coherence micro cluster is one of the most interesting issues in the field of data aggregat... Data aggregation from various web sources is very significant for web data analysis domain. In ad- dition, the recognition of coherence micro cluster is one of the most interesting issues in the field of data aggregation. Until now, many algorithms have been proposed to work on this issue. However, the deficiency of these solutions is that they cannot recognize the micro-cluster data stream accurately. A semantic-based coherent micro-cluster recognition algorithm for hybrid web data stream is nronosed.Firstly, an objective function is proposed to recognize the coherence micro-cluster and then the coher- ence micro-cluster recognition algorithm for hybrid web data stream based on semantic is raised. Fi- 展开更多
关键词 hybrid web data stream coherence micro-clustering entity unified object coher-ence semantic computing
下载PDF
高维数据流的聚类离群点检测算法研究 被引量:2
7
作者 程艳 苗永春 《江西师范大学学报(自然科学版)》 CAS 北大核心 2014年第5期449-453,共5页
针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信... 针对基于聚类的离群点检测算法在处理高维数据流时效率和精确度低的问题,提出一种高维数据流的聚类离群点检测(CODHD-Stream)算法.该算法首先采用滑动窗口技术对数据流划分,然后通过属性约简算法对高维数据集降维;其次运用基于距离的信息熵过滤机制的K-means聚类算法将数据集划分成微聚类,并检测微聚类的离群点.通过实验结果分析表明:该算法可以有效提高高维数据流中离群点检测的效率和准确度. 展开更多
关键词 高维数据流 滑动窗口 属性约简 K-均值 微聚类 信息熵 离群点检测
下载PDF
限制条件下的空间聚类分析——改进的K-中心点聚类算法
8
作者 余晓敏 陈云浩 《测绘信息与工程》 2006年第3期35-37,共3页
针对空间聚类过程中存在障碍实体的问题,提出了改进的K-中心点空间聚类算法,提高了算法的执行效率,解决了限制条件下空间聚类问题,使得聚类结果更具实用性。
关键词 空间聚类 限制条件 K-中心点 微聚类
下载PDF
一种基于微簇的分布式聚类算法
9
作者 何青松 吴承荣 曾剑平 《计算机应用与软件》 CSCD 2011年第1期270-271,297,共3页
由于信息化的不断拓展,一方面数据广泛分布于不同的部门,各部门需求在不泄漏自身数据的情况下进行充分合作;另一方面由于数据量的巨大,集中式的运算已经很难满足各种应用的需求。在这一个背景下,分布式数据挖掘已经成一个研究的热点,通... 由于信息化的不断拓展,一方面数据广泛分布于不同的部门,各部门需求在不泄漏自身数据的情况下进行充分合作;另一方面由于数据量的巨大,集中式的运算已经很难满足各种应用的需求。在这一个背景下,分布式数据挖掘已经成一个研究的热点,通过将系统划分为中心节点和边缘节点,分层管理并减少数据交流给系统带来的负担;文章还将给出微簇的定义,并在边缘节点中进行算法的描述。实验说明在保证各部门的数据不泄漏的情况下,分布式算法具有跟集中式的K-means算法相近的准确率,说明算法具有可行性和有效性。 展开更多
关键词 分布式聚类 微簇 中心一边缘框架
下载PDF
城市化地区不同生境下中小型土壤动物群落结构特征 被引量:32
10
作者 秦钟 章家恩 李庆芳 《应用生态学报》 CAS CSCD 北大核心 2009年第12期3049-3056,共8页
2007年5月(春季)、7月(夏季)、11月(秋季)和2008年1月(冬季),对广州市天河区3种土地利用类型(林地、人工绿地、农田)下6个不同生境的中小型土壤动物群落的结构特征和季节变化进行了调查研究.结果表明:研究区不同生境下中小型土壤动物的... 2007年5月(春季)、7月(夏季)、11月(秋季)和2008年1月(冬季),对广州市天河区3种土地利用类型(林地、人工绿地、农田)下6个不同生境的中小型土壤动物群落的结构特征和季节变化进行了调查研究.结果表明:研究区不同生境下中小型土壤动物的水平分布有所不同.调查期间,华南农业大学树木园捕获的中小型土壤动物个体数最多,达1286个,农用地中捕获的个体数较少,以凤凰街农用地中小型土壤动物的个体数和类群数最低;研究区各样地中小型土壤动物的个体数总量有明显的季节消长,由高到低依次为:秋季(1815)>春季(1623)>冬季(1365)>夏季(1276).聚类与排序结果也说明不同生境样地的中小型土壤动物的群落结构组成随季节不同而呈现出明显的变化规律,同一季节不同生境的中小型土壤动物群落的组成和结构差异与人为干扰程度、土壤环境因素等有关. 展开更多
关键词 中小型土壤动物 生境 聚类与排序 城市化
原文传递
面向微电网集群的多端口能量路由器及其分布式控制策略 被引量:6
11
作者 郁家麟 肖龙海 +4 位作者 胡舟 赵玉勇 聂建波 谢晔源 段军 《电气传动》 2021年第13期46-51,共6页
能量路由器是实现微电网集群化的核心装备,为了协调控制各端口的功率潮流,传统的集中式控制多依赖于集中通信,降低了系统的可靠性和灵活性。针对此问题提出了一种能量路由器的分布式控制策略,无需中央控制器实现各端口功率的自主分配。... 能量路由器是实现微电网集群化的核心装备,为了协调控制各端口的功率潮流,传统的集中式控制多依赖于集中通信,降低了系统的可靠性和灵活性。针对此问题提出了一种能量路由器的分布式控制策略,无需中央控制器实现各端口功率的自主分配。能量路由器采用共直流母线结构,各端口为独立的三相电压源型变流器(VSC),通信信道仅存在于各端口与所连接微电网之间,无需集中通信和相互通信。各微电网根据自身状态向能量路由器发出功率调控需求申请和紧需度,各端口则以直流母线电压为公共信息,自主确定所在端口的折扣率,在保证直流母线电压稳定的前提下实现各端口的功率交换。最后通过Matlab/Simulink仿真验证了所提方案的有效性。 展开更多
关键词 微电网集群 能量路由器 分布式控制 折扣率 紧需度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部