期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
一种基于势能模型的数据流聚类算法 被引量:3
1
作者 舒越 解庆 +1 位作者 刘永坚 唐伶俐 《计算机应用与软件》 北大核心 2022年第11期222-230,237,共10页
传统的数据流聚类算法大部分将距离作为相似度度量标准,这造成对噪点敏感的问题,聚类效果不理想。针对这种情况,提出一种基于势能模型的数据流聚类算法PHAStream,该算法结合在线/离线两阶段数据流聚类框架和基于势能模型的层次聚类算法P... 传统的数据流聚类算法大部分将距离作为相似度度量标准,这造成对噪点敏感的问题,聚类效果不理想。针对这种情况,提出一种基于势能模型的数据流聚类算法PHAStream,该算法结合在线/离线两阶段数据流聚类框架和基于势能模型的层次聚类算法PHA,可以有效处理噪点问题。初始化阶段使用PHA聚类算法得到初始微簇;在线阶段,对每个新到达的数据点,采用融合势能和距离的相似度度量标准来更新微簇,每隔一段时间采取剪枝策略删除过期的微簇,并调整所有微簇的类型;离线阶段,对所有正常微簇使用改进的PHA聚类算法得到最终聚类结果。在两组真实数据集上的对比实验表明,PHAStream算法可以有效提高聚类质量、聚类纯度和时间效率。 展开更多
关键词 数据挖掘 数据流聚类 势能场模型 数据概要
下载PDF
基于数据概要描述的分布式数据流聚类模型与算法 被引量:4
2
作者 毛国君 曹永存 《计算机科学》 CSCD 北大核心 2013年第6期187-191,202,共6页
数据流挖掘可有效解决大容量流式数据的知识发现问题,并已得到广泛研究。数据流的一个典型的例子是传感器采集的流式数据。然而,随着传感器网络的应用普及,这些流式数据在很多情况下是分布式采集和管理的,这就必然导致分布式地挖掘数据... 数据流挖掘可有效解决大容量流式数据的知识发现问题,并已得到广泛研究。数据流的一个典型的例子是传感器采集的流式数据。然而,随着传感器网络的应用普及,这些流式数据在很多情况下是分布式采集和管理的,这就必然导致分布式地挖掘数据流的需求。分布式数据流挖掘的最大障碍是由分布式而导致的挖掘质量或者效率问题。为适应分布式数据流的聚类挖掘,探讨了分布式数据流的挖掘模型,并且基于该模型设计了对应的概要数据结构和关键的挖掘算法,给出了算法的理论评估或者实验验证。实验说明,提出的模型和算法可以有效地减少数据通信代价,并且能保证较高的全局模式的聚类质量。 展开更多
关键词 分布式数据 数据概要 增量式聚类 全局模式
下载PDF
基于多虚拟矩阵的网络流估计算法 被引量:1
3
作者 张毅卜 夏靖波 +1 位作者 任高明 钟赟 《计算机工程与设计》 北大核心 2016年第4期847-850,857,共5页
针对现有PMC算法测量精度较低的缺点,提出一种基于多虚拟矩阵的网络流估计算法。运用多个哈希函数对数据包进行哈希映射,对应生成多个虚拟矩阵,通过对生成的虚拟矩阵按位取交集,有效提高算法的准确率。实验结果表明,在存储空间相同的条... 针对现有PMC算法测量精度较低的缺点,提出一种基于多虚拟矩阵的网络流估计算法。运用多个哈希函数对数据包进行哈希映射,对应生成多个虚拟矩阵,通过对生成的虚拟矩阵按位取交集,有效提高算法的准确率。实验结果表明,在存储空间相同的条件下,该算法测量精度更高,适用性更好,能够适应当下的高速网络环境。 展开更多
关键词 网络流估算 虚拟矩阵 概率计算 数据概要 哈希函数
下载PDF
基于“C藤”Pair Copula的高维OLAP查询建模方法研究
4
作者 倪志伟 王超 高雅卓 《计算机科学》 CSCD 北大核心 2013年第9期163-168,共6页
信息爆炸造成的数据仓库维度的急剧增加,大大影响了OLAP查询模型的精度和效率。首次将数理统计学中的"C藤"Pair Copula引入到OLAP查询建模的研究中,有效地解决了高维OLAP查询建模时的"维数灾难"问题,并设计了针对... 信息爆炸造成的数据仓库维度的急剧增加,大大影响了OLAP查询模型的精度和效率。首次将数理统计学中的"C藤"Pair Copula引入到OLAP查询建模的研究中,有效地解决了高维OLAP查询建模时的"维数灾难"问题,并设计了针对该模型的参数估计方法以提取数据概要知识。实验分析表明与传统方法相比,基于Pair Copula方法的模型可以在保证OLAP的查询精度的基础上减少数据立方体的存储空间,并且在高维数据环境下具有更高的查询效率。 展开更多
关键词 OLAP近似查询 数据立方体 数据概要 PAIR COPULA C藤
下载PDF
网络流量测量中的Sketch方法
5
作者 任高明 《电子世界》 2020年第12期122-123,共2页
网络流量测量是人们认识网络行为规律,确保网络健康运行的基础。数据概要则是网络流量测量中的关键技术之一。论文在分析高链路速率、海量数据背景下流量测量面临困难的基础上,着重梳理数据概要中的核心技术--Sketch类方法在流量测量中... 网络流量测量是人们认识网络行为规律,确保网络健康运行的基础。数据概要则是网络流量测量中的关键技术之一。论文在分析高链路速率、海量数据背景下流量测量面临困难的基础上,着重梳理数据概要中的核心技术--Sketch类方法在流量测量中的应用,分析各方法的优缺点,并对未来可能的重点研究方向进行展望。 展开更多
关键词 网络流量测量 数据概要 海量数据 面临困难 链路速率 行为规律 重点研究方向 核心技术
下载PDF
一种有抗体免疫的云模型数据流聚类算法仿真
6
作者 邓华军 周士芸 《科技通报》 北大核心 2013年第9期206-208,共3页
云模型是云理论的核心,数据流聚类算法在云模型中有较好的应用前景,但也面临着聚类效率、聚类适应性的难题,为此本文提出了一种有抗体免疫的云模型数据流聚类算法。通过设置加权期望值、熵等参数形成云数据特有的数据概要结构,作为抗体... 云模型是云理论的核心,数据流聚类算法在云模型中有较好的应用前景,但也面临着聚类效率、聚类适应性的难题,为此本文提出了一种有抗体免疫的云模型数据流聚类算法。通过设置加权期望值、熵等参数形成云数据特有的数据概要结构,作为抗体代入人工免疫算法中;利用衰减函数和时刻权重来定量表现不同时刻的数据的重要性程度,并以抗体期望克服率为特征值以维持抗体的多样性,采用淘汰法确保最后的数据概要结构更符合云模型数据流的本质特征。实验表明,该算法在云模型数据流中的聚类处理速度和聚类效率均优于传统算法,具有一定的应用价值。 展开更多
关键词 云模型 数据流聚类 人工免疫原理 数据概要结构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部