期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
高维Turnstile型数据流聚类算法 被引量:6
1
作者 周晓云 张净 孙志挥 《计算机科学》 CSCD 北大核心 2006年第11期14-17,37,共5页
现有数据流聚类算法只能处理Ti me Series和Cash Register型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维Turnstile型数据流的子空间聚类算法HT-Stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜... 现有数据流聚类算法只能处理Ti me Series和Cash Register型数据流,并且应用于高维数据流时其精度不甚理想。提出针对高维Turnstile型数据流的子空间聚类算法HT-Stream,算法对数据空间进行网格划分,在线动态维护网格单元信息,采用倾斜时间窗口存储统计信息,根据用户指定时间跨度离线输出聚类结果。基于真实数据集与仿真数据集的实验表明,算法具有良好的适用性和有效性。 展开更多
关键词 数据流 子空间聚类 高维 倾斜时间窗口
下载PDF
挖掘数据流频繁模式的相关技术和算法研究综述 被引量:6
2
作者 唐懿芳 穆志纯 +1 位作者 张师超 钟达夫 《计算机工程与应用》 CSCD 北大核心 2009年第26期121-125,共5页
数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列... 数据流本身的特点使得静态挖掘方法不再满足要求。国内外学者已提出许多新的挖掘数据流频繁模式的方法和技术。对这些技术和算法进行了综述。首先介绍数据流的概念和特点,分析国内外的研究现状,总结了数据流中挖掘频繁模式的特点,并列出挖掘方法的常用技术和基于这些技术的代表性算法,最后讨论了将来的研究方向。 展开更多
关键词 数据流 频繁模式 概要数据结构 衰减因子 倾斜时间窗口
下载PDF
TWCT-Stream:数据流上的频繁模式挖掘算法 被引量:1
3
作者 庄波 刘希玉 隆坤 《计算机工程与应用》 CSCD 北大核心 2009年第20期147-150,161,共5页
提出一种结合倾斜时间窗的TWCT树结构,可以保存不同时间粒度下频繁模式的完全集,并设计了其顺序更新和删除算法,使其能够存储在外存,从而有效地降低算法的内存空间需求。结合TWCT树结构特点,提出了数据流上的频繁模式挖掘算法TWCT-Stre... 提出一种结合倾斜时间窗的TWCT树结构,可以保存不同时间粒度下频繁模式的完全集,并设计了其顺序更新和删除算法,使其能够存储在外存,从而有效地降低算法的内存空间需求。结合TWCT树结构特点,提出了数据流上的频繁模式挖掘算法TWCT-Stream,其模式生长的TWCT-Growth算法按字典顺序生成频繁模式,以配合TWCT结构的顺序更新。实验证实算法的内存需求低于FP-Stream等同类算法。 展开更多
关键词 数据流挖掘 频繁模式 倾斜时间窗口
下载PDF
一种多维多粒度用户兴趣模型研究 被引量:1
4
作者 陈辉 《小型微型计算机系统》 CSCD 北大核心 2017年第12期2785-2790,共6页
人们在享受网络服务带来便利的同时,也不得不面对"信息过载"和"信息迷航"的问题.发现用户兴趣并推送用户感兴趣资源是解决这一问题的有效途径.通过分析用户兴趣特点,设计了一种多维多粒度用户兴趣模型UIM.该模型采... 人们在享受网络服务带来便利的同时,也不得不面对"信息过载"和"信息迷航"的问题.发现用户兴趣并推送用户感兴趣资源是解决这一问题的有效途径.通过分析用户兴趣特点,设计了一种多维多粒度用户兴趣模型UIM.该模型采用概念分类树维护用户兴趣主题的多粒度性,用倾斜时间窗口维护用户兴趣时间的多粒度性,用时间衰减模型区分用户当前兴趣与历史兴趣的权重.采取增量更新UIM以及对UIM剪枝,保证UIM结构精简与高效,从而可快速查找出用户的top-k兴趣概念.仿真实验结果显示,UIM模型具有存储效率高,可发现用户不同时间窗口内兴趣的特点,其正确性优于其它同类模型. 展开更多
关键词 用户兴趣 层次分类树 倾斜时间窗口 衰减模型
下载PDF
面向数据流的频繁项集挖掘 被引量:1
5
作者 陈凤娟 《洛阳师范学院学报》 2015年第2期82-85,共4页
随着计算机网络、气象监测和传感器网络等技术的不断发展,如何从数据流中挖掘出有用的信息成为了一个重要的研究内容.本文主要介绍了数据流和其中的频繁项集的概念,分析了数据流中的频繁项集挖掘算法.
关键词 数据流 频繁项集 倾斜时间窗口 频繁模式树
下载PDF
一种基于倾斜时间窗口的时间序列偏向最近模式匹配算法
6
作者 周黔 吴铁军 《信息与控制》 CSCD 北大核心 2007年第6期678-683,689,共7页
提出一种时间序列偏向最近模式匹配算法;这种算法通过定义一种偏向最近距离及采用倾斜时间窗口Haar小波变换高层数据表示方法,实现时间序列偏向最近模式无遗漏高效查询.理论分析与实验验证证明了该方法的有效性.
关键词 时间序列 模式匹配 偏向最近 倾斜时间窗口
下载PDF
基于倾斜时间窗口的高效数据流偏向最近聚类分析算法
7
作者 廖建平 马文龙 《计算机与现代化》 2010年第5期24-29,共6页
提出一种基于倾斜时间窗口的数据流偏向最近聚类算法。该算法首先通过将滑动窗口中数据等长分割形成不重叠的数据块——基本窗口,然后对每一基本窗口以Haar小波变换提取窗口数据的特征,通过改变所取各基本窗口小波变换系数个数达到保留... 提出一种基于倾斜时间窗口的数据流偏向最近聚类算法。该算法首先通过将滑动窗口中数据等长分割形成不重叠的数据块——基本窗口,然后对每一基本窗口以Haar小波变换提取窗口数据的特征,通过改变所取各基本窗口小波变换系数个数达到保留较多最近数据细节特征的目的,即对于越近的基本窗口保留越多的小波系数而越旧的基本窗口保留越少的小波系数,最后通过定义数据流偏向最近距离,完成基于倾斜时间窗口的偏向最近聚类算法。该算法计算速度快,能高效地实现数据流偏向最近聚类分析。仿真实验验证了该算法的有效性。 展开更多
关键词 数据流 K-MEANS 偏向最近 倾斜时间窗口 聚类分析
下载PDF
基于前缀树的数据流频繁模式挖掘算法 被引量:2
8
作者 杨君锐 黄威 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第7期107-110,共4页
针对数据流的无限性和流动性特点,提出了一种基于前缀树的数据流频繁模式挖掘算法(Prefix-stream).该算法将对数倾斜时间窗口划分为若干个子窗口,以子窗口为单位,利用提出的数据结构Prefix-tree进行挖掘,在整个数据流的频繁模式挖掘中,... 针对数据流的无限性和流动性特点,提出了一种基于前缀树的数据流频繁模式挖掘算法(Prefix-stream).该算法将对数倾斜时间窗口划分为若干个子窗口,以子窗口为单位,利用提出的数据结构Prefix-tree进行挖掘,在整个数据流的频繁模式挖掘中,使得频繁模式挖掘和更新能在Prefix-tree中同时进行.该算法应用对数倾斜时间窗口逐步降低历史事务的权重,从而区分最近事务与历史事务.实验结果表明Prefix-stream具有较高的效率与较好的可扩展性. 展开更多
关键词 数据挖掘 数据流 频繁模式挖掘 频繁模式树 对数倾斜时间窗口
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部