期刊文献+
共找到709篇文章
< 1 2 36 >
每页显示 20 50 100
在FP-树中挖掘频繁模式而不生成条件FP-树 被引量:56
1
作者 范明 李川 《计算机研究与发展》 EI CSCD 北大核心 2003年第8期1216-1222,共7页
FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向... FP growth算法是目前已发表的最有效的频繁模式挖掘算法之一 然而 ,由于在挖掘频繁模式时需要递归地生成大量的条件FP 树 ,其时空效率仍然不够高 改进了FP 树结构 ,提出了一种基于被约束子树挖掘频繁项集的有效算法 改进的FP 树是单向的 ,每个结点只保留指向父结点的指针 ,这大约节省了三分之一的树空间 通过引入被约束子树(可以用 3个很小的数组表示 ) ,算法在挖掘频繁模式时不生成条件FP 树 ,从而大大提高了频繁模式挖掘的时空效率 实验表明 ,与FP growth算法相比 ,算法的挖掘速度提高了 1倍以上 ,而所需的存储空间减少了一半 此外 ,随着数据库规模的增大 ,算法具有很好的可伸缩性 对于稠密数据集 ,算法也具有良好的性能 . 展开更多
关键词 数据挖掘 频繁模式 FP-树
下载PDF
数据流频繁模式挖掘研究进展 被引量:34
2
作者 潘云鹤 王金龙 徐从富 《自动化学报》 EI CSCD 北大核心 2006年第4期594-602,共9页
现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引... 现实世界和工程实践产生了大量的数据流,这种数据不同于传统的静态数据,对其进行有效处理和挖掘遇到了极大的挑战.如何使用有限存储空间进行快速和近似的频繁模式挖掘是数据流挖掘的基本问题,具有非常重要的研究价值和实践意义,已经引起了国内外研究者的广泛关注.本文深入分析数据流中的频繁模式挖掘,对其特点和算法进行较为全面的总结和分类论述,并讨论了存在的主要问题和未来的研究方向. 展开更多
关键词 数据挖掘 数据流 频繁模式 近似算法
下载PDF
数据流挖掘算法研究综述 被引量:21
3
作者 蒋盛益 李庆华 李新 《计算机工程与设计》 CSCD 北大核心 2005年第5期1130-1132,1169,共4页
流数据挖掘是数据挖掘的一个新的研究方向,已逐渐成为许多领域的有用工具。在介绍数据流的基本特点以及数据流挖掘的意义的基础上,对现有数据流挖掘算法的主要思想方法进行了总结,并指出了这些方法的局限性。最后对数据流挖掘的发展方... 流数据挖掘是数据挖掘的一个新的研究方向,已逐渐成为许多领域的有用工具。在介绍数据流的基本特点以及数据流挖掘的意义的基础上,对现有数据流挖掘算法的主要思想方法进行了总结,并指出了这些方法的局限性。最后对数据流挖掘的发展方向进行了展望。 展开更多
关键词 数据流 挖掘算法 聚类 分类 频繁模式
下载PDF
数据流中一种快速启发式频繁模式挖掘方法 被引量:14
4
作者 张昕 李晓光 +1 位作者 王大玲 于戈 《软件学报》 EI CSCD 北大核心 2005年第12期2099-2105,共7页
在现有的数据流频繁模式挖掘算法中,批处理方法平均处理时间短,但需要积攒足够的数据,使得其实时性差且查询粒度粗;而启发式方法可以直接处理数据流,但处理速度慢.提出一种改进的字典树结构——IL-TREE(improvedlexicographictree),并... 在现有的数据流频繁模式挖掘算法中,批处理方法平均处理时间短,但需要积攒足够的数据,使得其实时性差且查询粒度粗;而启发式方法可以直接处理数据流,但处理速度慢.提出一种改进的字典树结构——IL-TREE(improvedlexicographictree),并在其基础上提出一种新的启发式算法FPIL-Stream(frequentpatternminingbasedonimprovedlexicographictree),在更新模式和生成新模式的过程中,可以快速定位历史模式.算法结合了倾斜窗口策略,可以详细记录历史信息.该算法在及时处理数据流的前提下,也降低了数据的平均处理时间,并且提供了更细的查询粒度. 展开更多
关键词 数据挖掘 数据流 频繁模式 倾斜窗口
下载PDF
FP-growth算法的实现方法研究 被引量:27
5
作者 王新宇 杜孝平 谢昆青 《计算机工程与应用》 CSCD 北大核心 2004年第9期174-176,共3页
事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式... 事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。 展开更多
关键词 频繁模式 关联规则 数据挖掘 算法
下载PDF
关联规则研究综述 被引量:22
6
作者 秦亮曦 史忠植 《广西大学学报(自然科学版)》 CAS CSCD 2005年第4期310-317,共8页
关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算... 关联规则挖掘是近年来数据挖掘研究中一个相当活跃的领域.本文给出了关联规则及相关术语的定义,对关联规则挖掘中的频繁模式、频繁闭模式、最大频繁模式、并行/分布式挖掘及增量挖掘算法作了简单评述,着重介绍了近三年来发表的一些新算法,并对未来的发展趋势进行了预测和展望. 展开更多
关键词 数据挖掘 关联规则 频繁模式
下载PDF
高维类别属性数据流离群点快速检测算法 被引量:21
7
作者 周晓云 孙志挥 +1 位作者 张柏礼 杨宜东 《软件学报》 EI CSCD 北大核心 2007年第4期933-942,共10页
提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categoric... 提出类别属性数据流数据离群度量——加权频繁模式离群因子(weighted frequent pattern outlier factor,简称WFPOF),并在此基础上给出一种快速数据流离群点检测算法FODFP-Stream(fast outlier detection for high dimensional categorical data streams based on frequent pattern).该算法通过动态发现和维护频繁模式来计算离群度,能够有效地处理高维类别属性数据流,并可进一步扩展到数值属性和混合属性数据流.对仿真数据集和真实数据集的实验检测均验证该算法具有良好的适用性和有效性. 展开更多
关键词 数据流 离群点检测 频繁模式 高维 概念转移
下载PDF
ESPM——频繁子树挖掘算法 被引量:18
8
作者 朱永泰 王晨 +2 位作者 洪铭胜 汪卫 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1720-1727,共8页
随着互联网的发展 ,频繁模式的挖掘由频繁项集扩展到结构化数据 :树和图 在这些结构上的挖掘工作被应用于更为复杂的领域 ,比如生物信息学、网络日志和XML文档 提出了一个新颖的算法 :ESPM ,以挖掘有序标号树中的频繁子树 不同于以往... 随着互联网的发展 ,频繁模式的挖掘由频繁项集扩展到结构化数据 :树和图 在这些结构上的挖掘工作被应用于更为复杂的领域 ,比如生物信息学、网络日志和XML文档 提出了一个新颖的算法 :ESPM ,以挖掘有序标号树中的频繁子树 不同于以往的工作 ,把树同构的判断工作放到了算法的晚期 ,从而减少了整个挖掘过程的时间开销 人工数据集和真实数据集上的实验都证明ESPM相较于其他算法的优越性 展开更多
关键词 数据挖掘 频繁模式 频繁子树 ESPM
下载PDF
一种基于栈变换的高效关联规则挖掘算法 被引量:15
9
作者 惠晓滨 张凤鸣 +1 位作者 虞健飞 牛世民 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期330-335,共6页
在一个模式信息保全引理的基础上 ,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST ,给出了相应的栈构造和栈变换的算法描述 ,并进行了算法的性能分析和比较试验 。
关键词 栈变换 高效关联规则挖掘算法 数据库 数据挖掘算法 频繁模式 关联规则
下载PDF
带通配符和One-Off条件的序列模式挖掘 被引量:23
10
作者 吴信东 谢飞 +2 位作者 黄咏明 胡学钢 高隽 《软件学报》 EI CSCD 北大核心 2013年第8期1804-1815,共12页
很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,... 很多应用领域产生大量的序列数据.如何从这些序列数据中挖掘具有重要价值的模式,已成为序列模式挖掘研究的主要任务.研究这样一个问题:给定序列S、支持度阈值和间隔约束,从序列S中挖掘所有出现次数不小于给定支持度阈值的频繁序列模式,并且要求模式中任意两个相邻元素在序列中的出现位置满足用户定义的间隔约束.设计了一种有效的带有通配符的模式挖掘算法One-Off Mining,模式在序列中的出现满足One-Off条件,即模式的任意两次出现都不共享序列中同一位置的字符.在生物DNA序列上的实验结果表明,One-Off Mining比相关的序列模式挖掘算法具有更好的时间性能和完备性. 展开更多
关键词 数据挖掘 序列模式挖掘 频繁模式 通配符 One-Off条件
下载PDF
基于分类规则树的频繁模式文本分类 被引量:19
11
作者 陈晓云 陈袆 +2 位作者 王雷 李荣陆 胡运发 《软件学报》 EI CSCD 北大核心 2006年第5期1017-1025,共9页
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出... 基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(knearestneighbor)和SVM(supportvectormachines),因此是一种很有应用前景的文本分类方法. 展开更多
关键词 频繁模式 文本分类 词频 关联规则 分类规则
下载PDF
多维多层关联规则有效挖掘的新算法 被引量:9
12
作者 刘君强 王勋 孙晓莹 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2003年第2期205-210,共6页
 提出根据信息熵划分属性值区间或集合、自动生成与人机交互相结合确定层次结构的方法,将多维多层多数据类型问题转化为受约束的一维单层布尔型问题.在此基础上,对直接生成频繁模式的FPT Gen算法进行了扩展,实现了有效挖掘多维多层关...  提出根据信息熵划分属性值区间或集合、自动生成与人机交互相结合确定层次结构的方法,将多维多层多数据类型问题转化为受约束的一维单层布尔型问题.在此基础上,对直接生成频繁模式的FPT Gen算法进行了扩展,实现了有效挖掘多维多层关联规则的新算法MDML FPT Gen,其效率与可伸缩性均优于经典方法. 展开更多
关键词 数据挖掘 频繁模式 多维多层关联规则 知识发现 FPT-Gen算法 信息熵
下载PDF
基于改进的FP-tree的频繁模式挖掘算法 被引量:21
13
作者 李也白 唐辉 +1 位作者 张淳 贺玉明 《计算机应用》 CSCD 北大核心 2011年第1期101-103,共3页
FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP... FP-growth算法是一种基于FP-tree数据结构的高效的频繁模式挖掘算法,它不产生候选集。构造频繁模式树FP-tree需扫描数据库两次,在第二遍扫描中还扫描了那些仅包含了非频繁项的事务,针对此问题,在深入分析了FP-tree特性的基础上,改进了FP-tree构造过程,同时用一种基于Hash表的辅助存储结构,节省了项目查找时间,提高了挖掘效率。 展开更多
关键词 数据挖掘 关联规则 频繁模式 FP—growth算法 FP—tree
下载PDF
非同步多时间序列中频繁模式的发现算法 被引量:8
14
作者 李斌 谭立湘 +2 位作者 解光军 李海鹰 庄镇泉 《软件学报》 EI CSCD 北大核心 2002年第3期410-416,共7页
从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法... 从多个时间序列中发现频繁模式在实际应用中具有非常重要的价值.已知文献所提供的方法均假设多时间序列是同步的,但是,在现实世界中,这一条件并不总能满足,许多情况下它们是非同步的.提出了一个从非同步多时间序列中发现频繁模式的算法.该算法首先利用线性化分段表示法和矢量形态聚类实现时间序列的特征分割与符号化转换,然后通过将Agrawal关联模式发现算法的核心思想与时间序列最短实现表示方法相结合,实现了非同步多时间序列中多种结构频繁模式的发掘.与已有算法相比,该算法更简单、更灵活,并且不要求序列严格同步.实验结果证明了该算法的有效性. 展开更多
关键词 数据挖掘 频繁模式 符号化 多同步多时间序列 算法 数据库
下载PDF
面向频繁模式挖掘的差分隐私保护研究综述 被引量:19
15
作者 丁丽萍 卢国庆 《通信学报》 EI CSCD 北大核心 2014年第10期200-209,共10页
频繁模式挖掘是数据挖掘的一个基本问题,其模式本身和相应计数都有可能泄露隐私信息。当前,差分隐私通过添加噪音使数据失真,有效实现了隐私保护的目的。首先介绍了差分隐私保护模型的理论基础;其次,详细综述了差分隐私下3种典型的频繁... 频繁模式挖掘是数据挖掘的一个基本问题,其模式本身和相应计数都有可能泄露隐私信息。当前,差分隐私通过添加噪音使数据失真,有效实现了隐私保护的目的。首先介绍了差分隐私保护模型的理论基础;其次,详细综述了差分隐私下3种典型的频繁模式挖掘方法的最新研究进展,并进行对比性分析;最后对未来的研究方向进行了展望。 展开更多
关键词 差分隐私 隐私保护 频繁模式 数据挖掘
下载PDF
结合遗传算法的Apriori算法改进 被引量:18
16
作者 文武 郭有庆 《计算机工程与设计》 北大核心 2019年第7期1922-1926,共5页
针对Apriori算法存在效率低、内存损耗大等问题,提出一种基于遗传算法来寻找频繁项集的(GNA)算法。结合Apriori算法和遗传算法的特点,设计 k 步挖掘过程,利用交叉算子产生候选项集和变异算子筛选频繁项集,避免多次扫描数据库的同时,减... 针对Apriori算法存在效率低、内存损耗大等问题,提出一种基于遗传算法来寻找频繁项集的(GNA)算法。结合Apriori算法和遗传算法的特点,设计 k 步挖掘过程,利用交叉算子产生候选项集和变异算子筛选频繁项集,避免多次扫描数据库的同时,减少冗余。实验结果表明,GNA算法相比Apriori算法,对稀疏数据集或稠密数据集,在挖掘频繁模式的数量及效率上都有显著提高。 展开更多
关键词 关联规则 APRIORI算法 遗传算法 事务数据库 频繁模式
下载PDF
利用网格服务的分布式频繁模式挖掘算法 被引量:4
17
作者 张力飞 朱骁峰 何炎祥 《计算机工程与应用》 CSCD 北大核心 2004年第7期179-181,220,共4页
充分利用网格计算平台的各种服务来进行分布式数据挖掘,是近来数据挖掘方面的一个热点。网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利。该文在这些研究的基础上,介绍了一种基于网格平台的分布式... 充分利用网格计算平台的各种服务来进行分布式数据挖掘,是近来数据挖掘方面的一个热点。网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利。该文在这些研究的基础上,介绍了一种基于网格平台的分布式频繁模式挖掘算法。该算法借鉴了FP-growth算法的思想并利用网格平台所提供的分布式计算的各种便利的服务,能在网格计算环境中进行分布式频繁模式的挖掘。 展开更多
关键词 频繁模式树 分布式数据挖掘 网格计算 频繁模式
下载PDF
CAPE——数据流上的基于频繁模式的分类算法 被引量:7
18
作者 王鹏 吴晓晨 +2 位作者 王晨 汪卫 施伯乐 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1677-1683,共7页
近年来涌现出很多数据流的应用 ,比如网络日志、传感器网络等 数据流的数据量无限、数据分布变化等特性使得传统的挖掘算法不能很好地解决这些问题 针对上述问题提出了一种数据流上的基于频繁模式的分类算法———CAPE(classificationu... 近年来涌现出很多数据流的应用 ,比如网络日志、传感器网络等 数据流的数据量无限、数据分布变化等特性使得传统的挖掘算法不能很好地解决这些问题 针对上述问题提出了一种数据流上的基于频繁模式的分类算法———CAPE(classificationusingfrequentpattern) CAPE通过数据流中的频繁模式进行分类 ,在压缩数据的同时保存了数据中的分类信息 实验证明 ,这种算法比其他算法有更高的准确性 展开更多
关键词 数据流 分类 决策树 频繁模式
下载PDF
图数据挖掘技术的研究与进展 被引量:14
19
作者 丁悦 张阳 +1 位作者 李战怀 王勇 《计算机应用》 CSCD 北大核心 2012年第1期182-190,共9页
生物信息学(蛋白质结构分析、基因组识别)、社会网络(实体间的联系)、Web分析(Web链接结构分析、Web内容挖掘和Web日志搜索)以及文本信息检索等的迅速发展积累了大量图数据,对于图数据的挖掘逐渐成为研究领域的热点。一些诸如聚类、分... 生物信息学(蛋白质结构分析、基因组识别)、社会网络(实体间的联系)、Web分析(Web链接结构分析、Web内容挖掘和Web日志搜索)以及文本信息检索等的迅速发展积累了大量图数据,对于图数据的挖掘逐渐成为研究领域的热点。一些诸如聚类、分类、频繁模式挖掘的传统数据挖掘研究逐渐拓展到图数据领域。通过介绍现阶段图数据挖掘技术的研究进展,总结了图数据挖掘的特点、现实意义、主要问题以及应用场景,讨论并预测了图数据,尤其是不确定图数据研究的发展趋势和热点。 展开更多
关键词 数据挖掘 图数据 聚类 分类 频繁模式 不确定图
下载PDF
数据流频繁模式挖掘算法设计 被引量:11
20
作者 敖富江 颜跃进 +1 位作者 黄健 黄柯棣 《计算机科学》 CSCD 北大核心 2008年第3期1-5,共5页
介绍了数据流频繁模式的概念和定义,提出了数据流频繁模式挖掘算法的通用数据流处理模型,详细总结了数据流频繁模式挖掘算法的三种分类方式:"窗口模型"、"结果集类型"和"结果集精确性"。基于这些分类方... 介绍了数据流频繁模式的概念和定义,提出了数据流频繁模式挖掘算法的通用数据流处理模型,详细总结了数据流频繁模式挖掘算法的三种分类方式:"窗口模型"、"结果集类型"和"结果集精确性"。基于这些分类方法提出了数据流频繁模式挖掘算法的设计立方体,该立方体不仅涵盖了现有的数据流频繁模式挖掘算法,还对设计新的算法具有指导意义。基于设计立方体,分析了设计算法时应当采取的有效策略,旨在为设计新算法提供一个有力参考。最后讨论了数据流频繁模式挖掘的进一步研究工作。 展开更多
关键词 数据流 频繁模式 设计立方体
下载PDF
上一页 1 2 36 下一页 到第
使用帮助 返回顶部