期刊文献+
共找到856篇文章
< 1 2 43 >
每页显示 20 50 100
关联规则的增量式更新算法 被引量:227
1
作者 冯玉才 冯剑琳 《软件学报》 EI CSCD 北大核心 1998年第4期301-306,共6页
关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断... 关联规则的开采是一个重要的数据开采问题.目前已经提出了许多算法用于高效地发现大规模数据库中的关联规则,而对关联规则维护问题的研究工作却很少.在用户开采关联规则的交互过程中,为了找到真正令其感兴趣的规则,用户将需要不断调整两个描述用户兴趣程度的阈值:最小支持度和最小可信度.本文提出了两种增量式更新算法——IUA(incrementalupdatingalgorithm)和PIUA(paralelincre-mentalupdatingalgorithm),用来解决这一关联规则高效维护问题. 展开更多
关键词 数据开采 知识发现 关联规则 增量式更新 数据库
下载PDF
关联规则挖掘综述 被引量:152
2
作者 崔妍 包志强 《计算机应用研究》 CSCD 北大核心 2016年第2期330-334,共5页
近年来国内外学者对关联规则进行了大量的研究,为深入理解关联规则挖掘技术,掌握其研究现状与发展趋势,首先介绍了关联规则相关定义与分类方法;其次从串行和并行两个角度总结了关联规则挖掘的一般方法,概述并分析了一些典型的关联规则... 近年来国内外学者对关联规则进行了大量的研究,为深入理解关联规则挖掘技术,掌握其研究现状与发展趋势,首先介绍了关联规则相关定义与分类方法;其次从串行和并行两个角度总结了关联规则挖掘的一般方法,概述并分析了一些典型的关联规则挖掘模式;最后讨论了关联规则挖掘质量改善问题及领域应用。 展开更多
关键词 数据挖掘 关联规则 频繁项集 算法
下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:95
3
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
下载PDF
快速更新频繁项集 被引量:63
4
作者 朱玉全 孙志挥 赵传申 《计算机研究与发展》 EI CSCD 北大核心 2003年第1期94-99,共6页
发现频繁项集是数据挖掘应用中的关键问题 ,发现过程的高花费要求对增量数据挖掘算法进行深入研究 首先分析并指出了增量式更新频繁项集算法的技术难点———寻找新的有效频繁项集 ;其次提出了一种快速的增量式更新频繁项集算法FUFIA ;
关键词 快速更新频繁项集 数据挖掘 关联规则 频繁项集 事务数据库
下载PDF
关联规则挖掘中若干关键技术的研究 被引量:62
5
作者 陈耿 朱玉全 +3 位作者 杨鹤标 陆介平 宋余庆 孙志挥 《计算机研究与发展》 EI CSCD 北大核心 2005年第10期1785-1789,共5页
Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解... Apriori类算法已经成为关联规则挖掘中的经典算法,其技术难点及运算量主要集中在以下两个方面:①如何确定候选频繁项目集和计算项目集的支持数;②如何减少候选频繁项目集的个数以及扫描数据库的次数·目前已提出了许多改进方法来解决第2个问题,并已取得了很好的效果·然而,对于第1个问题,仍沿用Apriori算法中的解决方案,其运算量是较大的·为此,提出了一种基于二进制形式的候选频繁项目集生成和相应的计算支持数算法,该算法只需对挖掘对象进行一些“或”、“与”、“异或”等逻辑运算操作,显著降低了算法的实现难度,将该算法与Apriori类算法相结合,可以进一步提高算法的执行效率,实验结果也表明算法是有效、快速的· 展开更多
关键词 数据挖掘 关联规则 频繁项目集
下载PDF
关联规则的开采与更新 被引量:40
6
作者 周海岩 《软件学报》 EI CSCD 北大核心 1999年第10期1078-1084,共7页
对关联规则的增量式更新算法──IUA(incrementalupdatingalgorithm)进行了分析,指出其存在的问题,并给出一个改进的算法NEWIUA(newIUA).NEWIUA算法对已存在的和本次更新时新... 对关联规则的增量式更新算法──IUA(incrementalupdatingalgorithm)进行了分析,指出其存在的问题,并给出一个改进的算法NEWIUA(newIUA).NEWIUA算法对已存在的和本次更新时新产生的频繁项目都加以充分的利用,因此,在保证算法有效的同时提高了效率.文章提出了3种关联规则开采的并行算法,并对各算法进行了分析和讨论. 展开更多
关键词 数据开关 关联规则 并行算法 数据库
下载PDF
数据挖掘中常用关联规则挖掘算法 被引量:69
7
作者 王爱平 王占凤 +1 位作者 陶嗣干 燕飞飞 《计算机技术与发展》 2010年第4期105-108,共4页
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-gr... 文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。 展开更多
关键词 数据挖掘 关联规则 频繁项集 挖掘算法
下载PDF
Apriori算法的一种优化方法 被引量:47
8
作者 钱光超 贾瑞玉 +1 位作者 张然 李龙澍 《计算机工程》 CAS CSCD 北大核心 2008年第23期196-198,共3页
介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。... 介绍关联规则挖掘中的经典算法——Apriori算法的关键思想。针对传统Apriori算法效率上的不足,提出一种改进的Apriori算法——En-Apriori算法。该算法采用矩阵的方法,只须扫描一遍数据库,同时优化了连接操作,较好地提高了算法的效率。实验结果表明,En-Apriori算法优于Apriori算法,具有较好的实用性。 展开更多
关键词 关联规则 频繁项集 APRIORI算法 En—Apriori算法
下载PDF
一种基于Apriori的改进算法 被引量:24
9
作者 罗可 吴杰 《计算机工程与应用》 CSCD 北大核心 2001年第22期20-22,共3页
关联规则采掘是数据采掘中重要的研究课题。该文对关联规则采掘中的Apriori算法进行了深入研究。作者探讨了Apriori算法,指出了该算法的某些不足,提出了一种改进算法。
关键词 数据采掘 关联规则 频繁项目录 APRIORI算法 知识发现 数据库
下载PDF
负关联规则的研究 被引量:33
10
作者 董祥军 王淑静 +1 位作者 宋瀚涛 陆玉昌 《北京理工大学学报》 EI CAS CSCD 北大核心 2004年第11期978-981,共4页
传统的关联规则是A B的形式,将这种形式加以扩展,讨论了A B,A B,A B三种形式,给出了一种负关联规则中支持度与置信度简单有效的计算方法。讨论了同时研究正、负关联规则后出现的矛盾规则问题,提出了用相关性解决这些问题的方法和一种挖... 传统的关联规则是A B的形式,将这种形式加以扩展,讨论了A B,A B,A B三种形式,给出了一种负关联规则中支持度与置信度简单有效的计算方法。讨论了同时研究正、负关联规则后出现的矛盾规则问题,提出了用相关性解决这些问题的方法和一种挖掘频繁项集中正、负关联规则的算法,进行了算法的验证实验。实验结果表明,该算法能检测并删除相互矛盾的规则。 展开更多
关键词 负关联规则 频繁项集 支持度 置信度
下载PDF
一种基于压缩矩阵的Apriori算法改进研究 被引量:46
11
作者 罗丹 李陶深 《计算机科学》 CSCD 北大核心 2013年第12期75-80,共6页
针对已有基于矩阵的Apriori算法存在的问题,提出了一种改进的基于压缩矩阵的Apriori算法。算法进行了以下方面的改进:增加了两个数组,分别用于记录矩阵行与列中1的个数,使得算法在压缩矩阵时减少了扫描矩阵的次数;在压缩矩阵中,通过增... 针对已有基于矩阵的Apriori算法存在的问题,提出了一种改进的基于压缩矩阵的Apriori算法。算法进行了以下方面的改进:增加了两个数组,分别用于记录矩阵行与列中1的个数,使得算法在压缩矩阵时减少了扫描矩阵的次数;在压缩矩阵中,通过增加删除不能连接的项集和非频繁的项集的操作,使得矩阵压缩得更小,提高了空间效率;改变了删除事务列的条件和算法结束的条件,以减少挖掘结果的误差和算法循环的次数。算法性能分析和实验分析证明,改进后的算法能有效地挖掘频繁项集,并且比现有的算法具有更高的计算效率。 展开更多
关键词 数据挖掘 频繁项集 APRIORI算法 压缩矩阵
下载PDF
基于关联规则的数据挖掘在临床上的应用 被引量:36
12
作者 王华 胡学钢 《安徽大学学报(自然科学版)》 CAS 北大核心 2006年第2期21-25,共5页
随着医院信息系统(Hosp ital Inform ation System,H IS)在医院的广泛应用,特别是数字新技术在门诊系统中的广泛应用,医学数据挖掘提高了医院信息管理水平,为疾病的诊断和治疗提供了科学的、准确的决策.本文使用关联规则中的Apriori算... 随着医院信息系统(Hosp ital Inform ation System,H IS)在医院的广泛应用,特别是数字新技术在门诊系统中的广泛应用,医学数据挖掘提高了医院信息管理水平,为疾病的诊断和治疗提供了科学的、准确的决策.本文使用关联规则中的Apriori算法挖掘医院病人的就诊资料,并且归纳出症状及疾病间之关联规则,并探讨其在医疗信息系统的应用. 展开更多
关键词 数据挖掘 算法 关联规则 医学信息 频繁项集
下载PDF
关联规则提取中对Apriori算法的一种改进 被引量:32
13
作者 王创新 《计算机工程与应用》 CSCD 北大核心 2004年第34期183-185,共3页
关联规则的提取是数据挖掘中的重要研究课题,该文对关联规则提取中的Apriori算法进行了深入研究,指出了该算法的某些不足,提出了一种改进算法。实验结果表明,该算法性能明显优于Apriori算法,具有较高的推广价值。
关键词 数据挖掘 关联规则 频繁项目集
下载PDF
关联规则挖掘中对Apriori算法的研究 被引量:37
14
作者 钱雪忠 孔芳 《计算机工程与应用》 CSCD 北大核心 2008年第17期138-140,共3页
针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且... 针对Apriori寻找频繁项集问题,提出了基于垂直事务列表的树形结构的挖掘算法。该算法结合项集的有序特性,使生成树的每一层结点从左往右按支持度大小升序排列,这样得到的候选频繁项集的集合是最小的,大大减少了候选频繁项集的数量,而且能保持频繁项集的完整性,从而节约了计算开销,提高了算法的效率。 展开更多
关键词 数据挖掘 关联规则 频繁项集 关联规则挖掘
下载PDF
基于垂直数据分布的关联规则高效发现算法 被引量:18
15
作者 欧阳为民 蔡庆生 《软件学报》 EI CSCD 北大核心 1999年第7期754-760,共7页
文章分析了在KDD研究中现有的关联规则发现算法关于频繁项目集的生成与测试方法,提出了一种新的基于垂直数据分布的关联规则发现算法.该算法无需复杂的Hash 数据结构,仅需对整个数据库作两次遍历,从而既方便了实现。
关键词 关联规则 数据分布 算法 数据库 KDD
下载PDF
基于频繁项集的海量短文本聚类与主题抽取 被引量:31
16
作者 彭敏 黄佳佳 +2 位作者 朱佳晖 黄济民 刘纪平 《计算机研究与发展》 EI CSCD 北大核心 2015年第9期1941-1953,共13页
社交网络短文本规模大、传播快、质量低、模态多样等特性导致现有基于向量空间模型的文本聚类技术在对其进行聚类时面临维度高、特征稀疏和噪声干扰等挑战.对此,提出基于频繁项集的短文本聚类与主题抽取STC-TE(short text clustering&am... 社交网络短文本规模大、传播快、质量低、模态多样等特性导致现有基于向量空间模型的文本聚类技术在对其进行聚类时面临维度高、特征稀疏和噪声干扰等挑战.对此,提出基于频繁项集的短文本聚类与主题抽取STC-TE(short text clustering&topic extraction)框架.首先研究短文本的多特征对文本质量的影响,在基于高质量短文本集挖掘出的大量频繁项集基础上,设计基于相似度的频繁项集过滤策略SIF(similarity-based itemset filtering),可过滤掉85%的非重要频繁项集;然后定义基于相关文本集的频繁项集相似度,并提出聚类个数自适应的频繁项集谱聚类算法CSA_SC(clusters self-adaptive spectral clustering),实现频繁项集聚类与主题抽取;最后基于主题词将大规模短文本划分到相应的主题簇中,从而实现短文本聚类.基于100万条新浪微博文本的实验结果表明。 展开更多
关键词 海量 短文本 频繁项集 聚类 主题抽取
下载PDF
基于矩阵压缩的Apriori算法改进的研究 被引量:29
17
作者 苗苗苗 王玉英 《计算机工程与应用》 CSCD 2013年第1期159-162,共4页
Apriori算法是利用关联规则进行数据挖掘的一种经典算法,但其具有产生大量候选项集和多次扫描数据库的缺点。鉴于此,提出了一种基于压缩矩阵的Apriori改进算法,通过扫描一次数据库,将其转化为布尔事务矩阵,按照相关性质对事务矩阵进行压... Apriori算法是利用关联规则进行数据挖掘的一种经典算法,但其具有产生大量候选项集和多次扫描数据库的缺点。鉴于此,提出了一种基于压缩矩阵的Apriori改进算法,通过扫描一次数据库,将其转化为布尔事务矩阵,按照相关性质对事务矩阵进行压缩,以减少算法的运算量。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 关联规则 APRIORI算法 事务矩阵 频繁项集
下载PDF
时间敏感数据流上的频繁项集挖掘算法 被引量:29
18
作者 李海峰 章宁 +1 位作者 朱建明 曹怀虎 《计算机学报》 EI CSCD 北大核心 2012年第11期2283-2293,共11页
数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了... 数据流中的数据分布随着时间动态变化,但传统基于事务的滑动窗口模型难以体现该特征,因此挖掘结果并不精确.首先提出时间敏感数据流处理中存在的问题,然后建立基于时间戳的滑动窗口模型,并转换为基于事务的可变滑动窗口进行处理,提出了频繁项集的挖掘算法FIMoTS.该算法引入了类型变化界限的概念,将项集进行动态分类,根据滑动窗口大小的变化对项集进行延迟处理,仅当项集的类型变化界限超出一定阈值的时候才进行支持度的重新计算,能够达到剪枝的目的.在4种不同密度的数据集上完成的实验结果显示,该算法能够在保证内存开销基本不变的情况下显著提高计算效率. 展开更多
关键词 频繁项集 数据流 时间敏感 滑动窗口 数据挖掘
下载PDF
Apriori算法中频繁项集挖掘实现研究 被引量:16
19
作者 程玉胜 邓小光 江效尧 《计算机技术与发展》 2006年第3期58-60,共3页
在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购... 在数据挖掘中,关联规则是发现知识的一种有效方法,而频繁项集的挖掘是关联规则中发现强规则的基础,其中连接与剪枝是逐层迭代求解k-项频繁集的核心算法。因此,文中主要介绍了基于连接与剪枝挖掘频繁项集的实现过程,并通过挖掘对传统购物篮数据中的频繁项集进行了验证,结果是一致的。算法的有效性也为进一步挖掘关联规则中的强规则提供了基础。 展开更多
关键词 关联规则 频繁项集 支持度 可信度
下载PDF
一种基于散列技术和事务压缩的关联规则挖掘算法 被引量:11
20
作者 黄传明 《计算机工程》 CAS CSCD 北大核心 2003年第22期117-118,共2页
文章以DHP算法为基础,在产生频繁项集时考虑了一种可以直接删除非频繁项集的散列函数,并压缩了文中提出的几种冗余事务,提出了FDHP算法,其性能优于传统的Apriori算法和DHP算法。
关键词 关联规则 数据挖掘 频繁项集 DHP算法
下载PDF
上一页 1 2 43 下一页 到第
使用帮助 返回顶部