期刊文献+
共找到744篇文章
< 1 2 38 >
每页显示 20 50 100
概念格与关联规则发现 被引量:97
1
作者 谢志鹏 刘宗田 《计算机研究与发展》 EI CSCD 北大核心 2000年第12期1415-1421,共7页
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究 .而由二元关系导出的概念格则是一种非常有用的形式化工具 ,它体现了概念内涵和外延的统一 ,反映了对象和特征间的联系以及概念间的泛化与例化关系 ,因此非常适于发现数据... 作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究 .而由二元关系导出的概念格则是一种非常有用的形式化工具 ,它体现了概念内涵和外延的统一 ,反映了对象和特征间的联系以及概念间的泛化与例化关系 ,因此非常适于发现数据中潜在的概念 .分析了概念格与关联规则提取之间的关系 ,根据需要对格结构进行了相应的修改 ,提出了相应的渐进式生成算法和基于概念格的关联规则提取算法 ,通过定理和性质对算法进行了说明并对关联规则进行缩减 . 展开更多
关键词 概念格 关联规则 数据挖掘 数据库 知识发现
下载PDF
中文网络客户评论的产品特征挖掘方法研究 被引量:129
2
作者 李实 叶强 +1 位作者 李一军 RobLaw 《管理科学学报》 CSSCI 北大核心 2009年第2期142-152,共11页
随着互联网的广泛应用,在Blog、BBS、Wiki等网络站点中出现了大量的针对商品或服务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的... 随着互联网的广泛应用,在Blog、BBS、Wiki等网络站点中出现了大量的针对商品或服务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的主要特征,并有望进一步发现客户对这些特征的意见和态度.在英文世界中已经有学者开始对这一研究进行探索,然而由于语言结构等方面的差异,英文的研究成果尚无法直接应用于中文客户评论的挖掘中.本研究针对中文的特点,提出了面向中文的客户评论挖掘方法.该方法基于改进关联规则算法实现了针对中文产品评论的产品特征信息挖掘.本研究采用通过互联网获得的针对手机、数码相机、书籍等5种产品的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有效性. 展开更多
关键词 用户评论 产品特征 关联规则 数据挖掘
下载PDF
数据挖掘中常用关联规则挖掘算法 被引量:69
3
作者 王爱平 王占凤 +1 位作者 陶嗣干 燕飞飞 《计算机技术与发展》 2010年第4期105-108,共4页
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-gr... 文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。 展开更多
关键词 数据挖掘 关联规则 频繁项集 挖掘算法
下载PDF
基于关联规则的Web文档聚类算法 被引量:41
4
作者 宋擒豹 沈钧毅 《软件学报》 EI CSCD 北大核心 2002年第3期417-423,共7页
Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看... Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值. 展开更多
关键词 产联规则 WWW Web文档聚类算法 数据挖掘 数据库
下载PDF
基于Apriori算法的二次设备缺陷数据挖掘与分析方法 被引量:57
5
作者 张延旭 胡春潮 +2 位作者 黄曙 冯善强 林冠强 《电力系统自动化》 EI CSCD 北大核心 2017年第19期147-151,163,共6页
为提升电力系统二次设备的运维和管控水平,从二次设备的缺陷数据出发,提出了基于Apriori算法的二次设备缺陷数据挖掘与分析方法。首先,分析了关联规则与Apriori算法的基本思路,然后建立了基于关联规则的二次设备缺陷模型,在模型中考虑... 为提升电力系统二次设备的运维和管控水平,从二次设备的缺陷数据出发,提出了基于Apriori算法的二次设备缺陷数据挖掘与分析方法。首先,分析了关联规则与Apriori算法的基本思路,然后建立了基于关联规则的二次设备缺陷模型,在模型中考虑了二次设备缺陷的几个重要属性:二次设备的生产厂家、设备类型、设备缺陷的原因、发生缺陷的设备部位以及缺陷等级。进一步,以一组自动化设备缺陷数据为例,阐述了基于Apriori算法的二次设备缺陷数据挖掘和分析方法,分析结果表明所提方法能够用于寻找二次设备的薄弱环节,并能够找到诱发薄弱环节的原因,同时还具有分析设备家族性缺陷等功能。 展开更多
关键词 二次设备 关联规则 数据挖掘 APRIORI算法
下载PDF
基于改进Apriori算法的审计日志关联规则挖掘 被引量:49
6
作者 徐开勇 龚雪容 成茂才 《计算机应用》 CSCD 北大核心 2016年第7期1847-1851,共5页
针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安... 针对安全审计系统中存在的智能程度低、日志信息没有充分利用的问题,提出一个基于关联规则挖掘的安全审计系统。该系统充分利用已有审计日志,结合数据挖掘技术,建立用户及系统的行为模式数据库,做到及时发现异常情况,提高了计算机的安全性。在传统Apriori算法的基础上提出一种改进的E-Apriori算法,该算法可以缩小待扫描事务集合的范围,降低算法的时间复杂度,提高运行效率。实验结果表明基于关联规则挖掘的审计系统对攻击类型的识别能力提升在10%以上,改进的E-Apriori算法相比经典Apriori算法和FP-GROWTH算法在性能上得到了提高,特别是在大型稀疏数据集中最高达到51%。 展开更多
关键词 安全审计系统 审计日志 数据挖掘 关联规则挖掘 APRIORI算法
下载PDF
基于特征挖掘的电网故障诊断方法 被引量:45
7
作者 李再华 白晓民 +5 位作者 周子冠 许婧 李晓珺 张霖 孟珺遐 朱宁辉 《中国电机工程学报》 EI CSCD 北大核心 2010年第10期16-22,共7页
专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了... 专家系统在应用方面的主要瓶颈是:规则库的维护;推理的速度和准确度的协调。分析了故障信息序列中必有或特有的信息,提出了基于特征挖掘的关联规则挖掘方法。结合电网故障信息的特征,改进了频繁模式(frequent pattern,FP)–算法:考虑了故障信息的特征,如时序和因果关联关系、故障性质、严重故障、稀有故障等因素;增加了规则的"或"逻辑;改进了FP-树的修剪技术。算例表明该算法能够大量减少无效挖掘,推理速度和准确度显著提高,适用于在线诊断。 展开更多
关键词 数据挖掘 关联规则 特征挖掘 频繁模式一算法 故障诊断 专家系统
下载PDF
关联规则和聚类分析在个性化推荐中的应用 被引量:18
8
作者 鲍玉斌 王大玲 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第12期1149-1152,共4页
提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测... 提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测度进行了比较·实验表明,将聚类分析作为关联规则的预处理的推荐方法可以显著地提高推荐的准确率,而将关联规则和聚类分析互补使用的推荐方法具有较高的推荐覆盖率·同时发现将聚类分析和关联规则结合使用并不能同时改善推荐的准确率和覆盖率· 展开更多
关键词 WEB使用挖掘 页面关联规则 访问模式聚类 个性化推荐 WEB挖掘
下载PDF
关联规则挖掘的研究及对Apriori算法的改进 被引量:22
9
作者 李云峰 陈建文 程代杰 《计算机工程与科学》 CSCD 2002年第6期65-68,共4页
本文对关联规则挖掘问题进行了介绍 ,并对其作了形式化描述 ;对Apriori算法进行了分析 ,针对该算法的缺点 ,提出改进算法apriori_new。改进的算法避免了模式匹配 ,减小了访问数据库的次数 。
关键词 数据挖掘 关联规则挖掘 APRIORI算法 事务处理 数据库
下载PDF
FP-growth算法的实现方法研究 被引量:27
10
作者 王新宇 杜孝平 谢昆青 《计算机工程与应用》 CSCD 北大核心 2004年第9期174-176,共3页
事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式... 事务数据库中频繁模式的挖掘研究作为关联规则等许多数据挖掘问题的核心工作,已经研究了许多年。早期算法大都是Apriori型算法,即首先产生候选集,然后在候选集的基础上找出频繁模式,候选集的产生往往是耗时的,特别是挖掘富模式或长模式时。JianweiHan等人提出了一种新颖的数据结构FP-tree及基于其上的FP-growth算法,用于有效的富模式与长模式挖掘。由于不同的实现方法可能会导致不同的挖掘效率,该文在讨论FP-growth算法的基础上,采用了几种不同的方法来实现它,并用几个数据库对它们的性能进行了比较。 展开更多
关键词 频繁模式 关联规则 数据挖掘 算法
下载PDF
一种基于特征扩展的中文短文本分类方法 被引量:36
11
作者 王细薇 樊兴华 赵军 《计算机应用》 CSCD 北大核心 2009年第3期843-845,共3页
针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP-Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语... 针对短文本所描述信号弱的特点,提出一种基于特征扩展的中文短文本分类方法。该方法首先利用FP-Growth算法挖掘训练集特征项与测试集特征项之间的共现关系,然后用得到的关联规则对短文本测试文档中的概念词语进行特征扩展。同时,引入语义信息并且改进了知网中DEF词条的描述能力公式,在此基础上对中文短文本进行分类。实验证明,这种方法具有高的分类性能,其微平均和宏平均值都高于常规的文本分类方法。 展开更多
关键词 短文本分类 关联规则挖掘 特征扩展
下载PDF
OLAP关联规则挖掘 被引量:21
12
作者 李立羽 施鹏飞 《计算机工程与应用》 CSCD 北大核心 2002年第3期128-130,共3页
该文提出一种新的关联规则挖掘方法,OLAP关联规则挖掘。OLAP关联规则挖掘是OLAP技术和一些高效的关联规则挖掘算法的结合。OLAP关联规则挖掘方法是一种灵活的、多维的、多层次的高性能方法。该文首先介绍了O-LAP关联规则挖掘的结构,最... 该文提出一种新的关联规则挖掘方法,OLAP关联规则挖掘。OLAP关联规则挖掘是OLAP技术和一些高效的关联规则挖掘算法的结合。OLAP关联规则挖掘方法是一种灵活的、多维的、多层次的高性能方法。该文首先介绍了O-LAP关联规则挖掘的结构,最后详述了OLAP关联规则挖掘的具体实现。 展开更多
关键词 OLAP 数据挖掘 关联规则 数据仓库 数据库管理系统
下载PDF
基于关联规则挖掘与组合赋权-云模型的电网二次设备运行状态风险评估 被引量:35
13
作者 南东亮 王维庆 +4 位作者 张陵 陈凯 杨国生 张路 孙永辉 《电力系统保护与控制》 CSCD 北大核心 2021年第10期67-76,共10页
针对当前电网二次设备周期性检修效率低、评估结果过于依赖专家主观经验的问题,提出一种基于关联规则挖掘与组合赋权-云模型的二次设备运行状态风险评估方法。首先,基于Apriori关联规则挖掘算法筛选评估指标,构建二次设备运行状态风险... 针对当前电网二次设备周期性检修效率低、评估结果过于依赖专家主观经验的问题,提出一种基于关联规则挖掘与组合赋权-云模型的二次设备运行状态风险评估方法。首先,基于Apriori关联规则挖掘算法筛选评估指标,构建二次设备运行状态风险评估指标体系。其次,采用属性层次分析法和反熵权法分别计算评估指标的主、客观权重,并基于合作博弈模型得到组合权重。最后,以云理论为基础构建基于云模型的二次设备风险评估模型。实例分析表明该方法简单易行,提高了评估结果的科学性与准确性,辅助电网二次设备运维人员制定科学合理的检修决策。 展开更多
关键词 二次设备 关联规则挖掘 组合赋权 合作博弈 云模型
下载PDF
图书流通数据的关联挖掘量化分析方法 被引量:30
14
作者 魏育辉 潘洁 《现代情报》 北大核心 2005年第11期108-110,共3页
本文探讨了图书流通数据的一种量化分析方法——关联规则的挖掘。通过对某一读者群在一定时期内所借阅图书的流通数据应用关联规则的挖掘分析方法,可以发现读者在进行专业学习时隐含的各学科知识之间的关联。这对图书馆调整资源建设的... 本文探讨了图书流通数据的一种量化分析方法——关联规则的挖掘。通过对某一读者群在一定时期内所借阅图书的流通数据应用关联规则的挖掘分析方法,可以发现读者在进行专业学习时隐含的各学科知识之间的关联。这对图书馆调整资源建设的学科结构、提升读者服务工作水平具有重要的指导意义。 展开更多
关键词 图书流通 关联规则 数据分析 数据挖掘
下载PDF
基于关联规则映射的生物信息网络多维数据挖掘算法 被引量:33
15
作者 唐晓东 《计算机应用研究》 CSCD 北大核心 2015年第6期1614-1616,1620,共4页
针对在生物信息网络中对复杂和大规模的数据集进行挖掘时所出现的算法挖掘精度低、运行速度慢、内存占用大等问题,提出一种基于关联规则映射的生物信息网络多维数据挖掘算法。该算法结合网络数据集之间的关联映射关系,从而确定网络数据... 针对在生物信息网络中对复杂和大规模的数据集进行挖掘时所出现的算法挖掘精度低、运行速度慢、内存占用大等问题,提出一种基于关联规则映射的生物信息网络多维数据挖掘算法。该算法结合网络数据集之间的关联映射关系,从而确定网络数据集的关联规则,并引入挖掘因子和相对误差来提高算法的挖掘精度;根据多维子空间中数据集之间的关联程度进行子空间区分以及子空间内数据集区分,从而实现对不同数据集的有效挖掘。在实验中,对不同数据集数量下的算法内存占用情况、算法挖掘精度、算法运行时间进行仿真,从实验结果可以看出基于关联规则映射的挖掘算法可以有效地提高挖掘精度,在减少内存占用和提升计算速度上也具有一定的优势。 展开更多
关键词 数据挖掘 关联规则映射 生物信息网络 多维数据挖掘
下载PDF
改进的关联规则挖掘算法——MIFP-Apriori算法 被引量:33
16
作者 曾子贤 巩青歌 张俊 《科学技术与工程》 北大核心 2019年第16期216-220,共5页
Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优... Apriori算法是关联规则挖掘的经典算法,具有原理简洁、易编程实现等优点,得到广泛应用。针对该算法扫描数据库次数过多,产生大量冗余候选集的缺陷,在现有Apriori算法改进优化思想的基础上,结合矩阵、改进频繁模式树和计算候选集频数优化策略提出了一种改进的关联规则挖掘算法——MIFP-Apriori算法。实验表明,该算法能够将扫描数据库次数降低到一次,有效解决产生大量冗余候选集的缺陷,提高算法效率。 展开更多
关键词 数据挖掘 关联规则挖掘 APRIORI算法 频繁模式树(FP-Tree) 改进的频繁模式树 MIFP-Apriori算法
下载PDF
基于模糊多目标遗传优化算法的节假日电力负荷预测 被引量:26
17
作者 冯丽 邱家驹 《中国电机工程学报》 EI CSCD 北大核心 2005年第10期29-34,共6页
多目标遗传优化算法的一个优点就是可在一次迭代计算中寻找到问题的多个非劣最优解。该文应用多目标遗传算法和关联规则算法提出一个基于模糊规则的电力负荷模式分类系统。在此分类系统中采用多目标遗传优化算法从众多模糊分类规则中自... 多目标遗传优化算法的一个优点就是可在一次迭代计算中寻找到问题的多个非劣最优解。该文应用多目标遗传算法和关联规则算法提出一个基于模糊规则的电力负荷模式分类系统。在此分类系统中采用多目标遗传优化算法从众多模糊分类规则中自动挑选出具有较好识别性能和可解释性的模糊规则,并利用模糊关联规则挖掘通过启发式规则选择改善遗传算法的搜索性能。经仿真试验表明此分类系统具有较好的分类性能,可为节假日负荷预测提供更为充分的历史数据,从而改善其负荷预测性能。 展开更多
关键词 电力系统 负荷预测 人工神经网络 模糊多目标遗传优化算法 仿真
下载PDF
空间关联规则挖掘研究进展 被引量:30
18
作者 张雪伍 苏奋振 +1 位作者 石忆邵 张丹丹 《地理科学进展》 CSCD 北大核心 2007年第6期119-128,共10页
随着空间数据获取技术的进步,空间数据量日益增大,已超出人们的分析能力。传统的空间数据分析方法只能进行简单的数据分析,无法满足人们获取知识的需要。空间关联规则是空间数据挖掘一个基本的任务,是从具有海量、多维、多尺度、不确定... 随着空间数据获取技术的进步,空间数据量日益增大,已超出人们的分析能力。传统的空间数据分析方法只能进行简单的数据分析,无法满足人们获取知识的需要。空间关联规则是空间数据挖掘一个基本的任务,是从具有海量、多维、多尺度、不确定性边界等特性的空间数据中进行知识发现的重要方法。本文从基本概念、分类、挖掘过程、挖掘方法、目前研究成果等方面对其进行综述,重点阐述了空间关联规则挖掘效率的改进策略、基于不确定空间信息的挖掘方法、挖掘过程及结果的可视化、弱空间关联规则的挖掘方法等。通过对现有空间关联规则研究成果和存在问题的深入剖析,指出了其未来主要的发展方向。 展开更多
关键词 空间数据 数据挖掘 空间关联规则 地理信息系统(GIS)
下载PDF
一种基于栈变换的高效关联规则挖掘算法 被引量:15
19
作者 惠晓滨 张凤鸣 +1 位作者 虞健飞 牛世民 《计算机研究与发展》 EI CSCD 北大核心 2003年第2期330-335,共6页
在一个模式信息保全引理的基础上 ,提出了一个基于频繁模式栈变换的关联规则挖掘算法FPST ,给出了相应的栈构造和栈变换的算法描述 ,并进行了算法的性能分析和比较试验 。
关键词 栈变换 高效关联规则挖掘算法 数据库 数据挖掘算法 频繁模式 关联规则
下载PDF
基于Spark的并行关联规则挖掘算法研究综述 被引量:29
20
作者 刘莉萍 章新友 +2 位作者 牛晓录 郭永坤 丁亮 《计算机工程与应用》 CSCD 北大核心 2019年第9期1-9,共9页
关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapRed... 关联规则挖掘是数据挖掘的一个重要分支,但随着数据的快速增长,传统关联规则挖掘算法不能很好地适应大数据的要求,需要在分布式、并行计算的平台上寻找突破。Spark是专门为大数据处理而设计的一个适合迭代运算的并行计算模型,相比MapReduce具有更高效、充分利用内存、更适合迭代计算和交互式处理的优点。对已有的基于Spark的并行关联规则挖掘算法进行了分类和综述,并总结了各自的优缺点和适用范围,为下一步的研究提供参考。 展开更多
关键词 SPARK 并行 关联规则挖掘 APRIORI FP-GROWTH
下载PDF
上一页 1 2 38 下一页 到第
使用帮助 返回顶部