期刊文献+
共找到3,325篇文章
< 1 2 167 >
每页显示 20 50 100
基于FP-Tree的最大频繁项目集挖掘及更新算法 被引量:164
1
作者 宋余庆 朱玉全 +1 位作者 孙志挥 陈耿 《软件学报》 EI CSCD 北大核心 2003年第9期1586-1592,共7页
挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tr... 挖掘最大频繁项目集是多种数据挖掘应用中的关键问题,之前的很多研究都是采用Apriori类的候选项目集生成-检验方法.然而,候选项目集产生的代价是很高的,尤其是在存在大量强模式和/或长模式的时候.提出了一种快速的基于频繁模式树(FP-tree)的最大频繁项目集挖掘DMFIA(discover maximum frequent itemsets algorithm)及其更新算法UMFIA(update maximum frequent itemsets algorithm).算法UMFIA将充分利用以前的挖掘结果来减少在更新的数据库中发现新的最大频繁项目集的费用. 展开更多
关键词 数据挖掘 最大频繁项目集 关联规则 频繁模式树 增量式更新
下载PDF
数据挖掘综述 被引量:91
2
作者 钟晓 马少平 +1 位作者 张钹 俞瑞钊 《模式识别与人工智能》 EI CSCD 北大核心 2001年第1期48-55,共8页
数据挖掘技术是一个新兴的、非常重要的、具有广阔应用前景和富有挑战性的研究领域。本文结合具体实例,从概念、方法、特点、任务、过程、应用以及所面临的挑战等各方面对其作了较详细的评述。
关键词 数据挖掘 关联规则 聚类 数据库
原文传递
概念格与关联规则发现 被引量:97
3
作者 谢志鹏 刘宗田 《计算机研究与发展》 EI CSCD 北大核心 2000年第12期1415-1421,共7页
作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究 .而由二元关系导出的概念格则是一种非常有用的形式化工具 ,它体现了概念内涵和外延的统一 ,反映了对象和特征间的联系以及概念间的泛化与例化关系 ,因此非常适于发现数据... 作为数据挖掘核心任务之一的关联规则发现已经得到了广泛的研究 .而由二元关系导出的概念格则是一种非常有用的形式化工具 ,它体现了概念内涵和外延的统一 ,反映了对象和特征间的联系以及概念间的泛化与例化关系 ,因此非常适于发现数据中潜在的概念 .分析了概念格与关联规则提取之间的关系 ,根据需要对格结构进行了相应的修改 ,提出了相应的渐进式生成算法和基于概念格的关联规则提取算法 ,通过定理和性质对算法进行了说明并对关联规则进行缩减 . 展开更多
关键词 概念格 关联规则 数据挖掘 数据库 知识发现
下载PDF
中文网络客户评论的产品特征挖掘方法研究 被引量:130
4
作者 李实 叶强 +1 位作者 李一军 RobLaw 《管理科学学报》 CSSCI 北大核心 2009年第2期142-152,共11页
随着互联网的广泛应用,在Blog、BBS、Wiki等网络站点中出现了大量的针对商品或服务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的... 随着互联网的广泛应用,在Blog、BBS、Wiki等网络站点中出现了大量的针对商品或服务的客户评论,这些客户评论中所包含的丰富信息,对企业管理具有重要的价值.通过数据挖掘算法对客户针对某一产品的大量评论进行分析,可以挖掘出这些产品的主要特征,并有望进一步发现客户对这些特征的意见和态度.在英文世界中已经有学者开始对这一研究进行探索,然而由于语言结构等方面的差异,英文的研究成果尚无法直接应用于中文客户评论的挖掘中.本研究针对中文的特点,提出了面向中文的客户评论挖掘方法.该方法基于改进关联规则算法实现了针对中文产品评论的产品特征信息挖掘.本研究采用通过互联网获得的针对手机、数码相机、书籍等5种产品的评论语料,对该方法进行了数据实验,实验结果初步验证了该方法有效性. 展开更多
关键词 用户评论 产品特征 关联规则 数据挖掘
下载PDF
基于概念格的分类和关联规则的集成挖掘方法 被引量:64
5
作者 胡可云 陆玉昌 石纯一 《软件学报》 EI CSCD 北大核心 2000年第11期1478-1484,共7页
改进了一个 Bordat的建格算法 ,使之适合于集成挖掘的需要 ,进而提出一个从概念格上提取关联规则和分类规则的算法 ,实现了关联规则和分类规则的挖掘在概念格框架下的统一 .
关键词 分类 关联规则 数据挖掘 机器学习
下载PDF
关联规则挖掘技术及发展动向 被引量:40
6
作者 朱绍文 王泉德 +2 位作者 黄浩 彭清涛 陆玉昌 《计算机工程》 EI CAS CSCD 北大核心 2000年第9期4-6,共3页
介绍了关联规则挖掘的主要内容和最新进展,对关联规则的各种挖掘算法进行比较,分析了关联规则挖掘的各种扩展和改进模型.
关键词 知识发现 数据挖掘 关联规则
下载PDF
采用关联规则综合分析和变权重系数的电力变压器状态评估方法 被引量:102
7
作者 李黎 张登 +2 位作者 谢龙君 俞斌 林福昌 《中国电机工程学报》 EI CSCD 北大核心 2013年第24期152-159,22,共8页
电力变压器的状态评估不仅要求智能技术的融合,还应该考虑所有检测状态量之间的相互联系。根据信息数据关联规则和因素空间理论的变权综合概念,提出了一种对电力变压器进行状态评估的方法。通过分析变压器运行中各单项状态量参数与故障... 电力变压器的状态评估不仅要求智能技术的融合,还应该考虑所有检测状态量之间的相互联系。根据信息数据关联规则和因素空间理论的变权综合概念,提出了一种对电力变压器进行状态评估的方法。通过分析变压器运行中各单项状态量参数与故障类型的关联性,建立综合状态量集合。引入关联规则方法,计算单项状态量的常权重系数;引入具备均衡函数的变权综合模式,计算综合状态量的变权重系数。由此结合既有检测规程,建立了一个较为客观、准确的变压器状态评估体系。运行实例分析表明,该状态评估方法有利于准确地评判电力变压器的真实运行状态。 展开更多
关键词 变压器 关联规则 状态评估 变权重系数
下载PDF
关联规则挖掘中Apriori算法的研究与改进 被引量:95
8
作者 崔贯勋 李梁 +2 位作者 王柯柯 苟光磊 邹航 《计算机应用》 CSCD 北大核心 2010年第11期2952-2955,共4页
经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和... 经典的产生频繁项目集的Apriori算法存在多次扫描数据库可能产生大量候选及反复对候选项集和事务进行模式匹配的缺陷,导致了算法的效率较低。为此,对Apriori算法进行以下3方面的改进:改进由k阶频繁项集生成k+1阶候选频繁项集时的连接和剪枝策略;改进对事务的处理方式,减少Apriori算法中的模式匹配所需的时间开销;改进首次对数据库的处理方法,使得整个算法只扫描一次数据库,并由此提出了改进算法。实验结果表明,改进算法在性能上得到了明显提高。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 频繁项集 候选项集
下载PDF
大数据与数学地球科学研究进展——大数据与数学地球科学专题代序 被引量:94
9
作者 周永章 陈烁 +4 位作者 张旗 肖凡 王树功 刘艳鹏 焦守涛 《岩石学报》 SCIE EI CAS CSCD 北大核心 2018年第2期255-263,共9页
大数据与数学地球科学的核心应用技术包括高维数据降维、图像数据处理、无限数据流挖掘、机器学习、关联规则算法与推荐系统算法等。人工智能地质学,包括大数据-智能矿床成因模型与找矿模型的构建,是具有重要价值的研究方向。高维数据... 大数据与数学地球科学的核心应用技术包括高维数据降维、图像数据处理、无限数据流挖掘、机器学习、关联规则算法与推荐系统算法等。人工智能地质学,包括大数据-智能矿床成因模型与找矿模型的构建,是具有重要价值的研究方向。高维数据降维旨在从初始高维特征集合中选出低维特征集合,有效地消除无关和冗余特征,增强学习结果的易理解性。哈希算法、聚类分析、主成分分析等是较常用的数学降维工具。机器学习是人工智能的核心,是使计算机具有智能的根本途径。机器学习与人工智能各种基础问题的统一性观点正在形成。深度学习的训练模型往往需要海量数据作为支撑,因此迁移学习方法日益受到重视。图像模式识别是大数据挖掘的重要技术。网络中的社区结构识别对理解整个网络的结构和功能有重要价值,可帮助分析、预测网络各元素间的交互关系。沉浸式虚拟现实技术是实现大数据可视化的重要方向,对具有多元、异构、时空性、非线性、多尺度地质矿产勘查数据的展示要求有特别的价值。引入VR技术进行矿产地质大数据的可视化,可实现大数据时代矿产勘查数据的新认知。无限数据流在地质、地球化学、地球物理监测中大量存在,甚至可以持续自动产生。对数据流数据的计算包括对点查询、范围查询、内积查询、分位数计算、频繁项计算等。关联规则和推荐系统算法是大数据挖掘中的重要算法,其应用范围越来越广泛。贝叶斯原理在大数据时代有独特的价值,贝叶斯网络是成因建模的一个革命性工具。智能地质学研究刚刚起步,构建大数据-智能矿床成因模型与找矿模型是智能地质学研究的重要内容。矿床模型研究方式的变革,将出现于互联网、云计算技术环境下全球各地的矿床研究团队的共同参与。 展开更多
关键词 大数据挖掘 高维数据降维 图像数据处理 无限数据流挖掘 机器学习 关联规则 人工智能地质学 智能矿床模型 贝叶斯网络
下载PDF
Apriori算法的三种优化方法 被引量:71
10
作者 徐章艳 刘美玲 +2 位作者 张师超 卢景丽 区玉明 《计算机工程与应用》 CSCD 北大核心 2004年第36期190-192,202,共4页
通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改... 通过对Apriori算法的思想和性能的分析,认为Apriori算法存在以下三点不足:(1)由K阶频繁集生成K+1阶候选频繁集时,在K+1阶候选频繁集中过滤掉非频繁集的策略值得进一步改进;(2)连接程序中相同的项目重复比较太多,因而其效率值得进一步改进;(3)在回扫数据库时有许多不必比较的项目或事务重复比较。根据上述三点不足,提出了相应的三种优化策略来优化Apriori算法,得到一效率较高的改进Apriori算法。 展开更多
关键词 关联规则 APRIORI算法 频繁项集 非频繁项集
下载PDF
关联规则挖掘算法综述 被引量:51
11
作者 毕建欣 张岐山 《中国工程科学》 2005年第4期88-94,共7页
介绍了关联规则挖掘算法的基本原理,并按照挖掘中涉及到的变量数目(维数)、数据的抽象层次和处理变量的类别(布尔型和数值型) ,依次对关联规则挖掘算法的研究进行综述,并对一些典型的算法进行分析和比较,最后展望了关联规则挖掘算法的... 介绍了关联规则挖掘算法的基本原理,并按照挖掘中涉及到的变量数目(维数)、数据的抽象层次和处理变量的类别(布尔型和数值型) ,依次对关联规则挖掘算法的研究进行综述,并对一些典型的算法进行分析和比较,最后展望了关联规则挖掘算法的研究方向。 展开更多
关键词 数据挖掘 关联规则 算法 综述
下载PDF
数据挖掘技术 被引量:51
12
作者 吉根林 孙志挥 《中国图象图形学报(A辑)》 CSCD 北大核心 2001年第8期715-721,共7页
数据挖掘技术是当前数据库和人工智能领域研究的热点课题 ,为了使人们对该领域现状有个概略了解 ,在消化大量文献资料的基础上 ,首先对数据挖掘技术的国内外总体研究情况进行了概略介绍 ,包括数据挖掘技术的产生背景、应用领域、分类及... 数据挖掘技术是当前数据库和人工智能领域研究的热点课题 ,为了使人们对该领域现状有个概略了解 ,在消化大量文献资料的基础上 ,首先对数据挖掘技术的国内外总体研究情况进行了概略介绍 ,包括数据挖掘技术的产生背景、应用领域、分类及主要挖掘技术 ;结合作者的研究工作 ,对关联规则的挖掘、分类规则的挖掘、离群数据的挖掘及聚类分析作了较详细的论述 ;介绍了关联规则挖掘的主要研究成果 ,同时指出了关联规则衡量标准的不足及其改进方法 ,提出了分类模式的准确度评估方法 ;最后 ,描述了数据挖掘技术在科学研究、金融投资、市场营销、保险业、制造业及通信网络管理等行业的应用情况 ,并对数据挖掘技术的应用前景作了展望 . 展开更多
关键词 数据挖掘 决策支持 关联规则 分类规则 KDD 知识发现 数据库 人工智能 聚类分析 离群数据挖掘
下载PDF
关联规则挖掘的Apriori算法的改进 被引量:51
13
作者 黄进 尹治本 《电子科技大学学报》 EI CAS CSCD 北大核心 2003年第1期76-79,共4页
提出一种将Apriori算法与散列技术和事务压缩技术相结合的改进算法,研究了散列函数的构造及其对算法效率的影响,分析了事务压缩技术的原理及其实现方法,用实例给出了原算法与改进算法的实现步骤,结果表明,新算法减小了存储空间,提高了... 提出一种将Apriori算法与散列技术和事务压缩技术相结合的改进算法,研究了散列函数的构造及其对算法效率的影响,分析了事务压缩技术的原理及其实现方法,用实例给出了原算法与改进算法的实现步骤,结果表明,新算法减小了存储空间,提高了算法的效率,并改进了数据挖掘技术的性能。 展开更多
关键词 数据挖掘 关联规则 APRIORI算法 散列 事务压缩 布尔
下载PDF
消渴病复方配伍规律的关联规则分析 被引量:46
14
作者 姚美村 艾路 +1 位作者 袁月梅 乔延江 《北京中医药大学学报》 CAS CSCD 北大核心 2002年第6期48-50,共3页
应用关联规则分析技术 ,对治疗消渴病的中药复方配伍的科学内涵进行探索性分析研究。以文献中收录的 10 6个治疗消渴病的中药复方为对象 ,经解析后建立复方特征数据库 ;以数据挖掘系统EnterpriseMiner为平台 ,关联规则分析为工具 ,在单... 应用关联规则分析技术 ,对治疗消渴病的中药复方配伍的科学内涵进行探索性分析研究。以文献中收录的 10 6个治疗消渴病的中药复方为对象 ,经解析后建立复方特征数据库 ;以数据挖掘系统EnterpriseMiner为平台 ,关联规则分析为工具 ,在单味药层次上进行消渴病复方组成药味之间的关联模式研究。在中医用药的不同组合层次上 ,不同专家在针对不同症状的治疗方法与对消渴病的认识和治疗原则基本一致。治疗消渴病复方在配伍方面确有一定的科学规律存在 ,数据挖掘技术作为知识获取的有力工具 ,可以将隐含在数据中的配伍规律以可理解方式进行表述 。 展开更多
关键词 消渴病 复方 配伍规律 关联规则
原文传递
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 被引量:70
15
作者 黄名选 严小卫 张师超 《软件学报》 EI CSCD 北大核心 2009年第7期1854-1865,共12页
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘... 提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高. 展开更多
关键词 信息检索 伪相关反馈 查询扩展 关联规则 矩阵加权
下载PDF
基于关联规则的Web文档聚类算法 被引量:41
16
作者 宋擒豹 沈钧毅 《软件学报》 EI CSCD 北大核心 2002年第3期417-423,共7页
Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看... Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值. 展开更多
关键词 产联规则 WWW Web文档聚类算法 数据挖掘 数据库
下载PDF
数据挖掘中常用关联规则挖掘算法 被引量:69
17
作者 王爱平 王占凤 +1 位作者 陶嗣干 燕飞飞 《计算机技术与发展》 2010年第4期105-108,共4页
文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-gr... 文中首先介绍了数据挖掘中关联规则的经典算法——Apriori算法。再从宽度、深度、划分、采样、增量式更新等几个角度对关联规则挖掘进行了分类讨论。然后运用文献查询和比较分析的方法对常见的关联规则挖掘算法进行了概述,主要包括FP-growth算法、DHP算法、Partition算法、FUP算法、CD算法等算法。最后对关联规则挖掘的发展远景进行了展望。 展开更多
关键词 数据挖掘 关联规则 频繁项集 挖掘算法
下载PDF
数据挖掘技术及其在高校教学系统中的应用 被引量:49
18
作者 魏萍萍 王翠茹 +1 位作者 王保义 张振兴 《计算机工程》 CAS CSCD 北大核心 2003年第11期87-89,共3页
分析和指出了现有一些关联规则算法的优缺点,并进行改进,对教学信息库进行 数据挖掘,寻找高校教学体制中各因素间的关联关系,为高校管理决策提供了科学依据?
关键词 数据挖掘 关联规则 频繁项集
下载PDF
挖掘关联规则中的一种优化的Apriori算法 被引量:50
19
作者 徐章艳 张师超 +2 位作者 区玉明 卢景丽 刘美玲 《计算机工程》 CAS CSCD 北大核心 2003年第19期83-84,87,共3页
对文献[1]中给出的算法以及Apriori算法的思想和性能进行了分析,提出一种优化的Apriori算法,该算法较文献[1]的算法更优。
关键词 关联规则 APRIORI算法 算法效率
下载PDF
基于Apriori的有效关联规则挖掘算法的研究 被引量:37
20
作者 张梅峰 张建伟 +1 位作者 张新敬 娄淑琴 《计算机工程与应用》 CSCD 北大核心 2003年第19期196-198,共3页
通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了... 通过对Apriori算法进行的分析与研究,发现其在实用中存在两个主要问题:生成的关联规则具有相当大的冗余性;有可能挖掘出一条支持度和置信度均很高,但却是无趣的、甚至是虚假的关联规则,且不能产生带有否定项的规则。鉴于此,该文给出了关联规则的两个性质和引入兴趣度的第三个度量———相关支持度,设计了挖掘出有效关联规则算法,较好地解决了上述问题。 展开更多
关键词 数据挖掘 关联规则 APRIORI 兴趣度
下载PDF
上一页 1 2 167 下一页 到第
使用帮助 返回顶部