期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
大数据时代基于DBSCAN聚类方法的审计抽样 被引量:9
1
作者 程平 陈珊 《中国注册会计师》 北大核心 2016年第4期76-79,共4页
高度信息化的大数据时代,导致企业的生产经营产生大量、分散、复杂的会计数据,在审计全覆盖无法实现的情况下,审计抽样的质量至关重要。针对现有审计抽样问题,本文提出了在已有的审计领域知识库的基础上,建立审计样本与审计目标的关联规... 高度信息化的大数据时代,导致企业的生产经营产生大量、分散、复杂的会计数据,在审计全覆盖无法实现的情况下,审计抽样的质量至关重要。针对现有审计抽样问题,本文提出了在已有的审计领域知识库的基础上,建立审计样本与审计目标的关联规则,并利用DBSCAN聚类算法对审计抽样关联规则进行聚类,接着对聚类结果进行新颖度评价,筛选出高价值聚类结果存入审计领域知识库,实现审计领域知识的积累和再利用。最后,运用审计实例对实验进行分析。 展开更多
关键词 大数据审计 抽样聚类关 规则
下载PDF
基于Spark字典表压缩存储的关联规则算法优化 被引量:6
2
作者 刘丽娜 姜利群 《计算机应用与软件》 北大核心 2021年第8期37-43,共7页
针对大数据新型处理框架Spark执行Apriori算法存在速率低、内存负荷高等不足,提出一种改进的Apriori优化算法。基于字典表压缩存储的机制,结合Spark框架中列式存储模式对多维多属性值的数据集进行压缩,通过Spark集群进行数据并行处理。... 针对大数据新型处理框架Spark执行Apriori算法存在速率低、内存负荷高等不足,提出一种改进的Apriori优化算法。基于字典表压缩存储的机制,结合Spark框架中列式存储模式对多维多属性值的数据集进行压缩,通过Spark集群进行数据并行处理。实验表明,该算法比原算法执行速率提高23%以上,且在数据量越大的情况下其优势更明显。该算法具有降低内存负荷量、去候选频繁项集、提高执行速率等优势,且解决了多维多属性值数据集的分析难题,具备一定的应用价值。 展开更多
关键词 规则 算法优化 压缩存储 字典表
下载PDF
关联规则挖掘中的隐私保护研究 被引量:5
3
作者 张瑞 郑诚 陈娟娟 《计算机技术与发展》 2008年第10期13-15,19,共4页
数据挖掘中的关联规则反映一个事件和其他事件之间依赖或相互关联的知识。随着大量数据不停地收集和存储积累,人们希望从中发现感兴趣的数据关联关系,从而帮助他们进行决策。随着信息技术的发展,数据挖掘在一些深层次的应用中发挥了积... 数据挖掘中的关联规则反映一个事件和其他事件之间依赖或相互关联的知识。随着大量数据不停地收集和存储积累,人们希望从中发现感兴趣的数据关联关系,从而帮助他们进行决策。随着信息技术的发展,数据挖掘在一些深层次的应用中发挥了积极的作用。但与此同时,也带来隐私保护方面的问题。隐私保护是当前数据挖掘领域中一个十分重要的研究问题,其目标是要在不精确访问真实原始数据的条件下,得到准确的模型和分析结果。为了提高对隐私数据的保护程度和挖掘结果的准确性,提出一种有效的隐私保护关联规则挖掘方法。针对关联规则挖掘中需预先给出最小支持度和最小置信度这一条件,提出了一种简单的事务数据库中事务的处理方法,即隐藏那些包含敏感项目的关联规则的方法,以对相关事务作处理,达到隐藏包含敏感项目的关联规则的目的。理论分析和实验结果均表明,基于事务处理的隐私保护关联规则挖掘方法具有很好的隐私性、简单性和适用性。 展开更多
关键词 隐私保护 规则 敏感项目
下载PDF
Tough型约束下的频繁闭项集挖掘
4
作者 沙俐敏 杨淑珍 《计算机工程与设计》 CSCD 北大核心 2006年第11期2041-2043,2048,共4页
回顾了常见的关联规则算法,关注频繁闭项集这一非常有发展前途的方法。在综合Tough型约束与频繁闭项集的基础上,提出了关联规则的一种新算法——基于Tough型约束的频繁闭项集挖掘算法(TC-based FCIM Algorithm),分析了算法中选择过程和... 回顾了常见的关联规则算法,关注频繁闭项集这一非常有发展前途的方法。在综合Tough型约束与频繁闭项集的基础上,提出了关联规则的一种新算法——基于Tough型约束的频繁闭项集挖掘算法(TC-based FCIM Algorithm),分析了算法中选择过程和过滤过程这两个重要过程的先后顺序。 展开更多
关键词 数据挖掘 规则 频繁闭项集 支持度 Tough型约束
下载PDF
基于关联规则的Web文档聚类算法 被引量:41
5
作者 宋擒豹 沈钧毅 《软件学报》 EI CSCD 北大核心 2002年第3期417-423,共7页
Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看... Web文档聚类可以有效地压缩搜索空间,加快检索速度,提高查询精度.提出了一种Web文档的聚类算法.该算法首先采用向量空间模型VSM(vector space model)表示主题,根据主题表示文档;再以文档为事务,以主题为事务项,将文档和主题间的关系看作事务的形式,采用关联规则挖掘算法发现主题频集,相应的文档集即为初步文档类;然后依据类间距离和类内连接强度阈值合并、拆分类,最终实现文档聚类.实验结果表明,该算法是有效的,能处理文档类间固有的重叠情况,具有一定的实用价值. 展开更多
关键词 规则 WWW Web文档聚类算法 数据挖掘 数据库
下载PDF
基于关联规则挖掘的企业财务大数据智能整合方法 被引量:1
6
作者 杨晓燕 《中国管理信息化》 2023年第21期61-64,共4页
常规的企业财务数据智能整合方法以集中整合为主,最终的整合数据中存在多种类别,影响财务数据的后续应用。因此,本文设计了基于关联规则挖掘的企业财务大数据智能整合方法。划分出企业财务大数据智能整合层次,将基础财务数据、业务财务... 常规的企业财务数据智能整合方法以集中整合为主,最终的整合数据中存在多种类别,影响财务数据的后续应用。因此,本文设计了基于关联规则挖掘的企业财务大数据智能整合方法。划分出企业财务大数据智能整合层次,将基础财务数据、业务财务数据、全面数据分层次整合,构建更加完善的信息系统,满足数据共享度与协同性的整合需求。基于关联规则挖掘调用企业财务数据整合智能合约,将企业财务待整合数据标记为data字段,调用智能合约的函数签名与参数编码,完成整合的数据标记为from字段,避免出现数据重复整合的问题。采用对比实验,验证了方法的整合效率更高,能够应用于企业财务工作中。 展开更多
关键词 规则挖掘 企业财务 大数据 智能整合方法
下载PDF
数据挖掘技术在人力资源管理中的应用——基于医院的研究 被引量:1
7
作者 潘敬民 《跨世纪》 2008年第11期195-196,共2页
随着医院信息化进程的不断推进,人力资源管理将更加依赖于数据信息。本文针对一个真实的医院人力资源数.据集,通过关联规则分析了在医院人力资源管理中适用的数据挖掘技术与过程,研究分析的结果具有较好的解释性,以期帮助医院对这... 随着医院信息化进程的不断推进,人力资源管理将更加依赖于数据信息。本文针对一个真实的医院人力资源数.据集,通过关联规则分析了在医院人力资源管理中适用的数据挖掘技术与过程,研究分析的结果具有较好的解释性,以期帮助医院对这一系统能够有更全面地认识,促进医院人力货源管理水平实现跨越式提升。 展开更多
关键词 数据挖掘 医院人力资源 规则
下载PDF
关联规则的下钻研究
8
作者 徐爱萍 刘德喜 《计算机工程》 CAS CSCD 北大核心 2006年第1期87-89,共3页
关联规则的下钻操作沿袭了OLAP中的下钻的概念,它是通过对已经挖掘得到的用户感兴趣的规则进行再分析,挖掘出用户感兴趣的子关联规则。该文提出了关联规则下钻及相关的概念,并在该概念的基础上给出了下钻的算法及复杂度分析。
关键词 规则 下钻操作 子关规则 子项集
下载PDF
基于下钻操作的多层关联规则挖掘算法研究
9
作者 刘德喜 何炎祥 邢显黎 《三峡大学学报(自然科学版)》 CAS 2006年第2期169-173,共5页
多层关联规则涉及多个抽象层中的项,它是通过有概念分层的关联规则挖掘而产生的.传统的方法仅考察每个概念层次内是否有用户感兴趣的规则,而忽略了不同概念之间的规则.另外,很多挖掘出的规则并不是用户感兴趣的.提出的关联规则的下钻操... 多层关联规则涉及多个抽象层中的项,它是通过有概念分层的关联规则挖掘而产生的.传统的方法仅考察每个概念层次内是否有用户感兴趣的规则,而忽略了不同概念之间的规则.另外,很多挖掘出的规则并不是用户感兴趣的.提出的关联规则的下钻操作沿袭了OLAP中下钻的概念,它是通过对已经挖掘得到的用户感兴趣的规则进行再分析,挖掘出用户感兴趣的子关联规则,从而达高效挖掘多层关联规则的目的,且这种规则不局限于同一概念层次内. 展开更多
关键词 多层关规则 下钻操作 子关规则 子项集
下载PDF
基于量化相关模式的多值关联规则挖掘算法
10
作者 沈西挺 龚彩虹 《计算机工程与设计》 CSCD 北大核心 2013年第7期2422-2425,共4页
为了解决多值关联规则挖掘中忽视罕见且有价值的非频繁模式的问题,提出了一种新的多值关联规则挖掘算法—QCoMine。该算法引入了量化相关模式的概念,通过考察多值属性间互信息熵和全置信度,找到具有强信息关系的属性集进而产生规则。实... 为了解决多值关联规则挖掘中忽视罕见且有价值的非频繁模式的问题,提出了一种新的多值关联规则挖掘算法—QCoMine。该算法引入了量化相关模式的概念,通过考察多值属性间互信息熵和全置信度,找到具有强信息关系的属性集进而产生规则。实验结果表明,由于在属性层和区间层进行了剪枝,因此缩减了搜索空间,提高了算法的性能,且得到更高置信度、更有价值的规则。 展开更多
关键词 多值关规则 非频繁模式 量化相关模式 互信息 全置信度
下载PDF
联还是不联
11
作者 方友忠 《北京第二外国语学院学报》 2005年第6期39-44,32,共7页
联诵是法语语言学习中一个比较独特的语音现象,对于法语初学者、甚至对于已经具有相当法语语言水平的人来说,都是一个非常重要而困难的知识点。“到底联还是不联”是许多包括法国人在内的法语人的困惑。法语的联诵分为必要联诵、禁止联... 联诵是法语语言学习中一个比较独特的语音现象,对于法语初学者、甚至对于已经具有相当法语语言水平的人来说,都是一个非常重要而困难的知识点。“到底联还是不联”是许多包括法国人在内的法语人的困惑。法语的联诵分为必要联诵、禁止联诵和自由联诵。法语是一门非常讲究的语言,在不同的场合正确、恰当地运用联诵,是保证交流顺利进行的一个重要的前提条件。 展开更多
关键词 节奏组 规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部