期刊文献+
共找到36篇文章
< 1 2 >
每页显示 20 50 100
关联规则和聚类分析在个性化推荐中的应用 被引量:18
1
作者 鲍玉斌 王大玲 于戈 《东北大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第12期1149-1152,共4页
提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测... 提出了两种应用访问页面关联规则和访问模式聚类分析结果相结合进行个性化推荐的方法,即将聚类分析作为关联规则的预处理和将关联规则和聚类分析互补使用,并与单独应用访问页面关联规则或访问模式聚类分析结果进行个性化推荐时的推荐测度进行了比较·实验表明,将聚类分析作为关联规则的预处理的推荐方法可以显著地提高推荐的准确率,而将关联规则和聚类分析互补使用的推荐方法具有较高的推荐覆盖率·同时发现将聚类分析和关联规则结合使用并不能同时改善推荐的准确率和覆盖率· 展开更多
关键词 WEB使用挖掘 页面关联规则 访问模式聚类 个性化推荐 WEB挖掘
下载PDF
基于组合服务执行信息的服务选取方法研究 被引量:18
2
作者 张明卫 魏伟杰 +2 位作者 张斌 张锡哲 朱志良 《计算机学报》 EI CSCD 北大核心 2008年第8期1398-1411,共14页
组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶... 组合服务选取问题是服务计算领域的一个研究热点问题,已往的选取方法大多基于难以准确获取的服务QoS信息,且算法思路复杂.文中提出了一种基于组合服务执行信息的服务选取方法.该方法分为3个阶段:数据生成阶段、数据挖掘阶段和服务选取阶段,分别进行组合服务执行信息的记载和相关数据集的生成、路径分支关联规则和服务执行顺序序列模式的挖掘以及基于挖掘产生的知识模式进行服务选取.文中首先给出一种可以方便记载日志的服务组合系统架构;然后提出一种基于时间加权的算法模型,以有效地进行路径分支关联规则和顺序序列模式的挖掘;最后对文中的组合服务选取方法进行描述.实验结果表明:文中方法在选取出的组合服务健壮性方面要优于基于QoS的方法. 展开更多
关键词 组合服务 服务选取 关联规则 序列模式 数据挖掘
下载PDF
Efficient Incremental Maintenance of Frequent Patterns with FP-Tree 被引量:9
3
作者 Xiu-LiMa Yun-HaiTong +1 位作者 Shi-WeiTang Dong-QingYang 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第6期876-884,共9页
Mining frequent patterns has been studied popularly in data mining area. However, little work has been done on mining patterns when the database has an influx of fresh data constantly. In these dynamic scenarios, effi... Mining frequent patterns has been studied popularly in data mining area. However, little work has been done on mining patterns when the database has an influx of fresh data constantly. In these dynamic scenarios, efficient maintenance of the discovered patterns is crucial. Most existing methods need to scan the entire database repeatedly, which is an obvious disadvantage. In this paper, an efficient incremental mining algorithm, Incremental-Mining (IM), is proposed for maintenance of the frequent patterns when incremental data come. Based on the frequent pattern tree (FP-tree) structure, IM gives a way to make the most of the things from the previous mining process, and requires scanning the original data once at most. Furthermore, IM can identify directly the differential set of frequent patterns, which may be more informative to users. Moreover, IM can deal with changing thresholds as well as changing data, thus provide a full maintenance scheme. IM has been implemented and the performance study shows it outperforms three other incremental algorithms: FUP, DB-tree and re-running frequent pattern growth (FP-growth). Keywords data mining - association rule mining - frequent pattern mining - incremental mining Supported by the National Basic Research 973 Program of China under Grant No.G1999032705.Xiu-Li Ma received the Ph.D. degree in computer science from Peking University in 2003. She is currently a postdoctoral researcher at National Lab on Machine Perception of Peking University. Her main research interests include data warehousing, data mining, intelligent online analysis, and sensor network.Yun-Hai Tong received the Ph.D. degree in computer software from Peking University in 2002. He is currently an assistant professor at School of Electronics Engineering and Computer Science of Peking University. His research interests include data warehousing, online analysis processing and data mining.Shi-Wei Tang received the B.S. degree in mathematics from Peking University in 1964. Now, he is a professor and Ph.D. su 展开更多
关键词 data mining association rule mining frequent pattern mining incremental mining
原文传递
An Overview of Data Mining and Knowledge Discovery 被引量:8
4
作者 范建华 李德毅 《Journal of Computer Science & Technology》 SCIE EI CSCD 1998年第4期348-368,共21页
With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data ... With massive amounts of data stored in databases, mining information and knowledge in databases has become an important issue in recent research. Researchers in many different fields have shown great interest in data mining and knowledge discovery in databases. Several emerging applications in information providing services, such as data warehousing and on-line services over the Internet, also call for various data mining and knowledge discovery techniques to understand user behavior better, to improve the service provided, and to increase the business opportunities. In response to such a demand, this article is to provide a comprehensive survey on the data mining and knowledge discovery techniques developed recently, and introduce some real application systems as well. In conclusion, this article also lists some problems and challenges for further research. 展开更多
关键词 Knowledge discovery in databases data mining machine learning association rule CLASSIFICATION data clustering data generalization pattern searching
原文传递
一种基于置信度的异常检测模型与设计 被引量:6
5
作者 周晔 杨天奇 《计算机仿真》 CSCD 2005年第1期167-169,共3页
入侵检测系统一直以来都是多层安全体系架构不可或缺的一部分。异常检测试图判定程序当前行为与已建立的正常的运行模式是否发生较大偏移来判断入侵的发生 ,能有效地识别未知的入侵模式 ,具有较高的检测率。传统的检测方式通常将结果判... 入侵检测系统一直以来都是多层安全体系架构不可或缺的一部分。异常检测试图判定程序当前行为与已建立的正常的运行模式是否发生较大偏移来判断入侵的发生 ,能有效地识别未知的入侵模式 ,具有较高的检测率。传统的检测方式通常将结果判定为真或假 ,并由于各种因素的影响而产生了伪肯定和伪否定。通过将网络行为的可能攻击程度描述为连续量 ,并分析检测规则的置信度和网络行为的可能攻击程度之间存在的关系 ,以检测规则的置信度来判定是攻击行为的可能性 。 展开更多
关键词 异常检测 关联规则 序列模式挖掘 置信度
下载PDF
Oracle安全审计技术设计 被引量:7
6
作者 仝世君 《煤炭技术》 CAS 北大核心 2011年第6期266-267,共2页
分析了Oracle安全机制,对其安全审计技术进行了研究。Oracle数据库自身没有针对安全审计数据的分析工具,为了改进与完善Oracle当前安全审计机制,采用了数据挖掘技术,将数据挖掘技术应用至Oracle数据库安全审计中来,对数据库的记录特点... 分析了Oracle安全机制,对其安全审计技术进行了研究。Oracle数据库自身没有针对安全审计数据的分析工具,为了改进与完善Oracle当前安全审计机制,采用了数据挖掘技术,将数据挖掘技术应用至Oracle数据库安全审计中来,对数据库的记录特点进行分析,通过审计记录的分析,提出了在序列模式挖掘及关联规则2种技术基础上,建立用户正常行为模式的方法。同时,还建立了针对Oracle的安全审计分析系统,分析审计数据。 展开更多
关键词 ORACLE 安全审计 关联规则 序列模式挖掘
下载PDF
Quantum Algorithm for Mining Frequent Patterns for Association Rule Mining
7
作者 Abdirahman Alasow Marek Perkowski 《Journal of Quantum Information Science》 CAS 2023年第1期1-23,共23页
Maximum frequent pattern generation from a large database of transactions and items for association rule mining is an important research topic in data mining. Association rule mining aims to discover interesting corre... Maximum frequent pattern generation from a large database of transactions and items for association rule mining is an important research topic in data mining. Association rule mining aims to discover interesting correlations, frequent patterns, associations, or causal structures between items hidden in a large database. By exploiting quantum computing, we propose an efficient quantum search algorithm design to discover the maximum frequent patterns. We modified Grover’s search algorithm so that a subspace of arbitrary symmetric states is used instead of the whole search space. We presented a novel quantum oracle design that employs a quantum counter to count the maximum frequent items and a quantum comparator to check with a minimum support threshold. The proposed derived algorithm increases the rate of the correct solutions since the search is only in a subspace. Furthermore, our algorithm significantly scales and optimizes the required number of qubits in design, which directly reflected positively on the performance. Our proposed design can accommodate more transactions and items and still have a good performance with a small number of qubits. 展开更多
关键词 Data mining association Rule mining Frequent pattern Apriori Algorithm Quantum Counter Quantum Comparator Grover’s Search Algorithm
下载PDF
基于频繁模式图的多维关联规则挖掘算法研究 被引量:4
8
作者 刘波 潘久辉 《电子学报》 EI CAS CSCD 北大核心 2007年第8期1612-1616,F0003,共6页
关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁... 关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁模式图MP-graph,按照深度优先搜索方法,动态挖掘频繁谓词集,只需扫描数据库一次.此外,该方法至多增加一次数据库扫描,就能扩展为IMPG算法,进行增量关联规则挖掘.文章分析了算法时间和空间性能,用实验说明了算法的有效性. 展开更多
关键词 多维关联规则挖掘 频繁谓词集 频繁模式图 增量式挖掘
下载PDF
Discovering Association Rules with Graph Patterns in Temporal Networks 被引量:1
9
作者 Chu Huang Qianzhen Zhang +2 位作者 Deke Guo Xiang Zhao Xi Wang 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2023年第2期344-359,共16页
Discovering regularities between entities in temporal graphs is vital for many real-world applications(e.g.,social recommendation,emergency event detection,and cyberattack event detection).This paper proposes temporal... Discovering regularities between entities in temporal graphs is vital for many real-world applications(e.g.,social recommendation,emergency event detection,and cyberattack event detection).This paper proposes temporal graph association rules(TGARs)that extend traditional graph-pattern association rules in a static graph by incorporating the unique temporal information and constraints.We introduce quality measures(e.g.,support,confidence,and diversification)to characterize meaningful TGARs that are useful and diversified.In addition,the proposed support metric is an upper bound for alternative metrics,allowing us to guarantee a superset of patterns.We extend conventional confidence measures in terms of maximal occurrences of TGARs.The diversification score strikes a balance between interestingness and diversity.Although the problem is NP-hard,we develop an effective discovery algorithm for TGARs that integrates TGARs generation and TGARs selection and shows that mining TGARs is feasible over a temporal graph.We propose pruning strategies to filter TGARs that have low support or cannot make top-k as early as possible.Moreover,we design an auxiliary data structure to prune the TGARs that do not meet the constraints during the TGARs generation process to avoid conducting repeated subgraph matching for each extension in the search space.We experimentally verify the effectiveness,efficiency,and scalability of our algorithms in discovering diversified top-k TGARs from temporal graphs in real-life applications. 展开更多
关键词 temporal networks graph association rule subgraph pattern matching graph mining big graphs
原文传递
快速统一挖掘超团模式和极大超团模式 被引量:3
10
作者 肖波 张亮 +2 位作者 徐前方 蔺志青 郭军 《软件学报》 EI CSCD 北大核心 2010年第4期659-671,共13页
超团模式是一种新型的关联模式,这种模式所包含的项目相互间具有很高的亲密度.超团模式中某个项目在事务中的出现很强地暗示了模式中其他项目也会相应地出现.极大超团模式是一组超团模式更加紧凑的表示,可被用于多种应用.挖掘这两种模... 超团模式是一种新型的关联模式,这种模式所包含的项目相互间具有很高的亲密度.超团模式中某个项目在事务中的出现很强地暗示了模式中其他项目也会相应地出现.极大超团模式是一组超团模式更加紧凑的表示,可被用于多种应用.挖掘这两种模式的标准算法是完全不同的.提出一种基于FP-tree(frequent pattern tree)的快速挖掘算法——混合超团模式增长(hybrid hyperclique pattern growth,简称HHCP-growth),统一了两种模式的挖掘.算法采用递归挖掘方法,并应用多种有效的剪枝策略.提出并证明几个相关命题来说明剪枝策略的有效性和算法的正确性.实验结果表明,HHCP-growth算法相对于标准的超团模式挖掘算法和极大超团模式挖掘算法都具有更高的效率,尤其对于大数据集或在低支持度条件下更为显著. 展开更多
关键词 关联规则 超团模式 极大超团模式 数据挖掘:频繁模式树
下载PDF
基于Eclat算法的图书推荐系统仿真 被引量:4
11
作者 陈康 《计算机仿真》 CSCD 北大核心 2010年第9期311-314,共4页
研究了图书馆的个性化推荐系统应用问题,针对常用的协同过滤技术不适用于大数据量的情况,在深入研究关联规则Eclat算法的基础上,为了高效挖掘和优先搜索有效信息,提出了一种改进算法,并将算法应用于图书推荐系统的仿真实验中,新算法充... 研究了图书馆的个性化推荐系统应用问题,针对常用的协同过滤技术不适用于大数据量的情况,在深入研究关联规则Eclat算法的基础上,为了高效挖掘和优先搜索有效信息,提出了一种改进算法,并将算法应用于图书推荐系统的仿真实验中,新算法充分利用了垂直数据表示和交叉计数的高效优势,直接在垂直数据表示的数据集上通过广度优先搜索和交叉计数产生频繁模式,通过对流通数据库中的借阅记录进行挖掘得到关联规则,产生读者感兴趣的书目。仿真结果表明算法可以在大数据量的情况下实现关联规则的高效挖掘,在图书推荐系统中取得了良好的应用效果。 展开更多
关键词 图书推荐 关联规则 频繁模式挖掘 推荐系统
下载PDF
基于免疫原理的数据库入侵检测方法研究 被引量:2
12
作者 李晓华 董晓梅 于戈 《小型微型计算机系统》 CSCD 北大核心 2009年第12期2343-2347,共5页
基于免疫原理,提出一种数据库入侵检测方法,利用SQL Server 2000的事件探查器完成了对历史审计数据和测试数据的采集,实现了基于免疫的数据库异常检测方法.为了验证提出算法的有效性,在相同测试集上,同基于关联规则的数据库异常检测和... 基于免疫原理,提出一种数据库入侵检测方法,利用SQL Server 2000的事件探查器完成了对历史审计数据和测试数据的采集,实现了基于免疫的数据库异常检测方法.为了验证提出算法的有效性,在相同测试集上,同基于关联规则的数据库异常检测和基于序列模式的数据库异常检测的方法进行了实验数据比较,结果表明基于免疫的数据库入侵检测在降低漏报率和假报率,提高检测率和正确率方面优于其他两种方法,具有较好的性能. 展开更多
关键词 数据库入侵检测 异常检测 关联规则挖掘 序列模式挖掘 免疫原理
下载PDF
一种基于数据挖掘的目标行为规律分析算法 被引量:3
13
作者 高轶 王鹏 《无线电工程》 2018年第12期1043-1047,共5页
针对目标行为规律分析问题,提出了一种基于数据挖掘的目标行为规律分析算法。为提高数据质量并降低数据复杂度,利用异常点剔除、数据拟合和地理网格技术对目标轨迹数据进行了预处理。采集目标多次轨迹数据,构建目标行为序列数据,对序列... 针对目标行为规律分析问题,提出了一种基于数据挖掘的目标行为规律分析算法。为提高数据质量并降低数据复杂度,利用异常点剔除、数据拟合和地理网格技术对目标轨迹数据进行了预处理。采集目标多次轨迹数据,构建目标行为序列数据,对序列数据进行序列模式挖掘分析,以获取目标的行为规律。利用真实的目标轨迹数据对算法性能进行了测试,实验结果表明,所提算法能够实现目标行为规律的分析。 展开更多
关键词 目标行为 数据挖掘 关联分析 序列模式挖掘
下载PDF
A Novel Incremental Mining Algorithm of Frequent Patterns for Web Usage Mining 被引量:1
14
作者 DONG Yihong ZHUANG Yueting TAI Xiaoying 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期777-782,共6页
Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a... Because data warehouse is frequently changing, incremental data leads to old knowledge which is mined formerly unavailable. In order to maintain the discovered knowledge and patterns dynamically, this study presents a novel algorithm updating for global frequent patterns-IPARUC. A rapid clustering method is introduced to divide database into n parts in IPARUC firstly, where the data are similar in the same part. Then, the nodes in the tree are adjusted dynamically in inserting process by "pruning and laying back" to keep the frequency descending order so that they can be shared to approaching optimization. Finally local frequent itemsets mined from each local dataset are merged into global frequent itemsets. The results of experimental study are very encouraging. It is obvious from experiment that IPARUC is more effective and efficient than other two contrastive methods. Furthermore, there is significant application potential to a prototype of Web log Analyzer in web usage mining that can help us to discover useful knowledge effectively, even help managers making decision. 展开更多
关键词 incremental algorithm association rule frequent pattern tree web usage mining
下载PDF
Finding susceptible and protective interaction patterns in large-scale genetic association study
15
作者 Yuan LI Yuhai ZHAO +4 位作者 Guoren WANG Xiaofeng ZHU Xiang ZHANG Zhanghui WANG Jun PANG 《Frontiers of Computer Science》 SCIE EI CSCD 2017年第3期541-554,共14页
Interaction detection in large-scale genetic asso- ciation studies has attracted intensive research interest, since many diseases have complex traits. Various approaches have been developed for finding significant gen... Interaction detection in large-scale genetic asso- ciation studies has attracted intensive research interest, since many diseases have complex traits. Various approaches have been developed for finding significant genetic interactions. In this article, we propose a novel framework SRMiner to detect interacting susceptible and protective genotype patterns. SR- Miner can discover not only probable combination of single nucleotide polymorphisms (SNPs) causing diseases but also the corresponding SNPs suppressing their pathogenic func- tions, which provides a better prospective to uncover the un- derlying relevance between genetic variants and complex dis- eases. We have performed extensive experiments on several real WeUcome Trust Case Control Consortium (WTCCC) datasets. We use the pathway-based and the protein-protein interaction (PPI) network-based evaluation methods to verify the discovered patterns. The results show that SRMiner successfully identifies many disease-related genes verified by the existing work. Furthermore, SRMiner can also infer some uncomfirmed but highly possible disease-related genes. 展开更多
关键词 genetic association studies genotype pattern mining data mining BIOINFORMATICS
原文传递
基于校园网的用户行为数据分析系统的设计
16
作者 严楠 刘涛 《计算机技术与发展》 2007年第1期239-241,244,共4页
数据分析系统是Web日志挖掘系统的一个重要组成部分,是模式分析的前序步骤,主要包括数据预处理和模式挖掘两个过程。数据预处理包括数据净化、用户会话识别和路径补充;模式挖掘包括事务识别、关联规则分析、序列模式分析、分类分析和聚... 数据分析系统是Web日志挖掘系统的一个重要组成部分,是模式分析的前序步骤,主要包括数据预处理和模式挖掘两个过程。数据预处理包括数据净化、用户会话识别和路径补充;模式挖掘包括事务识别、关联规则分析、序列模式分析、分类分析和聚类分析。在研究传统的分析方法的基础上,结合了一种改进的路径补充算法,经验证表明分析效率显著提高。 展开更多
关键词 数据预处理 用户会话 事务 关联规则 模式挖掘
下载PDF
基于模式矩阵的液体火箭发动机试车台故障关联规则挖掘 被引量:2
17
作者 王珉 胡茑庆 秦国军 《宇航学报》 EI CAS CSCD 北大核心 2011年第4期947-952,共6页
为发现试车台状态变量与其工作状况的关联关系,本文对液体火箭发动机试车台历史测试数据进行关联规则挖掘,对试车台状态参数进行选择和编码,使用自适应阈值算法对测试数据进行离散化,引入模式矩阵用于计算事务数据库中的频繁项集,提出... 为发现试车台状态变量与其工作状况的关联关系,本文对液体火箭发动机试车台历史测试数据进行关联规则挖掘,对试车台状态参数进行选择和编码,使用自适应阈值算法对测试数据进行离散化,引入模式矩阵用于计算事务数据库中的频繁项集,提出了基于模式矩阵的关联规则挖掘方法,并将该方法应用于对多组历史测试数据进行频繁项集挖掘,对挖掘结果的分析表明:与传统方法相比,本文方法效率高,计算量小,挖掘结果能正确反映试车台状态变量与其工作状况间的关联规则,为试车台的测试数据挖掘提供了一种有效方法。 展开更多
关键词 液体火箭发动机 试车台 关联规则 模式矩阵 数据挖掘
下载PDF
基于关联图的频繁闭模式挖掘 被引量:2
18
作者 王璇 《辽东学院学报(自然科学版)》 CAS 2011年第2期154-158,163,共6页
将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系。在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技... 将关联图的数据挖掘思想应用到频繁闭模式的挖掘中,使用位向量的技术简化项集支持度的计算,构造关联图表示项集间的频繁关系。在此基础上,提出一种频繁闭模式挖掘算法,针对频繁闭模式的特点,结合剪枝策略、子集检测策略、搜索策略等技术手段,优化算法性能。实验结果表明,该算法在时间性能上优于经典的频繁闭模式算法CLOSET。 展开更多
关键词 关联图 频繁闭模式 位向量 数据挖掘
下载PDF
一种基于频繁模式的关联规则改进算法 被引量:1
19
作者 刘丽娜 李德雄 《河北省科学院学报》 CAS 2006年第3期51-53,共3页
分析了基于频繁模式的关联规则算法Fptree,给出了一种基于二进制表示的改进算法,详细介绍了该算法的主要思想,算法实现方案。并通过实例比较了两种算法,证明新算法提高了挖掘规则的效率。
关键词 关联规则 频繁模式 数据挖掘
下载PDF
基于模式发现技术的教学问卷数据分析
20
作者 吴军 魏丹丹 《信息与电脑》 2022年第11期247-249,共3页
为了帮助教师找到适用于不同类型学生的教学方法和策略,利用数据挖掘中的模式发现技术对教学问卷数据进行研究和分析。首先,收集和预处理问卷数据;其次,引入关联规则挖掘技术和差异模式挖掘技术对问卷数据进行模式挖掘;再次,利用随机性... 为了帮助教师找到适用于不同类型学生的教学方法和策略,利用数据挖掘中的模式发现技术对教学问卷数据进行研究和分析。首先,收集和预处理问卷数据;其次,引入关联规则挖掘技术和差异模式挖掘技术对问卷数据进行模式挖掘;再次,利用随机性检验过滤挖掘的假阳性关联规则和差异模式;最后,将保留的关联规则和差异模式与教育背景结合起来分析模式中蕴含的信息。结果表明,以上方法可以在一定程度上帮助教师提高教学水平。 展开更多
关键词 数据挖掘 关联规则挖掘 差异模式挖掘 教学数据分析
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部