期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
图数据挖掘技术的研究与进展 被引量:14
1
作者 丁悦 张阳 +1 位作者 李战怀 王勇 《计算机应用》 CSCD 北大核心 2012年第1期182-190,共9页
生物信息学(蛋白质结构分析、基因组识别)、社会网络(实体间的联系)、Web分析(Web链接结构分析、Web内容挖掘和Web日志搜索)以及文本信息检索等的迅速发展积累了大量图数据,对于图数据的挖掘逐渐成为研究领域的热点。一些诸如聚类、分... 生物信息学(蛋白质结构分析、基因组识别)、社会网络(实体间的联系)、Web分析(Web链接结构分析、Web内容挖掘和Web日志搜索)以及文本信息检索等的迅速发展积累了大量图数据,对于图数据的挖掘逐渐成为研究领域的热点。一些诸如聚类、分类、频繁模式挖掘的传统数据挖掘研究逐渐拓展到图数据领域。通过介绍现阶段图数据挖掘技术的研究进展,总结了图数据挖掘的特点、现实意义、主要问题以及应用场景,讨论并预测了图数据,尤其是不确定图数据研究的发展趋势和热点。 展开更多
关键词 数据挖掘 图数据 聚类 分类 频繁模式 不确定图
下载PDF
一种新的基于频繁闭显露模式的图分类方法 被引量:10
2
作者 刘勇 李建中 朱敬华 《计算机研究与发展》 EI CSCD 北大核心 2007年第7期1169-1176,共8页
由于图模型能够准确地表示科学与工程领域中数据的关键特征,图挖掘逐渐成为了数据挖掘领域的热点研究内容.图分类是图挖掘的一个重要研究分支.提出了一种新的基于频繁闭显露模式的图分类方法CEP,其基本思想是首先挖掘频繁闭图模式,然后... 由于图模型能够准确地表示科学与工程领域中数据的关键特征,图挖掘逐渐成为了数据挖掘领域的热点研究内容.图分类是图挖掘的一个重要研究分支.提出了一种新的基于频繁闭显露模式的图分类方法CEP,其基本思想是首先挖掘频繁闭图模式,然后从闭图模式中得到显露模式,最后根据显露模式构造一系列分类规则.实验结果显示:在对化合物数据分类时,CEP在分类性能上优于目前最好的图分类方法.而且,领域专家容易理解和利用CEP产生的分类规则. 展开更多
关键词 频繁图模式 闭图模式 显露模式 图分类 图挖掘
下载PDF
一种新的基于嵌入集的图分类方法 被引量:5
3
作者 王桂娟 印鉴 詹卫许 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2311-2319,共9页
随着图数据收集技术在许多科学领域的发展,对图数据分类已成为机器学习和数据挖掘领域的重要课题.目前已经提出许多图分类方法.其中,一些图分类方法采用3步来构筑分类模型;一些图分类方法采用2步来构筑分类模型.这些方法在挖掘频繁子图... 随着图数据收集技术在许多科学领域的发展,对图数据分类已成为机器学习和数据挖掘领域的重要课题.目前已经提出许多图分类方法.其中,一些图分类方法采用3步来构筑分类模型;一些图分类方法采用2步来构筑分类模型.这些方法在挖掘频繁子图或特征子图时,只考虑到子图的结构信息,而没有考虑到子图的嵌入信息.为此,在L-CCAM子图编码的基础上,提出了一种基于嵌入集的图分类方法.该方法采用基于类别信息的特征子图选择策略,不但考虑了子图的结构信息,而且在频繁子图挖掘过程中充分利用嵌入信息——嵌入集,通过一步即直接选择特征子图以及生成分类规则.实验结果表明:在对化合物数据分类时,在分类精度上该方法优于采用3步的图分类方法;在运行效率上该方法优于采用2步和3步的图数据分类方法. 展开更多
关键词 频繁子图 图分类 图挖掘 特征选择 嵌入集 数据挖掘
下载PDF
基于频繁模式图的多维关联规则挖掘算法研究 被引量:4
4
作者 刘波 潘久辉 《电子学报》 EI CAS CSCD 北大核心 2007年第8期1612-1616,F0003,共6页
关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁... 关联规则挖掘是数据挖掘领域中重要的研究分支,频繁项集或频繁谓词集的计算是其中的关键问题.本文针对包括多值属性的关系数据库,以多维关联规则挖掘为目标,研究频繁谓词集的计算方法,提出了MPG算法及IMPG增量算法.MPG算法通过构建频繁模式图MP-graph,按照深度优先搜索方法,动态挖掘频繁谓词集,只需扫描数据库一次.此外,该方法至多增加一次数据库扫描,就能扩展为IMPG算法,进行增量关联规则挖掘.文章分析了算法时间和空间性能,用实验说明了算法的有效性. 展开更多
关键词 多维关联规则挖掘 频繁谓词集 频繁模式图 增量式挖掘
下载PDF
多源攻击模式图入侵检测方法 被引量:5
5
作者 张礼哲 顾兆军 +1 位作者 何波 刘树发 《计算机工程与设计》 北大核心 2016年第11期2909-2916,共8页
针对入侵检测分析方法中因IDS误报漏报,无法完整还原整个攻击场景的问题,提出一种基于多源日志分析的入侵检测方法。使用PrefixSpan算法对序列化后的攻击过程序列数据进行频繁模式挖掘,构建多源攻击模式图;当网络中产生新警告时,按警告... 针对入侵检测分析方法中因IDS误报漏报,无法完整还原整个攻击场景的问题,提出一种基于多源日志分析的入侵检测方法。使用PrefixSpan算法对序列化后的攻击过程序列数据进行频繁模式挖掘,构建多源攻击模式图;当网络中产生新警告时,按警告所属设备在攻击模式图中进行攻击模式匹配,匹配成功后采用可疑攻击识别算法构建可疑攻击模式图,发现新的攻击过程。实验结果表明,该方法在进行攻击场景还原时还原率高于其它方法,对未知攻击过程具有一定检测能力。 展开更多
关键词 入侵检测 多源警告 警告日志 频繁模式 攻击模式图
下载PDF
基于多源位置数据的居民出行频繁模式挖掘 被引量:3
6
作者 吴成凤 蔡莉 +1 位作者 李劲 梁宇 《计算机科学》 CSCD 北大核心 2021年第7期155-163,共9页
随着城市化进程的不断深入,居民出行频繁模式挖掘成为一个研究热点。然而,现有的研究存在一些问题,如缺乏对频繁模式发生的目的和意义的描述,以及对挖掘结果分析不全面等。针对这些问题,文中提出了一种新颖的居民出行频繁模式挖掘方法(M... 随着城市化进程的不断深入,居民出行频繁模式挖掘成为一个研究热点。然而,现有的研究存在一些问题,如缺乏对频繁模式发生的目的和意义的描述,以及对挖掘结果分析不全面等。针对这些问题,文中提出了一种新颖的居民出行频繁模式挖掘方法(Mining Method of Residents’Frequent Travel Patterns,MMoRFTP)。首先,采用形态学图像方式将地图划分为多个区域,利用融合后的多源位置数据来构建出行模式,并采用主题模型识别每个区域的功能;然后,将缺乏语义信息的出行轨迹转化为具有区域和功能区语义的出行轨迹,并以区域为节点、语义轨迹为边构建居民出行模式图和标签模式图,在图模型构建的基础上提出MulEdge算法来挖掘区域之间由居民出行所形成的频繁关联模式。文中以城市路网数据、POI数据、出租车GPS数据和签到数据作为对象进行实验,结果表明MMoRFTP方法具有良好的性能,其发现的出行频繁模式能为道路规划、交通管理、商业布局等应用提供决策依据。 展开更多
关键词 多源位置数据 城市功能区域 频繁模式图 标签图 频繁模式挖掘
下载PDF
基于类别信息的特征子图选择策略 被引量:2
7
作者 王桂娟 印鉴 詹卫许 《计算机科学》 CSCD 北大核心 2011年第8期169-170,175,共3页
选择频繁的特征子图在基于频繁子图的图数据分类中起着非常重要的作用。提出了一种基于类别信息的特征子图选择策略,即从候选的频繁子图中选出独有频繁子图和显著频繁子图作为特征子图。实验结果显示,在对化合物数据分类时,该选择策略... 选择频繁的特征子图在基于频繁子图的图数据分类中起着非常重要的作用。提出了一种基于类别信息的特征子图选择策略,即从候选的频繁子图中选出独有频繁子图和显著频繁子图作为特征子图。实验结果显示,在对化合物数据分类时,该选择策略在分类性能上优于SVM方法特征选择策略和CEP方法的特征选择策略。 展开更多
关键词 频繁子图 图分类 图挖掘 特征选择
下载PDF
频繁子图挖掘研究综述 被引量:1
8
作者 鲁慧民 冯博琴 宋擒豹 《微电子学与计算机》 CSCD 北大核心 2009年第3期156-161,共6页
归纳了频繁子图挖掘方法的处理流程,分析评价了频繁子图挖掘的典型算法:广度优先搜索和深度优先搜索的频繁子图挖掘算法,概述了频繁子图挖掘研究的平台——图模型及其产生器,并对频繁子图挖掘方法未来研究方向进行了展望.
关键词 子图同构 频繁子图挖掘 图模型 图产生器
下载PDF
Extracting Frequent Connected Subgraphs from Large Graph Sets
9
作者 WeiWang Qing-QingYuan Hao-FengZhou Ming-ShengHong Bai-LeShi 《Journal of Computer Science & Technology》 SCIE EI CSCD 2004年第6期867-875,共9页
Mining frequent patterns from datasets is one of the key success of data mining research. Currently, most of the studies focus on the data sets in which the elements are independent, such as the items in the marketing... Mining frequent patterns from datasets is one of the key success of data mining research. Currently, most of the studies focus on the data sets in which the elements are independent, such as the items in the marketing basket. However, the objects in the real world often have close relationship with each other. How to extract frequent patterns from these relations is the objective of this paper. The authors use graphs to model the relations, and select a simple type for analysis. Combining the graph theory and algorithms to generate frequent patterns, a new algorithm called Topology, which can mine these graphs efficiently, has been proposed. The performance of the algorithm is evaluated by doing experiments with synthetic datasets and real data. The experimental results show that Topology can do the job well. At the end of this paper, the potential improvement is mentioned. 展开更多
关键词 data mining frequent pattern graph
原文传递
时序网络的频繁演化模式挖掘 被引量:1
10
作者 蒋志恒 《现代计算机》 2019年第2期15-19,共5页
对随时间演化的动态网络的分析对于理解隐藏在时序网络数据中的复杂演变过程是一个非常关键的挑战,图的演化规则模式在较小的子图层面上捕获这一复杂的过程。现存关于图的频繁模式挖掘的研究大多限于非动态图的频繁模式挖掘,或仅仅是将... 对随时间演化的动态网络的分析对于理解隐藏在时序网络数据中的复杂演变过程是一个非常关键的挑战,图的演化规则模式在较小的子图层面上捕获这一复杂的过程。现存关于图的频繁模式挖掘的研究大多限于非动态图的频繁模式挖掘,或仅仅是将非动态网络频繁模式挖掘的方法简单迁移到动态网络挖掘中去,无法高效地处理维度扩展的图数据。提出一种一般性的频繁演化模式挖掘的方法,通过将演化模式挖掘问题规约于约束满足问题(CSP),较大地降低频繁演化模式挖掘的复杂度。实验表明,该方法有较高的性能。 展开更多
关键词 频繁模式 演化模式 动态网络 时序图
下载PDF
工作流的非邻接模式挖掘算法
11
作者 周颜军 车进辉 王晓东 《计算机工程》 CAS CSCD 北大核心 2010年第12期88-89,93,共3页
为了发现业务执行流程中的潜在知识,提出一种非邻接模式挖掘算法,同时考虑活动和边的发生频率,结合工作流模型和作用日志,以图分析方法挖掘工作流非邻连模式。该算法对候选模式搜索空间进行充分剪枝,以提高运行效率,可以为业务流程的改... 为了发现业务执行流程中的潜在知识,提出一种非邻接模式挖掘算法,同时考虑活动和边的发生频率,结合工作流模型和作用日志,以图分析方法挖掘工作流非邻连模式。该算法对候选模式搜索空间进行充分剪枝,以提高运行效率,可以为业务流程的改造和优化提供依据。 展开更多
关键词 工作流 频繁非邻接模式 图挖掘
下载PDF
面向多任务的定制指令模式提取
12
作者 薄拾 葛宁 林孝康 《计算机工程与设计》 CSCD 北大核心 2010年第15期3416-3418,3431,共4页
为提高嵌入式处理器对计算密集型应用的处理能力,并增强定制指令的适应性,提出一种面向多任务的定制指令模式自动化提取方法。该方法以目标应用的热点代码数据流图集合作为分析对象,通过流图频率加权的方式实现目标任务的优先级调整,并... 为提高嵌入式处理器对计算密集型应用的处理能力,并增强定制指令的适应性,提出一种面向多任务的定制指令模式自动化提取方法。该方法以目标应用的热点代码数据流图集合作为分析对象,通过流图频率加权的方式实现目标任务的优先级调整,并挖掘隐藏于任务程序热点中的频繁计算模式作为定制指令模式。安全加密和媒体处理优化实例结果表明,该方法可提高定制指令的适应性和利用率,其优化效果优于传统独立设计方式。 展开更多
关键词 指令集扩展 定制指令 多任务 频繁计算模式 数据流图 可配置处理器
下载PDF
多关系频繁模式发现研究 被引量:3
13
作者 张伟 杨炳儒 钱榕 《计算机科学》 CSCD 北大核心 2007年第7期158-164,共7页
频繁模式发现是数据挖掘的重要任务之一。现实数据通常存储于由多个关系组成的关系数据库中。传统的频繁模式发现方法只能直接完成单一关系中的模式发现,如果要完成多关系数据的挖掘,会产生操作复杂性和信息丢失等问题。多关系数据挖掘... 频繁模式发现是数据挖掘的重要任务之一。现实数据通常存储于由多个关系组成的关系数据库中。传统的频繁模式发现方法只能直接完成单一关系中的模式发现,如果要完成多关系数据的挖掘,会产生操作复杂性和信息丢失等问题。多关系数据挖掘是当前数据挖掘研究中快速发展的重要领域之一。多关系频繁模式发现方法能够直接从复杂结构化数据中发现涉及多个关系的复杂频繁模式,避免了传统方法的局限。本文首先归纳多关系频繁模式发现方法的发生历史背景,其次分析总结多关系频繁模式发现方法,最后提出了多关系频繁模式发现将来发展需重点解决的问题和面临的挑战。 展开更多
关键词 多关系数据挖掘 频繁模式发现 归纳逻辑程序设计 选择图 基于图的数据挖掘
下载PDF
频繁量化模式图挖掘及应用
14
作者 沙雨济 王欣 +2 位作者 何艳潇 钟学燕 方宇 《计算机科学》 CSCD 北大核心 2023年第S02期565-576,共12页
频繁模式挖掘(FPM)是图数据研究领域的一个经典问题,单一大图上的FPM问题近年来受到了更加广泛的关注。该问题被定义为根据用户给定的频率阈值查找在大图(Graph)中频繁出现的所有模式图(Pattern)。近年来,人们见证了FPM在多个领域的广... 频繁模式挖掘(FPM)是图数据研究领域的一个经典问题,单一大图上的FPM问题近年来受到了更加广泛的关注。该问题被定义为根据用户给定的频率阈值查找在大图(Graph)中频繁出现的所有模式图(Pattern)。近年来,人们见证了FPM在多个领域的广泛应用,例如社交网络分析、欺诈检测等。然而,面对新兴的应用需求,人们需要更具语义表达力的模式图及其挖掘技术。为此,在传统模式图的基础上,首先提出了量化模式图(Quantified Graph Patterns,QGPs)——一类具有计数量词约束的模式图,实现了模式图语义的扩展;其次设计了一种在分布式场景下挖掘QGPs的算法,提出了量化图模式关联规则(Quantified Graph Pattern Association Rules,QGPARs)及其挖掘技术,用于预测(社交)网络中实体之间的潜在联系,然后利用真实图和合成图数据,通过翔实的实验验证了QGPs挖掘算法的计算效率,通过与经典链接预测方法进行对比,发现QGPARs可以取得更高的链接预测准确性;最后通过与传统图模式关联规则(Graph Pattern Association Rules,GPARs)的链接预测结果进行对比,验证了QGPARs与GPARs之间在链接预测结果方面存在显著差异,也进一步验证了QGPARs在链接预测中的有效性。 展开更多
关键词 量化模式图 频繁模式挖掘 分布式挖掘 量化图模式关联规则 链接预测
下载PDF
一种基于频繁模式有向无环图的数据流频繁模式挖掘算法 被引量:4
15
作者 任家东 王倩 王蒙 《燕山大学学报》 CAS 2011年第2期115-120,共6页
频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在... 频繁模式挖掘中基于FP-growth的算法需要扫描两次事务数据库,预先给定支持度,且不支持时间敏感型数据。本文提出了一种基于频繁模式有向无环图的数据流频繁模式挖掘算法,它根据事务到来的时间给每个事务一个序号,每个事务中的数据项在存储前按数据项的顺序进行调整,频繁模式有向无环图的构建遵循这个顺序并用序号来记录事务与数据项的包含关系,模式增长过程只需要增加有向边上的序号。通过逆向遍历带有相同序号的有向边,产生条件模式基,根据动态定义的阈值抽取条件模式基信息,一次扫描数据库得到频繁模式。实验结果表明,本文算法的执行效率优于FP-growth算法,且存储节点的数目明显减少。 展开更多
关键词 数据流 频繁模式 频繁模式有向无环图
下载PDF
基于中医方剂数据库的Top-Rank-k频繁模式挖掘算法 被引量:1
16
作者 秦琦冰 谭龙 《计算机应用》 CSCD 北大核心 2017年第2期329-334,共6页
为降低中医(TCM)方剂频繁模式挖掘过程中对经验参数的依赖,提高挖掘结果的准确性,针对中医方剂的数据特点,提出一种基于带权无向图的Top-Rank-k频繁模式挖掘算法。该算法可以直接挖掘出频繁k-itemset(k≥3)而无需产生1-itemset和2-items... 为降低中医(TCM)方剂频繁模式挖掘过程中对经验参数的依赖,提高挖掘结果的准确性,针对中医方剂的数据特点,提出一种基于带权无向图的Top-Rank-k频繁模式挖掘算法。该算法可以直接挖掘出频繁k-itemset(k≥3)而无需产生1-itemset和2-itemset,并随之快速回溯到核心药物组合的频繁项集所对应的方剂信息;此外,采用一种动态位向量(DBV)的压缩机制对无向图中边的权重进行压缩存储,以有效地提高算法的空间存储效率。分别对中医方剂数据集、真实数据集(Chess、Pumsb和Retail)和合成数据集(T10I4D100K和Test2K50KD1)进行测试和比较,结果表明该算法与i NTK和BTK相比具有更高的时间和空间效率,而且也可以应用于其他类型的数据集。 展开更多
关键词 中医方剂 Top-Rank-k 频繁模式 带权无向图 动态位向量
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部