期刊文献+
共找到77篇文章
< 1 2 4 >
每页显示 20 50 100
一种高效频繁子图挖掘算法 被引量:35
1
作者 李先通 李建中 高宏 《软件学报》 EI CSCD 北大核心 2007年第10期2469-2480,共12页
由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,... 由于在频繁项集和频繁序列上取得的成功,数据挖掘技术正在着手解决结构化模式挖掘问题——频繁子图挖掘.诸如化学、生物学、计算机网络和WWW等应用技术都需要挖掘此类模式.提出了一种频繁子图挖掘的新算法.该算法通过对频繁子树的扩展,避免了图挖掘过程中高代价的计算过程.目前最好的频繁子图挖掘算法的时间复杂性是O(n3·2n),其中,n是图集中的频繁边数.提出算法的时间复杂性是O[2n·n2.5/logn],性能提高了O((1/2)n·logn)倍.实验结果也证实了这一理论分析. 展开更多
关键词 频繁模式挖掘 子图同构 子树同构 频繁子树 生成树
下载PDF
FSMBUS:一种基于Spark的大规模频繁子图挖掘算法 被引量:21
2
作者 严玉良 董一鸿 +1 位作者 何贤芒 汪卫 《计算机研究与发展》 EI CSCD 北大核心 2015年第8期1768-1783,共16页
随着社交网络用户数的快速增加,大规模单图上频繁子图挖掘的需求越来越强烈.单机算法对大规模图的运行效率较低,难以支撑支持度较低的频繁子图的挖掘;现有的分布式环境下单图的频繁子图挖掘算法不支持子图增长模式的挖掘,它们所使用的Ha... 随着社交网络用户数的快速增加,大规模单图上频繁子图挖掘的需求越来越强烈.单机算法对大规模图的运行效率较低,难以支撑支持度较低的频繁子图的挖掘;现有的分布式环境下单图的频繁子图挖掘算法不支持子图增长模式的挖掘,它们所使用的Hadoop框架也不适合运行迭代式算法.提出了一种基于Spark的大规模单图频繁子图挖掘算法FSMBUS,通过次优树构建并行计算的候选子图,在给定最小支持度时挖掘出所有的频繁子图,并利用非频繁检测和搜索顺序选择实现优化,还设计了一种名为Sorted-Greedy的轻量级数据划分方法.实验结果表明,FSMBUS的效率要比现有单图上最新的算法快一个数量级,并支持更低最小支持度阈值以及更大规模图数据的挖掘,同时FSMBUS比其Hadoop的移植版要快2~4倍. 展开更多
关键词 频繁子图 大规模单图 分布式挖掘 SPARK 负载均衡
下载PDF
图数据中频繁模式挖掘算法研究综述 被引量:9
3
作者 高琳 覃桂敏 周晓峰 《电子学报》 EI CAS CSCD 北大核心 2008年第8期1603-1609,共7页
本文对图数据中的频繁模式挖掘算法进行了综述.依据算法的特性和数学基础对算法进行了分类,主要集中于算法的求解思想和不同算法之间的关系的比较,并对一些著名的算法进行了详细的分析和讨论.基于算法的特性,比较了各种算法适用的范围... 本文对图数据中的频繁模式挖掘算法进行了综述.依据算法的特性和数学基础对算法进行了分类,主要集中于算法的求解思想和不同算法之间的关系的比较,并对一些著名的算法进行了详细的分析和讨论.基于算法的特性,比较了各种算法适用的范围以及应用领域.最后,讨论了频繁模式挖掘的最新进展及未来的研究方向. 展开更多
关键词 频繁子图 频繁模式挖掘 图的匹配 图的同构
下载PDF
从图数据库中挖掘频繁跳跃模式 被引量:10
4
作者 刘勇 李建中 高宏 《软件学报》 EI CSCD 北大核心 2010年第10期2477-2493,共17页
很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保... 很多频繁子图挖掘算法已被提出.然而,这些算法产生的频繁子图数量太多而不能被用户有效地利用.为此,提出了一个新的研究问题:挖掘图数据库中的频繁跳跃模式.挖掘频繁跳跃模式既可以大幅度地减少输出模式的数量,又能使有意义的图模式保留在挖掘结果中.此外,跳跃模式还具有抗噪声干扰能力强等优点.然而,由于跳跃模式不具有反单调性质,挖掘它们非常具有挑战性.通过研究跳跃模式自身的特性,提出了两种新的裁剪技术:基于内扩展的裁剪和基于外扩展的裁剪.在此基础上又给出了一种高效的挖掘算法GraphJP(an algorithm for mining jump patterns from graph databases).另外,还严格证明了裁剪技术和算法GraphJP的正确性.实验结果表明,所提出的裁剪技术能够有效地裁剪图模式搜索空间,算法GraphJP是高效、可扩展的. 展开更多
关键词 数据挖掘 图挖掘 图数据库 频繁子图 跳跃模式
下载PDF
一种频繁子图挖掘算法 被引量:7
5
作者 唐德权 谭阳 《计算机工程》 CAS CSCD 2012年第7期31-33,共3页
为减少频繁子图规范化检测的时间复杂度,对规范化邻接矩阵的相关性质进行分析。给出相关定理并证明其正确性,从而减少冗余候选子图的产生。在此基础上,提出一种频繁子图挖掘算法——FSM_CAM。实验结果证明,与现有频繁子图挖掘算法FSubGr... 为减少频繁子图规范化检测的时间复杂度,对规范化邻接矩阵的相关性质进行分析。给出相关定理并证明其正确性,从而减少冗余候选子图的产生。在此基础上,提出一种频繁子图挖掘算法——FSM_CAM。实验结果证明,与现有频繁子图挖掘算法FSubGraphM相比,FSM_CAM算法的效率较高。 展开更多
关键词 频繁子图 规范邻接矩阵 候选子图 数据挖掘
下载PDF
一种基于Apriori思想的频繁子图发现算法 被引量:5
6
作者 李玉华 罗汉果 孙小林 《计算机工程与科学》 CSCD 2007年第4期84-87,共4页
如今,关联规则技术应用在许多非传统领域,许多已有的频繁项集搜索方法已经不适用了。一种解决的方法就是用图的形式表示这些领域的事务,然后利用基于图论的数据挖掘技术发现频繁子图。本文提出了一种基于Aproiri思想的频繁子图发现算法S... 如今,关联规则技术应用在许多非传统领域,许多已有的频繁项集搜索方法已经不适用了。一种解决的方法就是用图的形式表示这些领域的事务,然后利用基于图论的数据挖掘技术发现频繁子图。本文提出了一种基于Aproiri思想的频繁子图发现算法SLAGM,它可以有效地挖掘简单图中的频繁子图。实验证明,该算法在性能上优于另一种子图挖掘算法AGM。 展开更多
关键词 图论 频繁子图 数据挖掘
下载PDF
现代物流系统中基于频繁子图的RFID路径挖掘算法 被引量:6
7
作者 胡孔法 孙艳 +1 位作者 陈崚 宋爱波 《计算机集成制造系统》 EI CSCD 北大核心 2010年第11期2490-2494,共5页
为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘... 为研究射频识别物流挖掘中数据的存储方法,以及基于此类数据集的频繁路径的挖掘,提出基于图的联机分析处理架构,用图来表示物品流动的路径信息,在此基础上提出了基于射频识别数据的频繁子图挖掘算法,来对射频识别频繁路径数据进行挖掘。实验结果与算法分析都表明,基于射频识别数据的频繁子图挖掘算法能够快速有效地挖掘物流频繁子图集。 展开更多
关键词 射频识别 物流 频繁路径 联机分析处理 频繁子图 数据挖掘 算法
下载PDF
图模式挖掘中的子图同构算法 被引量:4
8
作者 董安国 高琳 赵建邦 《数学的实践与认识》 CSCD 北大核心 2011年第13期105-112,共8页
图模式挖掘问题在Web挖掘、生物信息学、社会关系等众多领域有广泛的应用,它涉及到子图的搜索以及子图的同构问题.这两个问题都具有相当高的计算复杂度,现有的子图同构问题大多采用最小编码算法,但对无标签图特别是对无标签无向图,该算... 图模式挖掘问题在Web挖掘、生物信息学、社会关系等众多领域有广泛的应用,它涉及到子图的搜索以及子图的同构问题.这两个问题都具有相当高的计算复杂度,现有的子图同构问题大多采用最小编码算法,但对无标签图特别是对无标签无向图,该算法效率较底,从而子图的同构成为图模式挖掘问题的一个瓶颈.针对无标签图,以代数理论为基础,分别利用度序列和特征值构造了两种子图同构算法,用于对有向图和无向图的同构判别.最后对2个真实生物网络进行了仿真实验,结果表明,算法的效率优于现有算法. 展开更多
关键词 图模式 频繁子图 子图同构 特征值
原文传递
基于路径的频繁子图挖掘算法研究 被引量:3
9
作者 唐德权 张波云 《计算机工程与科学》 CSCD 北大核心 2019年第12期2223-2230,共8页
图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找... 图挖掘是数据挖掘的一个重要研究方向,而图挖掘主要集中在图数据集内频繁子图的挖掘。频繁子图挖掘技术的关键是建立有效机制减少冗余候选子图,以便高效计算和处理所需的频繁子图。提出了一种基于路径的频繁子图挖掘算法,该算法首先找出所有频繁边从而挖掘出频繁单路径,然后通过组合、双射和操作扩展出较多的频繁路径,再通过连接操作产生所有频繁子图候选集。通过定理证明了该算法的正确性和完整性,从理论上分析了该算法时间复杂度低于现有的算法,最后进行了2个图数据集实验,在候选集产生的数量和时间性能2方面验证了算法的优越性。 展开更多
关键词 图挖掘 频繁子图 候选子图 频繁路径 时间性能
下载PDF
基于双索引的子图查询算法 被引量:2
10
作者 陆慧琳 黄博 《计算机工程》 CAS CSCD 北大核心 2015年第1期44-48,共5页
传统的子图查询算法大多只在图数据库上进行一次挖掘算法,即在图数据库上建立稳定的数据库索引后将不再对索引进行更新。随着查询兴趣的改变或数据库的频繁更新,原有的数据库索引将不再能提供有用的信息来减少查询过程中候选图的数量。... 传统的子图查询算法大多只在图数据库上进行一次挖掘算法,即在图数据库上建立稳定的数据库索引后将不再对索引进行更新。随着查询兴趣的改变或数据库的频繁更新,原有的数据库索引将不再能提供有用的信息来减少查询过程中候选图的数量。为此,提出一种双索引的子图查询算法,同时在数据库和查询流上挖掘频繁子图并建立索引。子图查询和查询流索引的建立同步进行,即使查询兴趣改变,查询流索引也能自适应地更新索引信息来优化查询效率。针对数据库的频繁更新,查询流索引已提供实时的有效信息,数据库索引无需重新建立。实验结果表明,双索引的结合能有效提高查询子图的处理效率。 展开更多
关键词 双索引 查询流索引 子图查询 频繁子图 图数据库 子图同构
下载PDF
基于gSpan算法的未知化合物毒性预测 被引量:4
11
作者 谢莹 吴建国 +1 位作者 李炜 许荣斌 《合肥工业大学学报(自然科学版)》 CAS CSCD 北大核心 2007年第10期1278-1280,共3页
gSpan算法是一种基于频繁图的挖掘算法。该算法基于无候选人产生的频繁子图,在图中建立字典序标号,将每个图映射为最小DFS code,再采用深度优先搜索策略挖掘频繁连接子图。与前人算法相比,该算法在生成候选子图时,冗余子图的产生量大大... gSpan算法是一种基于频繁图的挖掘算法。该算法基于无候选人产生的频繁子图,在图中建立字典序标号,将每个图映射为最小DFS code,再采用深度优先搜索策略挖掘频繁连接子图。与前人算法相比,该算法在生成候选子图时,冗余子图的产生量大大减少;在计算候选子图支持度时避免了大量重复扫描数据库,性能卓越。该文的贡献是将gSpan算法应用在挖掘与已知毒性化合物具有相同子结构的化合物研究工作中,进行未知化合物的毒性预测,对相关领域应用发展具有重要意义。 展开更多
关键词 频繁子图 毒性预测 化合物
下载PDF
Spark环境下基于频繁边的大规模单图采样算法 被引量:3
12
作者 李龙洋 董一鸿 +2 位作者 严玉良 陈华辉 钱江波 《计算机研究与发展》 EI CSCD 北大核心 2017年第9期1966-1978,共13页
随着社交网络的流行,对其进行频繁子图挖掘的需求越来越强烈.大数据时代的到来,社交网络规模不断扩大,频繁子图挖掘工作变得愈发困难.在实际应用中,往往并不需要精确地挖掘出频繁子图,采样的方法在保证一定准确率的前提下能够显著提高... 随着社交网络的流行,对其进行频繁子图挖掘的需求越来越强烈.大数据时代的到来,社交网络规模不断扩大,频繁子图挖掘工作变得愈发困难.在实际应用中,往往并不需要精确地挖掘出频繁子图,采样的方法在保证一定准确率的前提下能够显著提高频繁子图挖掘的效率.现有采样算法大多是根据节点的度进行采样,不适用于频繁子图挖掘.提出了一种基于频繁边的采样算法DIMSARI(distributed Monte Carlo sampling algorithm based on random jump and graph induction),在蒙特卡罗算法的基础上增加了根据频繁边进行随机跳的操作,并对其结果进行了图感应操作,进一步增加了算法的准确性,并在理论上证明了该方法的无偏性.实验结果显示:使用DIMSARI算法采样后进行频繁子图挖掘,准确性比现有其他的采样算法有较大的提高,在不同的采样率下采样后的子图的节点度都保持更小的归一化均方偏差. 展开更多
关键词 采样 频繁子图 大规模单图 频繁边 SPARK
下载PDF
一种新的频繁子图挖掘算法 被引量:2
13
作者 郭景峰 张伟 柴然 《计算机工程》 CAS CSCD 北大核心 2011年第20期27-29,32,共4页
传统Aprior频繁子图挖掘算法中存在大量冗余子图。针对该问题,提出一种新的频繁子图挖掘算法(GAI)。介绍一种三层MADI索引结构,用于存储图集的信息,以减少图集的扫描次数,通过扩展ETree树构造频繁子图,并用表来存储候选子图,避免扩展过... 传统Aprior频繁子图挖掘算法中存在大量冗余子图。针对该问题,提出一种新的频繁子图挖掘算法(GAI)。介绍一种三层MADI索引结构,用于存储图集的信息,以减少图集的扫描次数,通过扩展ETree树构造频繁子图,并用表来存储候选子图,避免扩展过程中冗余图的产生以及对整个数据库的扫描,从而简化支持度的计算,提高图/子图同构的查询效率。实验结果表明,与Aprior算法相比,GAI的挖掘效率更高。 展开更多
关键词 APRIORI算法 数据挖掘 子图同构 频繁子图
下载PDF
频繁子图在监控系统数据挖掘中的应用 被引量:3
14
作者 史伟奇 《价值工程》 2015年第9期298-300,共3页
监控系统数据挖掘研究近年来受到了国内外学者的逐渐关注,监控系统数据挖掘是发现基于视频原始底层数据对应于应用层的语义信息关联及对应关系。视频底层数据特征十分复杂,沿用传统数据挖掘思想去理解和看待监控系统数据挖掘还不够。与... 监控系统数据挖掘研究近年来受到了国内外学者的逐渐关注,监控系统数据挖掘是发现基于视频原始底层数据对应于应用层的语义信息关联及对应关系。视频底层数据特征十分复杂,沿用传统数据挖掘思想去理解和看待监控系统数据挖掘还不够。与一般的数据比较,图能够表达更加丰富的语义。把监控系统视频数据转化为图模型,将频繁子图挖掘算法应用到监控系统语义挖掘中,提出一种新的监控系统语义挖掘方法,与现有的方法相比较,该方法具有有效性和可行性。 展开更多
关键词 频繁子图 数据特征 监控系统 语义挖掘
下载PDF
基于联合意义度量的Top-K图模式挖掘 被引量:3
15
作者 刘勇 高宏 李建中 《计算机学报》 EI CSCD 北大核心 2010年第2期215-230,共16页
提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后... 提出了一个新的研究问题:如何挖掘Top-K图模式,联合起来使某个意义度量最大化.利用信息论的概念,给出了两个具体问题的定义MES和MIGS,并证明它们是NP-难.提出了两个高效算法Greedy-TopK和Clus-ter-TopK.Greedy-TopK先产生频繁子图,然后按增量贪心方式选择K个图模式.Cluster-TopK先挖掘频繁子图的一个代表模式集合,然后从代表模式中按增量贪心方式选择K个图模式.当意义度量满足submodular性质时,Greedy-TopK能提供近似比保证.Cluster-TopK没有近似比保证,但比Greedy-TopK更高效.实验结果显示,在结果可用性方面,文中提出的Top-K挖掘优于传统的Top-K挖掘.Cluster-TopK比Greedy-TopK快至少一个数量级.而且,在质量和可用性方面,Cluster-TopK的挖掘结果非常类似于Greedy-TopK的挖掘结果. 展开更多
关键词 图挖掘 图数据库 频繁子图 代表模式 联合熵 信息增益
下载PDF
基于环分布的频繁子图挖掘算法
16
作者 董安国 高琳 +2 位作者 邱在秦 常安定 赵建邦 《工程数学学报》 CSCD 北大核心 2009年第6期977-984,共8页
频繁子图挖掘主要涉及到子图搜索和子图同构问题。对子图搜索问题,本文提出了环分布的概念,并构造了基于环分布的子图搜索算法;对子图同构问题,本文利用度序列和特征值构造了两种算法,分别用于对有向图和无向图的同构判别。利用同构算... 频繁子图挖掘主要涉及到子图搜索和子图同构问题。对子图搜索问题,本文提出了环分布的概念,并构造了基于环分布的子图搜索算法;对子图同构问题,本文利用度序列和特征值构造了两种算法,分别用于对有向图和无向图的同构判别。利用同构算法对搜索出的子图进行同构分类,根据分类结果得到频繁子图。实验结果表明,本算法的效率优于现有算法。 展开更多
关键词 频繁子图 子图搜索 子图同构 特征值 度序列
下载PDF
一种基于特征子图的不确定图分类算法 被引量:1
17
作者 刘意 王勇 尚学群 《陕西师范大学学报(自然科学版)》 CAS CSCD 北大核心 2014年第5期16-19,共4页
采用频繁子图作为特征子图,对不确定图进行分类.提出AGF频繁子图挖掘算法,该算法将频繁子图挖掘问题转换为频繁项挖掘问题,可有效提高频繁子图生成效率.利用频繁子图构造分类模型,首次应用于不确定图,通过实验证明,给出的分类算法具有... 采用频繁子图作为特征子图,对不确定图进行分类.提出AGF频繁子图挖掘算法,该算法将频繁子图挖掘问题转换为频繁项挖掘问题,可有效提高频繁子图生成效率.利用频繁子图构造分类模型,首次应用于不确定图,通过实验证明,给出的分类算法具有良好的分类正确率. 展开更多
关键词 不确定图 分类 频繁子图 特征子图
下载PDF
基于加权动态网络的频繁模式挖掘研究 被引量:2
18
作者 肖港松 陈晓云 《微型机与应用》 2011年第19期7-10,共4页
不同时刻的动态网络往往具有不同权重,针对加权动态网络的频繁模式挖掘,提出一种挖掘算法WGDM,它适用于加权动态社会网络、生物网络等方面的频繁模式挖掘。WGDM算法利用支持度的反单调性裁剪搜索空间,从而减少冗余候选子图,提高算法效... 不同时刻的动态网络往往具有不同权重,针对加权动态网络的频繁模式挖掘,提出一种挖掘算法WGDM,它适用于加权动态社会网络、生物网络等方面的频繁模式挖掘。WGDM算法利用支持度的反单调性裁剪搜索空间,从而减少冗余候选子图,提高算法效率。通过实验测试了WGDM算法的性能,并根据中国实际股票市场网络,利用WGDM算法挖掘股票市场网络中有趣的频繁模式。 展开更多
关键词 加权动态网络 加权图集 频繁子图 图挖掘
下载PDF
基于频繁子图挖掘的典型零件结构获取方法 被引量:2
19
作者 马铁强 徐成荫 刘颖明 《组合机床与自动化加工技术》 北大核心 2011年第11期29-33,37,共6页
典型零件结构是产品的隐性设计知识,用于企业零件资源聚类和检索。为了从零件库中获取典型零件结构,提出基于频繁子图挖掘的典型零件结构获取方法。从基于特征的三维零件模型中提取和筛选特征关系,并建立其有向特征关系图;由海量三维零... 典型零件结构是产品的隐性设计知识,用于企业零件资源聚类和检索。为了从零件库中获取典型零件结构,提出基于频繁子图挖掘的典型零件结构获取方法。从基于特征的三维零件模型中提取和筛选特征关系,并建立其有向特征关系图;由海量三维零件模型的有向特征关系图构成有向特征关系图库;利用Apriori频繁子图挖掘算法对有向特征关系图库实施频繁子图挖掘;通过频繁子图与零件库之间映射关系获取典型零件结构。实例验证了该方法的可行性。 展开更多
关键词 典型零件结构 数据挖掘 频繁子图 三维零件模型 APRIORI 有向特征关系图
下载PDF
基于图数据挖掘算法的犯罪规律研究及应用 被引量:2
20
作者 唐德权 张悦 +1 位作者 贺永恒 肖自红 《计算机技术与发展》 2011年第11期89-91,95,共4页
数据挖掘应用于犯罪集团或恐怖组织社会网络结构分析已经成为公安信息系统领域的研究热点,国内外在分析犯罪和恐怖组织之间的内在规律方面的研究工作亟待深入。与一般的数据挖掘技术相比,图能够表达更加丰富的语义,基于图数据挖掘技术... 数据挖掘应用于犯罪集团或恐怖组织社会网络结构分析已经成为公安信息系统领域的研究热点,国内外在分析犯罪和恐怖组织之间的内在规律方面的研究工作亟待深入。与一般的数据挖掘技术相比,图能够表达更加丰富的语义,基于图数据挖掘技术应用于犯罪规律研究是一种新兴的研究方法。为了挖掘犯罪规律和频繁出现的核心成员,首先提出了基于图数据挖掘的相关理论,然后提出了基于相同犯罪特征频繁子图结构的挖掘犯罪规律算法GDMCR(Graph DataMining Crime Rule),最后利用GDMCR算法得到的频繁子图关联知识分析犯罪规律及网络核心成员。实验证明了文中提出的基于图数据挖掘犯罪规律分析系统的有效性和实用性,并验证了GDMCR算法的有效性。 展开更多
关键词 数据挖掘 频繁子图 犯罪规律 核心成员 关联知识
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部