多核处理器上的频繁图挖掘方法被引量：4

Frequent Graph Mining on Multi-Core Processor

下载PDF

导出

摘要多核处理器已经成为现代处理器的主流体系结构,频繁图挖掘(frequent graph mining)是一个具有很多应用领域的研究热点问题,充分利用多核处理器的能力加速频繁图挖掘过程具有研究意义和实用价值.提出一种基于深度优先遍历的并行挖掘模式,使用任务池维护工作负载,提高数据的时间局部性并减少大量的内存使用;设计缓存敏感的点边数组,连续排列线程的记录数据,减少原始图的数据量,降低缓存缺失率;为了减少锁的竞争,使用灵活的任务获取方法寻找工作任务,采用内存管理队列降低频繁的内存分配释放开销.在模拟数据和真实数据上进行了详细的实验研究和性能分析,结果表明提出的技术能够有效减少内存占用并降低缓存缺失,在具有12个核心的机器上可以达到10倍的加速比. Multi-core processors have become the mainstream of modern processor architecture.Frequent graph mining is a popular problem that has practical applications in many domains.Accelerating the mining process of frequent graphs by taking full advantage of multi-core processors has research significance and practical values.A parallel mining strategy based on depth-first search（DFS）is proposed and a task pool is used to maintain the workload.Compared with the method that utilizes breadth-first search,data temporal locality performance can be improved and a large amount of memory is saved.Cache conscious node-edge arrays in which record data of a thread are arranged continuously are designed to decrease the data size to represent original graphs and cache miss ratio.False sharing that severely degrades performance is mostly eliminated.In order to reduce lock contentions,a flexible method is explored to look for work tasks and memory management queues are utilized to reduce the overhead due to frequent memory allocation and free operations.A detailed performance study and analysis is conducted on both synthetic data and real data sets.The results show that the proposed techniques can efficiently lower memory usage and cache misses and achieve a10-fold speedup on a 12-core machine.

作者栾华周明全付艳

机构地区北京师范大学信息科学与技术学院

出处《计算机研究与发展》 EI CSCD 北大核心 2015年第12期2844-2856,共13页 Journal of Computer Research and Development

基金国家自然科学基金项目(61402041 41301402)

关键词频繁图挖掘多核处理器缓存并行技术深度优先遍历 frequent graph mining multi-core processor cache parallel techniques depth-first search（DFS）

分类号 TP311.13 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献26

1Inokuchi A, Washio T, Motoda H. An apriori-based algorithm for mining frequent substructures from graph data [C] //Proc of the 4th European Conf on Principles of Data Mining and Knowledge Discovery. Beriin; Springer, 2000: 13-23. 被引量：1
2Kuramochi M, Karypis G. Frequent subgraph discovery [C] //Proc of the 1st IEEE Int Conf on Data Mining. Los Alamitos, CA: IEEE Computer Society, 2001: 313-320. 被引量：1
3Borgelt C, Berthold M R. Mining molecular fragments: Finding relevant substructures cf molecules [C]//Proe of the 2nd IEEE Int Conf on Data Mining. Los Alamitos, CA: IEEE Computer Society, 2002:51-58. 被引量：1
4Yan Xifeng, Han Jiawei. gSpan: Graph-based substructure pattern mining [C] //Proc of the 2nd IEEE Int Conf on Data Mining. Los Aiamitos, CA: IEEE Computer Society, 2002: 721-724. 被引量：1
5Huan Jun, Wang Wei, Prins J. Efficient mining of frequent subgraphs in the presence of isomorphism [C]//Proc of the 3rd IEEE Int Conf on Data Mining. Los Alamitos, CA; IEEE Computer Society, 2003:549-552. 被引量：1
6Nijssen S, Kok J N. A quickstart in frequent structure mining can make a difference [C] //Proe of the 10th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York: ACM, 2004: 647-652. 被引量：1
7Hennessy J L, Patterson D A. Computer Architecture: A Quantitative Approach[M]. 4th ed. San Francisco, CA: Morgan Kaufmann, 2006. 被引量：1
8栾华,杜小勇,王珊.缓存敏感的封闭冰山立方体计算[J].软件学报,2010,21(4):620-631. 被引量：4
9Worlein M, Meinl T, Fischer I, et al. A quantitative comparison of the subgraph miners MoFa, gSpan, FFSM, and Gaston [C] //Proc of the 9th European Conf on Principles and Practice of Knowledge Discovery in Databases. Berlin: Springer, 2005:392-403. 被引量：1
10Buehrer G, Parthasarathy S. Adaptive parallel graph mining for CMP architectures [C]//Proc of the 6th IEEE Int Con{ on Data Mining. Los Alamitos, CA: IEEE Computer Society, 2006:97-106. 被引量：1

二级参考文献2

1刘大为,栾华,王珊,覃飙.内存数据库在TPC-H负载下的处理器性能[J].软件学报,2008,19(10):2573-2584. 被引量：10
2邓亚丹,景宁,熊伟.基于共享Cache多核处理器的Hash连接优化[J].软件学报,2010,21(6):1220-1232. 被引量：4

共引文献9

1倪志伟,孟金华,毛雪岷.集合上封闭立方体的计算[J].计算机工程与应用,2011,47(33):36-38.
2颜坚,毕硕本,汪大,郭忆.多核架构下计算凸壳的并行算法[J].计算机科学,2013,40(2):16-19. 被引量：3
3王怀超,赵雷.多核CPU/GPU平台下的集合求交算法[J].计算机工程,2013,39(4):296-299.
4郝慎学.信息化视角下的数据仓库检索优化策略[J].数字技术与应用,2013,31(11):202-202.
5师智斌,高献卫,刘忠宝.一种包含属性蕴含语义的数据立方体结构[J].小型微型计算机系统,2014,35(5):1005-1009. 被引量：2
6黄益彬,金倩倩,纪元.网络数据包高性能并行处理技术研究[J].计算机与现代化,2016(12):57-61. 被引量：4
7范超,赵荣彩,单征,王银浩.一种可配置策略的软件动态完整性度量架构[J].信息工程大学学报,2017,18(1):93-97. 被引量：1
8徐涛,钱帅,卢敏,左海超.一种改进的冰山立方体计算方法及其在机票结算数据中的应用[J].计算机应用研究,2018,35(6):1764-1767.
9龙奔,孙志宏.基于度量认证的协同集成可信部署技术[J].计算机系统应用,2020,29(7):1-11. 被引量：3

同被引文献23

1谢莹,吴建国,李炜,许荣斌.基于gSpan算法的未知化合物毒性预测[J].合肥工业大学学报（自然科学版）,2007,30(10):1278-1280. 被引量：4
2毛国君,宗东军.基于多维数据流挖掘技术的入侵检测模型与算法[J].计算机研究与发展,2009,46(4):602-609. 被引量：25
3余方兴.浅谈计算机数据挖掘[J].计算机光盘软件与应用,2013,16(14):298-298. 被引量：4
4宋艳,何嘉,舒红平,郑皎凌,梁繁荣,任玉兰,文立玉.基于文本挖掘词频反文档频率方法的疾病症状权重挖掘研究[J].成都信息工程学院学报,2014,29(1):52-58. 被引量：4
5林培利.浅析计算机数据挖掘技术在煤矿行业中的应用[J].江西建材,2014(9):229-229. 被引量：2
6张旭东.基于混合数据挖掘方法的入侵检测算法研究[J].信息安全与技术,2015,6(2):31-33. 被引量：18
7孙东亮,周卫平,王家林.输电网故障诊断决策表约简新方法[J].计算机仿真,2015,32(3):153-157. 被引量：6
8贺亚威,侯整风,吴亮亮.一种基于位向量流分类算法的改进[J].合肥工业大学学报（自然科学版）,2015,38(3):331-335. 被引量：3
9石杰.一种快速频繁模式挖掘算法[J].烟台大学学报（自然科学与工程版）,2015,28(2):113-118. 被引量：5
10段建勇,闫启伟,张梅,胡熠.维基百科中翻译对的模板挖掘方法研究[J].中文信息学报,2015,29(2):190-198. 被引量：2

引证文献4

1刘昆.计算机数据挖掘技术探讨[J].电脑知识与技术,2017,13(1):257-258. 被引量：1
2严宇平,吴石松,王建永,张璐.企业移动网站中投资盈利信息检测仿真研究[J].计算机仿真,2017,34(6):423-426.
3陈倩,刘云,高钰莹.并行动态位向量频繁闭合序列模式挖掘算法[J].计算机工程与科学,2018,40(10):1717-1725. 被引量：2
4覃遵颖,孙雨,李国栋,齐怀睿,陶敬.大规模网络图中4节点子图数量快速估计算法[J].西安交通大学学报,2018,52(12):57-62.

二级引证文献3

1田萍.大数据深度挖掘技术下的数字资源推送平台设计应用[J].信息通信,2019,0(10):133-135.
2陈宝国,宋旸.基于支持向量机的Web日志频繁序列模式挖掘研究[J].齐齐哈尔大学学报（自然科学版）,2021,37(1):21-25. 被引量：1
3杨仕琦,武优西,耿萌,李艳.一次性条件下的三支序列模式挖掘[J].计算机工程与科学,2024,46(7):1286-1295.

1鞠九滨,王勇.调度PVM任务[J].计算机学报,1997,20(5):470-474. 被引量：7
2孙振河,李金宝,任美睿.网格计算环境下基于任务池的任务调度方法[J].黑龙江大学自然科学学报,2005,22(1):117-121. 被引量：4
3周国亮,朱永利,王桂兰.CC-MRSJ:Hadoop平台下缓存敏感的星型联接算法[J].电信科学,2013,29(10):31-37.
4谢建全,陈平华,熊建斌.基于语义Web数据交换平台下的负载平衡研究[J].现代计算机,2011,17(8):10-13.
5宋阳阳,刘建丽,张雪,岳彩锐,常静雅.基于并行的焊点优化算法[J].微电子学与计算机,2008,25(10):218-220.
6史太齐,刘亮,秦小麟.DCST:主存空间高效的缓存敏感型T-树索引研究[J].计算机科学与探索,2017,11(2):221-230.
7谭一鸣,张苗,张德贤.树型网格计算环境下的自适应任务调度算法[J].计算机工程,2008,34(17):62-64. 被引量：1
8王晨,陈刚,董金祥.改进型缓存敏感B+树的研究[J].计算机测量与控制,2006,14(11):1531-1534. 被引量：2
9谭一鸣,张苗,张德贤.树形网格自适应调度模型研究[J].微电子学与计算机,2008,25(4):56-58. 被引量：1
10赵亮,陈荦,景宁,钟志农.一种支持高效并发访问的移动对象索引[J].国防科技大学学报,2010,32(3):53-59. 被引量：1

计算机研究与发展

2015年第12期

浏览历史

内容加载中请稍等...

多核处理器上的频繁图挖掘方法被引量：4

参考文献26

二级参考文献2

共引文献9

同被引文献23

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

多核处理器上的频繁图挖掘方法 被引量：4

参考文献26

二级参考文献2

共引文献9

同被引文献23

引证文献4

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

多核处理器上的频繁图挖掘方法被引量：4