期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
大规模复杂网络下重叠社区的识别 被引量:3
1
作者 王诗懿 董一鸿 +2 位作者 李志超 陈华辉 钱江波 《电子学报》 EI CAS CSCD 北大核心 2015年第8期1575-1582,共8页
随着网络规模的不断扩大,经典的复杂网络重叠社识别算法已不能高效处理现有的大规模网络图数据.本文在GraphLab并行计算模型上提出了基于重要节点扩展的重叠社区识别算法DOCVN(Detecting the Overlapping Community algorithm based on ... 随着网络规模的不断扩大,经典的复杂网络重叠社识别算法已不能高效处理现有的大规模网络图数据.本文在GraphLab并行计算模型上提出了基于重要节点扩展的重叠社区识别算法DOCVN(Detecting the Overlapping Community algorithm based on Vital Node Expanding in GraphLab).算法选取网络中PageRank值大的节点作为重要节点,计算其他节点归属于重要节点的节点归属度,并以重要节点为中心形成核心社区及扩展社区,最后根据重要节点间的连接紧密度合并核心社区及扩展社区,并计算出每个节点在所属社区里的节点重要度,实现了大规模网络的重叠社区识别.实验表明该算法与PD(Propinquity Dynamics)等现有并行算法相比更能有效地识别大规模网络的重叠社区结构. 展开更多
关键词 大规模复杂网络 graphlab 重叠社区识别 社会网络 核心社区
下载PDF
基于Graphlab的网络图关键节点发现算法研究 被引量:2
2
作者 高壮良 吕雁飞 张鸿 《通信学报》 EI CSCD 北大核心 2016年第3期182-189,共8页
针对桥接中心度的计算特点设计了一种分布式的网络图关键节点发现算法(DABC),并基于Graphlab进行了实现。算法具有良好的扩展性,由于能够利用集群的内存资源,算法能处理的图规模与集群的大小成正比,并且该算法利用并行处理大幅度提升了... 针对桥接中心度的计算特点设计了一种分布式的网络图关键节点发现算法(DABC),并基于Graphlab进行了实现。算法具有良好的扩展性,由于能够利用集群的内存资源,算法能处理的图规模与集群的大小成正比,并且该算法利用并行处理大幅度提升了计算速度。实验表明,与传统的基于单机实现的关键节点发现算法相比,算法可以获得高达4倍的性能提升。 展开更多
关键词 关键节点 桥接中心度 分布式算法 graphlab
下载PDF
几种并行编程框架在数据挖掘领域的比较
3
作者 何渊淘 齐兵辉 《中原工学院学报》 CAS 2015年第3期90-94,共5页
将机器学习并行化是进行海量数据挖掘的重要方式,但由于并行计算框架、机器学习算法的多样性,导致计算框架的选取及算法并行化存在着困难。本文对几种常见的并行计算框架的模型结构和工作机理进行了分析,根据算法中变量的依存关系将其分... 将机器学习并行化是进行海量数据挖掘的重要方式,但由于并行计算框架、机器学习算法的多样性,导致计算框架的选取及算法并行化存在着困难。本文对几种常见的并行计算框架的模型结构和工作机理进行了分析,根据算法中变量的依存关系将其分类,并将这几类算法进行了实验对比。实验结果表明,算法中变量的依存关系对其在并行化后的性能有巨大的影响。 展开更多
关键词 MAPREDUCE Pregel HAMA graphlab MPI 数据挖掘
下载PDF
基于GraphLab的分布式近邻传播聚类算法
4
作者 陈文强 林琛 +2 位作者 陈珂 陈锦秀 邹权 《山东大学学报(工学版)》 CAS 北大核心 2013年第5期13-18,23,共7页
为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法——GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用"Gather-Apply-Scatter"的模式完成数据同步和... 为有效实现海量数据的非线性聚类,提出基于GraphLab的分布式流式近邻传播算法——GStrAP(GraphLab based stream affinity propagation)。该算法将数据抽象为有向无环图模型,采用"Gather-Apply-Scatter"的模式完成数据同步和算法迭代。在人工合成流形数据3D Clusters、Aggregation、Flame和Pathbased数据集上分别采用不同数据规模以及与传统K-means的聚类性能做对比,实验表明:基于GraphLab的近邻传播算法对数据规模具有良好的拓展性,在保持算法聚类效果的同时,有效降低时间复杂度。 展开更多
关键词 近邻传播聚类算法 分布式计算 graphlab 聚类融合
原文传递
Researching the Research: Applying Machine Learning Techniques to Dissertation Classification
5
作者 Suzanna Schmeelk Tonya L.Fields +2 位作者 Lisa R.Ellrodt Ion C.Freeman Ashley J.Haigler 《Journal of Computer Science Research》 2020年第4期7-15,共9页
This research examines industry-based dissertation research in a doctoralcomputing program through the lens of machine learning algorithms todetermine if natural language processing-based categorization on abstractsal... This research examines industry-based dissertation research in a doctoralcomputing program through the lens of machine learning algorithms todetermine if natural language processing-based categorization on abstractsalone is adequate for classification. This research categorizes dissertationby both their abstracts and by their full-text using the GraphLabCreate library from Apple’s Turi to identify if abstract analysis is anadequate measure of content categorization, which we found was not. Wealso compare the dissertation categorizations using IBM’s Watson Discoverydeep machine learning tool. Our research provides perspectiveson the practicality of the manual classification of technical documents;and, it provides insights into the: (1) categories of academic work createdby experienced fulltime working professionals in a Computing doctoralprogram, (2) viability and performance of automated categorization of theabstract analysis against the fulltext dissertation analysis, and (3) natuallanguage processing versus human manual text classification abstraction. 展开更多
关键词 Machine learning Natural language processing(NLP) Abstract vs fulltext dissertation analysis Industry-based Dissertation research classification graphlab Create library IBM Watson Discovery
下载PDF
基于语义数据的药物网络模型构建与分析
6
作者 王爽 冯志勇 《计算机工程》 CAS CSCD 北大核心 2016年第6期31-36,42,共7页
针对传统生物数据分析方法无法高效处理规模不断增大的生物语义数据集的现状,将基于属性共现的节点相似度算法应用于Ch EMBL数据集,构建基于药物天然产物-活性的二部图模型,应用Graphlab框架计算基于活性特征的药物天然产物相似度,并对... 针对传统生物数据分析方法无法高效处理规模不断增大的生物语义数据集的现状,将基于属性共现的节点相似度算法应用于Ch EMBL数据集,构建基于药物天然产物-活性的二部图模型,应用Graphlab框架计算基于活性特征的药物天然产物相似度,并对相似度较高的药物天然产物进行活性推荐。实验结果表明,该方法能有效利用生物数据集的语义信息发现药物天然产物潜在的活性特征,从而指导药物研发早期的活性探测以及药物靶标的发现和选择过程。 展开更多
关键词 语义数据 ChEMBL数据集 活性 graphlab并行计算 节点相似度算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部