期刊文献+
共找到118篇文章
< 1 2 6 >
每页显示 20 50 100
决策树算法的并行性研究 被引量:25
1
作者 郭景峰 米浦波 刘国华 《计算机工程》 CAS CSCD 北大核心 2002年第8期77-78,共2页
在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出... 在数据库和数据仓库中运用数据挖掘技术必须考虑挖掘系统的速度问题。当数据集大到相当程度时,挖掘工作只能在巨型机上进行;而由于系统的速度不够快,挖掘出来的知识将会是滞后的,它对决策支持不仅无效甚至是有害的。针对这一问题,提出了决策树算法的并行机制,并对并行性的性能进行探讨。 展开更多
关键词 决策树算法 并行性 数据挖掘 数据库 计算机
下载PDF
一个有效的动态负载平衡方法 被引量:37
2
作者 刘振英 方滨兴 +1 位作者 胡铭曾 张毅 《软件学报》 EI CSCD 北大核心 2001年第4期563-569,共7页
动态负载平衡问题是影响工作站网络并行计算性能的重要因素 .首先分析出在负载平衡中产生额外开销的根本原因是负载的移动 ,进而定性地给出了每次移动负载的粒度公式 .引入益处估计的方法 ,仅在有益的情况下进行负载平衡 .另外还提出了... 动态负载平衡问题是影响工作站网络并行计算性能的重要因素 .首先分析出在负载平衡中产生额外开销的根本原因是负载的移动 ,进而定性地给出了每次移动负载的粒度公式 .引入益处估计的方法 ,仅在有益的情况下进行负载平衡 .另外还提出了一个动态负载平衡算法 .最后 ,通过实验 ,将该算法的运行结果与其他人的负载平衡结果以及不作负载平衡的情况进行了对比 .此负载平衡方法在工作站为空载以及不同的负载和应用问题的数据规模的情况下 ,都优于 Siegell等人提出的方法 . 展开更多
关键词 动态负载平衡 工作站网络 并行计算 数据并行
下载PDF
深度神经网络并行化研究综述 被引量:53
3
作者 朱虎明 李佩 +2 位作者 焦李成 杨淑媛 侯彪 《计算机学报》 EI CSCD 北大核心 2018年第8期1861-1881,共21页
神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题... 神经网络是人工智能领域的核心研究内容之一.在七十年的发展历史中,神经网络经历了从浅层神经网络到深度神经网络的重要变革.深度神经网络通过增加模型深度来提高其特征提取和数据拟合的能力,在自然语言处理、自动驾驶、图像分析等问题上相较浅层模型具有显著优势.随着训练数据规模的增加和模型的日趋复杂,深度神经网络的训练成本越来越高,并行化成为增强其应用时效性的重要技术手段.近年来计算平台的硬件架构更新迭代,计算能力飞速提高,特别是多核众核以及分布式异构计算平台发展迅速,为深度神经网络的并行化提供了硬件基础;另一方面,日趋丰富的并行编程框架也为计算设备和深度神经网络的并行化架起了桥梁.该文首先介绍了深度神经网络发展背景和常用的计算模型,然后对多核处理器、众核处理器和异构计算设备分别从功耗、计算能力、并行算法的开发难度等角度进行对比分析,对并行编程框架分别从支持的编程语言和硬件设备、编程难度等角度进行阐述.然后以AlexNet为例分析了深度神经网络模型并行和数据并行两种方法的实施过程.接下来,从支持硬件、并行接口、并行模式等角度比较了常用的深度神经网络开源软件,并且通过实验比较和分析了卷积神经网络在多核CPU和GPU上的并行性能.最后,对并行深度神经网络的未来发展趋势和面临的挑战进行展望. 展开更多
关键词 深度神经网络 并行计算 异构计算 模型并行 数据并行
下载PDF
基于SPRINT方法的并行决策树分类研究 被引量:18
4
作者 魏红宁 《计算机应用》 CSCD 北大核心 2005年第1期39-41,共3页
决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和... 决策树技术的最大问题之一就是它的计算复杂性和训练数据的规模成正比,导致在大的数据集上构造决策树的计算时间太长。并行构造决策树是解决这个问题的一种有效方法。文中基于同步构造决策树的思想,对SPRINT方法的并行性做了详细分析和研究,并提出了进一步研究的方向。 展开更多
关键词 数据挖掘 SPRINT决策树分类 并行性
下载PDF
二分K均值聚类算法优化及并行化研究 被引量:23
5
作者 张军伟 王念滨 +1 位作者 黄少滨 蔄世明 《计算机工程》 CAS CSCD 北大核心 2011年第17期23-25,共3页
二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均... 二分K均值聚类算法在二分聚类过程中的初始质心选取速度方面存在不足。为此,提出以极大距离点作为二分聚类初始质心的思想,提升算法的运行速度。研究如何在群集系统中进行快速聚类,根据二分K均值聚类算法的特性,采用数据并行的思想和均匀划分的策略,对算法进行并行化处理。实验结果表明,改进后的算法能获得比较理想的加速比和较高的使用效率。 展开更多
关键词 数据挖掘 聚类算法 二分K均值 并行化 群集系统
下载PDF
并行数据挖掘算法综述 被引量:15
6
作者 刘华元 袁琴琴 王保保 《电子科技》 2006年第1期65-68,73,共5页
数据挖掘在工业和商业领域中发挥着越来越重要的作用。随着数据量的增加,挖掘算法处理海量数据的能力问题日益突出。研究并行算法,是解决这一问题的有效途径。该文对常用的数据挖掘算法C4.5,SLIQ,SPRINT,关联规则,K-平均值,K-最近邻,贝... 数据挖掘在工业和商业领域中发挥着越来越重要的作用。随着数据量的增加,挖掘算法处理海量数据的能力问题日益突出。研究并行算法,是解决这一问题的有效途径。该文对常用的数据挖掘算法C4.5,SLIQ,SPRINT,关联规则,K-平均值,K-最近邻,贝叶斯网络,人工神经网络,遗传算法及并行性进行了研究探讨,为数据挖掘研究者提供借鉴。 展开更多
关键词 C4.5 SLIQ SPRINT 关联规则 K-平均值 K-最近邻 贝叶斯网络 人工神经网络 遗传算法 并行性
下载PDF
大规模问题数据并行性能的分析 被引量:14
7
作者 舒继武 est4.cs.tsinghua.edu.cn +2 位作者 郑纬民 沈美明 汪东升 《软件学报》 EI CSCD 北大核心 2000年第5期628-633,共6页
从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 ... 从应用的角度建立了评价大规模问题数据并行处理性能的模型 ,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能 ,进而就操作重叠、数据规模以及算法选取等几个方面的问题对大规模数据并行性能所产生的影响进行了分析 .最后 ,给出的例子证明了模型的有效性 . 展开更多
关键词 数据并行 并行处理 性能分析 加速比
下载PDF
BIRCH聚类算法优化及并行化研究 被引量:9
8
作者 朱映辉 江玉珍 《计算机工程与设计》 CSCD 北大核心 2007年第18期4345-4346,4369,共3页
为了提高聚类质量,针对BIRCH算法中在聚类精度方面所存在的不足,提出了聚类特征树中的不同簇应使用不同阀值的思想,较好地改善了对体积相差悬殊的簇不能很好聚类的问题。并且深入地研究和分析了如何在集群系统中进行快速聚类,提出了自... 为了提高聚类质量,针对BIRCH算法中在聚类精度方面所存在的不足,提出了聚类特征树中的不同簇应使用不同阀值的思想,较好地改善了对体积相差悬殊的簇不能很好聚类的问题。并且深入地研究和分析了如何在集群系统中进行快速聚类,提出了自定义数据类型、采用数据并行思想和非均匀数据划分策略等几点改进意见。最后实验结果表明,通过改进能够获得比较理想的运行时间和加速比性能。 展开更多
关键词 集群 数据挖掘 聚类 聚类质量 并行化
下载PDF
一种随机配置网络的模型与数据混合并行学习方法 被引量:13
9
作者 代伟 李德鹏 +1 位作者 杨春雨 马小平 《自动化学报》 EI CAS CSCD 北大核心 2021年第10期2427-2437,共11页
随机配置网络(Stochastic configuration networks,SCNs)在增量构建过程引入监督机制来分配隐含层参数以确保其无限逼近特性,具有易于实现、收敛速度快、泛化性能好等优点.然而,随着数据量的不断扩大,SCNs的建模任务面临一定的挑战性.... 随机配置网络(Stochastic configuration networks,SCNs)在增量构建过程引入监督机制来分配隐含层参数以确保其无限逼近特性,具有易于实现、收敛速度快、泛化性能好等优点.然而,随着数据量的不断扩大,SCNs的建模任务面临一定的挑战性.为了提高神经网络算法在大数据建模中的综合性能,本文提出了一种混合并行随机配置网络(Hybrid parallel stochastic configuration networks,HPSCNs)架构,即:模型与数据混合并行的增量学习方法.所提方法由不同构建方式的左右两个SCNs模型组成,以快速准确地确定最佳隐含层节点,其中左侧采用点增量网络(PSCN),右侧采用块增量网络(BSCN);同时每个模型建立样本数据的动态分块方法,从而加快候选“节点池”的建立、降低计算量.所提方法首先通过大规模基准数据集进行了对比实验,然后应用在一个实际工业案例上,表明其有效性. 展开更多
关键词 增量学习方法 随机配置网络 模型并行 数据并行 大数据建模
下载PDF
HPF编译器中的通信实现策略及其相关算法 被引量:12
10
作者 汪剑平 程旭 +2 位作者 丁文魁 李晓明 许卓群 《计算机学报》 EI CSCD 北大核心 1999年第5期486-495,共10页
介绍了HPF编译系统p_HPF中的通信实现策略及其相关算法.综合数组的分布方式、对准、FORALL语句的空间索引变量范围以及数组元素的下标表达式,将程序语句中所隐含的通信划分为3种情形,即无通信、SHIFT通信和其它... 介绍了HPF编译系统p_HPF中的通信实现策略及其相关算法.综合数组的分布方式、对准、FORALL语句的空间索引变量范围以及数组元素的下标表达式,将程序语句中所隐含的通信划分为3种情形,即无通信、SHIFT通信和其它通信(REMAP通信),指出了这种划分的意义,给出相应的通信检测算法,描述了具体的实现细节;详细讨论了SHIFT通信以及利用阴影区技术对它进行的优化,对于REMAP通信的典型形式及其优化也进行了讨论. 展开更多
关键词 HPF语言 群通信 通信实现策略 编译器 算法
下载PDF
集群环境下的并行聚类算法 被引量:7
11
作者 周兵 沈钧毅 彭勤科 《计算机工程》 CAS CSCD 北大核心 2004年第4期4-6,共3页
探讨在集群环境下,如何设计并行聚类算法。作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈。所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想。从理论上,对采用数据并行思想后,... 探讨在集群环境下,如何设计并行聚类算法。作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈。所以在集群环境下,设计并行聚类算法时,应采用数据并行的思想。从理论上,对采用数据并行思想后,影响聚类算法的加速比和聚类质量的因素进行了分析,然后通过一个验证算法PCIT(Parallel clustering algorithm based on Index Tree)证实了理论分析的正确性。研究结果可以为以后设计更好的数据并行聚类算法提供理论依据。 展开更多
关键词 数据挖掘 并行聚类 集群 通信 数据并行
下载PDF
一种并行分布对象的互操作模型 被引量:5
12
作者 王晨 周颖 张德富 《软件学报》 EI CSCD 北大核心 1999年第8期861-867,共7页
并行软件设计本身的复杂性使它的复用成为一个引人注目的问题.分布对象技术不仅可以将并行软件封装成相应的构件,而且提供了利用各种异构系统进行并行计算的可能性,但这样往往会使这些构件的互操作的效率有所降低.文章提出的并行分... 并行软件设计本身的复杂性使它的复用成为一个引人注目的问题.分布对象技术不仅可以将并行软件封装成相应的构件,而且提供了利用各种异构系统进行并行计算的可能性,但这样往往会使这些构件的互操作的效率有所降低.文章提出的并行分布对象互操作模型试图解决这一问题.这个模型与分布对象的旧有模型兼容,并且实际测试结果表明,它还能挖掘出并行分布对象间的更多并行性. 展开更多
关键词 并行计算 分布对象 互操作 程序设计
下载PDF
分布式深度学习框架下基于性能感知的DBS-SGD算法 被引量:11
13
作者 纪泽宇 张兴军 +2 位作者 付哲 高柏松 李靖波 《计算机研究与发展》 EI CSCD 北大核心 2019年第11期2396-2409,共14页
通过增加模型的深度以及训练数据的样本数量,深度神经网络模型能够在多个机器学习任务中获得更好的性能,然而这些必要的操作会使得深度神经网络模型训练的开销相应增大.因此为了更好地应对大量的训练开销,在分布式计算环境中对深度神经... 通过增加模型的深度以及训练数据的样本数量,深度神经网络模型能够在多个机器学习任务中获得更好的性能,然而这些必要的操作会使得深度神经网络模型训练的开销相应增大.因此为了更好地应对大量的训练开销,在分布式计算环境中对深度神经网络模型的训练过程进行加速成为了研发人员最常用的手段.随机梯度下降(stochastic gradient descent,SGD)算法是当前深度神经网络模型中最常见的训练算法之一,然而SGD在进行并行化的时候容易产生梯度过时问题,从而影响算法的整体收敛性.现有解决方案大部分针对的是各节点性能差别较小的高性能计算(high performance computing,HPC)环境,很少有研究考虑过各节点性能差别较大的集群环境.针对上述问题进行研究并提出了一种基于性能感知技术的动态batch size随机梯度下降算法(dynamic batch size SGD,DBS-SGD).该算法通过分析各节点的计算能力,对各节点的minibatch进行动态分配,从而保证了节点间每次迭代更新的时间基本一致,进而降低了节点的平均梯度过时值.提出的算法能够有效优化异步更新策略中存在的梯度过时问题.选用常用的图像分类基准Mnist和cifar10作为训练数据集,将该算法与异步随机梯度下降(asynchronous SGD,ASGD)算法、n-soft算法进行了对比.实验结果表明:在不损失加速比的情况下,Mnist数据集的loss函数值降低了60%,cifar数据集的准确率提升了约10%,loss函数值降低了10%,其性能高于ASGD算法和n-soft算法,接近同步策略下的收敛曲线. 展开更多
关键词 参数服务器 异步随机梯度下降算法 梯度过时 性能感知 数据并行
下载PDF
基于数据网格环境的连接操作算法 被引量:8
14
作者 杨东华 李建中 张文平 《计算机研究与发展》 EI CSCD 北大核心 2004年第10期1848-1855,共8页
数据网格是一种分布式数据管理体系结构 ,能够为分布在网格中的资源提供协同的管理机制 数据库管理系统在数据网格中发挥着重要作用 ,在各种数据库操作中 ,连接操作是一种最常用也是最耗时的操作 ,到目前为止 ,尚未有文献提出数据网格... 数据网格是一种分布式数据管理体系结构 ,能够为分布在网格中的资源提供协同的管理机制 数据库管理系统在数据网格中发挥着重要作用 ,在各种数据库操作中 ,连接操作是一种最常用也是最耗时的操作 ,到目前为止 ,尚未有文献提出数据网格环境下的连接操作算法 主要对数据网格环境下海量数据的连接操作算法进行了研究 ,针对网格中各结点之间网络带宽异构的特点 ,采取关系缩减算法、行分块传输技术和流水线并行机制来减少查询的响应时间 理论分析和实验结果证明 ,算法在减少网络通信开销、增加I/O和CPU并行。 展开更多
关键词 数据网格 连接操作 关系缩减算法 流水线并行
下载PDF
一个用于工作站网络的动态负载平衡算法 被引量:4
15
作者 刘振英 方滨兴 +1 位作者 胡铭曾 张毅 《小型微型计算机系统》 CSCD 北大核心 2001年第6期651-653,共3页
数学和科学计算中的大部分问题都可以用数据并行程序来开发其并行性 .但是在工作站网络环境中 ,负载波动很大 ,负载平衡是影响其效率的一个重要因素 .本文提出了一种动态负载平衡的算法 ,它可以使数据并行程序在运行时动态地调整负载 .... 数学和科学计算中的大部分问题都可以用数据并行程序来开发其并行性 .但是在工作站网络环境中 ,负载波动很大 ,负载平衡是影响其效率的一个重要因素 .本文提出了一种动态负载平衡的算法 ,它可以使数据并行程序在运行时动态地调整负载 .并且文中给出了这种算法的实验结果 . 展开更多
关键词 工作站网络 并行计算 动态负载平衡算法 操作系统
下载PDF
并行图形绘制技术综述 被引量:6
16
作者 韩伟杰 李晓梅 张文 《计算机工程》 CAS CSCD 北大核心 2010年第1期221-223,247,共4页
为研究并行图形绘制技术,介绍图形绘制的流水线过程,对其内在的可并行性进行分析,研究并行绘制的实现方式,包括流水线并行、数据并行和作业并行,以及前分布拼接合成、中分布拼接合成和后分布拼接合成,讨论并行绘制面临的主要问题及其发... 为研究并行图形绘制技术,介绍图形绘制的流水线过程,对其内在的可并行性进行分析,研究并行绘制的实现方式,包括流水线并行、数据并行和作业并行,以及前分布拼接合成、中分布拼接合成和后分布拼接合成,讨论并行绘制面临的主要问题及其发展趋势。 展开更多
关键词 并行绘制 流水线并行 数据并行 作业并行
下载PDF
基于流计算和大数据平台的实时交通流预测 被引量:1
17
作者 李星辉 曾碧 魏鹏飞 《计算机工程与设计》 北大核心 2024年第2期553-561,共9页
目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后... 目前交通流预测实时性差,很难满足在线分析和预测任务的需求,基于此提出一种Flink流计算框架和大数据平台结合的实时交通流预测方法。基于流计算框架实时捕捉和预处理数据,包括采用Flink的transform算子对数据进行校验和处理,将处理后的数据sink到大数据的HDFS文件系统,交由下一步的大数据并行框架进行分析建模与训练,实现基于流计算和大数据平台的实时交通流预测。实验结果表明,Flink能够实时捕捉和预处理交通流数据,把数据准时无误送入分布式文件系统中,在此基础上借助大数据框架下的并行分析和建模优势,在实时性数据分析与预测方面取得了较好的效果。 展开更多
关键词 大数据 数据并行 流计算框架 实时处理 交通流预测 分布式系统 实时性分析
下载PDF
异构多核上多级并行模型支持及性能优化 被引量:4
18
作者 李士刚 胡长军 +1 位作者 王珏 李建江 《软件学报》 EI CSCD 北大核心 2013年第12期2782-2796,共15页
低功耗及廉价性使得异构多核在超级计算机计算资源中占有重要比例.然而,异构多核具有高带宽及松耦合一致性等特点,获得理想的存储及计算性能需要更多地考虑底层硬件细节.实现了一种针对典型的异构多核Cell BE处理器的多级并行模型CellM... 低功耗及廉价性使得异构多核在超级计算机计算资源中占有重要比例.然而,异构多核具有高带宽及松耦合一致性等特点,获得理想的存储及计算性能需要更多地考虑底层硬件细节.实现了一种针对典型的异构多核Cell BE处理器的多级并行模型CellMLP,通过C语言扩展编译指导语句,实现了对数据并行、任务并行以及流水并行编程模型的支持,提高了并行程序生产率.运行支持优化方面,数据并行采用SPE并行数据传输、双缓冲等优化手段来提高数据传输带宽;任务并行使用一种新式混合任务队列以支持异步任务窃取,降低SPE线程间竞争,提高了任务并行的可扩展性;流水并行首次使用阻塞信号传输机制实现SPE线程间的低开销同步操作.实验对Stream,NAS Benchmark及BOTS等应用进行了测试,结果表明,CellMLP可对多种典型并行应用进行高效支持.与目前同类编程模型SARC及CellSs进行性能对比,其结果表明,CellMLP实际数据传输带宽以及非规则应用的支持方面具有明显优势. 展开更多
关键词 异构多核 数据并行 任务并行 流水并行 非规则应用 编译优化
下载PDF
面向深度学习图像分类的GPU并行方法研究 被引量:1
19
作者 韩彦岭 沈思扬 +3 位作者 徐利军 王静 张云 周汝雁 《计算机工程》 CAS CSCD 北大核心 2023年第1期191-200,共10页
针对深度学习图像分类场景中多GPU并行后传输效率低的问题,提出一种低时间复杂度的Ring All Reduce改进算法。通过分节点间隔配对原则优化数据传输流程,缓解传统参数服务器并行结构的带宽损耗。基于数据并行难以支撑大规模网络参数及加... 针对深度学习图像分类场景中多GPU并行后传输效率低的问题,提出一种低时间复杂度的Ring All Reduce改进算法。通过分节点间隔配对原则优化数据传输流程,缓解传统参数服务器并行结构的带宽损耗。基于数据并行难以支撑大规模网络参数及加速延缓的问题,根据深度学习主干网络所包含的权重参数低于全连接层权重参数、同步开销小、全连接层权重大与梯度传输开销过高等特点,提出GPU混合并行优化算法,将主干网络进行数据并行,全连接层进行模型并行,并通过改进的Ring All Reduce算法实现各节点之间的并行后数据通信,用于基于深度学习模型的图像分类。在Cifar10和mini ImageNet两个公共数据集上的实验结果表明,该算法在保持分类精度不变的情况下可以获得更好的加速效果,相比数据并行方法,可达到近45%的提升效果。 展开更多
关键词 GPU并行 Ring All Reduce算法 数据并行 模型并行 深度学习 图像分类
下载PDF
大模型训练技术综述
20
作者 田海东 张明政 +1 位作者 常锐 童贤慧 《中兴通讯技术》 北大核心 2024年第2期21-28,共8页
实现高效训练已成为影响大模型应用普及的关键要素之一。按照数据准备、数据加载、模型初始化及评估、训练并行、模型状态保存的一般训练流程,对大模型高效训练的主要技术进行分析和论述。面对大模型规模的持续增长、数据处理类型的扩展... 实现高效训练已成为影响大模型应用普及的关键要素之一。按照数据准备、数据加载、模型初始化及评估、训练并行、模型状态保存的一般训练流程,对大模型高效训练的主要技术进行分析和论述。面对大模型规模的持续增长、数据处理类型的扩展,现有大模型训练技术仍存在较大的优化空间。认为未来大模型训练重点研究方向包括以数据为中心、数据加载智能化和异构加速、网络通信领域定制、训练并行及自动化。 展开更多
关键词 大模型 数据准备 数据加载 模型初始化 模型评估 训练并行 训练网络 检查点
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部