期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
并行矩阵乘的B迁移算法 被引量:4
1
作者 刘杰 胡庆丰 迟利华 《计算机工程与科学》 CSCD 1997年第3期50-54,共5页
本文回顾了分布式系统上的广播-移位矩阵乘算法(B-S算法)[2]和C迁移算法[5],给出我们提出的迁移算法。B迁移算法有效地减少了通信量,在工作站机群上的应用取得了较好的结果。对比B-S算法性能提高可达到60%,对比... 本文回顾了分布式系统上的广播-移位矩阵乘算法(B-S算法)[2]和C迁移算法[5],给出我们提出的迁移算法。B迁移算法有效地减少了通信量,在工作站机群上的应用取得了较好的结果。对比B-S算法性能提高可达到60%,对比C迁移算法,性能提高可达到140%。 展开更多
关键词 分布式系统 并行矩阵 算法 并行算法
下载PDF
一种多处理器仿真系统的构建与评估 被引量:1
2
作者 朱志强 汤小明 《微电子学与计算机》 CSCD 北大核心 2007年第6期91-93,共3页
以建立单处理器模型为基础,通过自定义静态交换网络构建了一个多处理器仿真系统。并采用并行矩阵乘算法对该多处理器系统进行了评估,比较了单处理器、两处理器以及四处理器系统的性能。
关键词 多处理器 静态网络 仿真 并行矩阵 加速比
下载PDF
处理方式
3
《电子科技文摘》 2000年第4期102-103,共2页
Y2000-62044-2 0006581数据累计算法的特征=The characterization of data-acumulating algorithms[会,英]/Bruda,S.D.& Akl,S.G.//Proceedings of the 13th International ParallelProcessing Symposium & 10th Symposium on P... Y2000-62044-2 0006581数据累计算法的特征=The characterization of data-acumulating algorithms[会,英]/Bruda,S.D.& Akl,S.G.//Proceedings of the 13th International ParallelProcessing Symposium & 10th Symposium on Paralleland Distributed Processing(IPPS/SPDP 1999).—2~6(PC) 展开更多
关键词 处理方式 计算法 并行算法 并行计算 多处理机 粗粒度 并行矩阵 数据 特征 调度算法
原文传递
计算机及其系列、计算机系统与计算机网络
4
《电子科技文摘》 1999年第5期115-116,共2页
Y98-61391-214 9906693并行计算机系统的硬件软件共同模拟=Hardware-software co-simulation of a parallel computer system[会,英]/Shome,T.& McLeod,R.D.//1997 IEEE Con-ference on Communications,Power and Computing-Wescan... Y98-61391-214 9906693并行计算机系统的硬件软件共同模拟=Hardware-software co-simulation of a parallel computer system[会,英]/Shome,T.& McLeod,R.D.//1997 IEEE Con-ference on Communications,Power and Computing-Wescanex.—214~217(MaG)本文介绍了一个基于四节点单总线的多计算机体系结构的硬件/软件共同模拟结果。用于说明该共同模拟的应用是一个并行矩阵乘法算法。目的是为了说明可在共同模拟环境下进行的设计中的折衷和改善。 展开更多
关键词 计算机网络 并行计算机系统 计算机体系结构 硬件软件 多计算机 并行矩阵 单总线 模拟环境 四节点 模拟结果
原文传递
矩阵乘在一组规则WDM光网络上的波长分配
5
作者 夏磊 刘方爱 《计算机工程与应用》 CSCD 北大核心 2007年第28期131-133,168,共4页
在光互连网络上实现并行算法的通信模式是当前一个颇受关注的研究领域。矩阵乘法是数值分析领域中一种常用的基本运算,许多数值代数中的计算问题最终会归结到矩阵乘法的计算。提出一种嵌入算法MRDR,在此基础上分析了在一组规则WDM光网... 在光互连网络上实现并行算法的通信模式是当前一个颇受关注的研究领域。矩阵乘法是数值分析领域中一种常用的基本运算,许多数值代数中的计算问题最终会归结到矩阵乘法的计算。提出一种嵌入算法MRDR,在此基础上分析了在一组规则WDM光网络线性阵列、环、mesh、双环网上实现并行矩阵乘通信模式的波长分配问题,并给出了所需的最小波长数。 展开更多
关键词 并行矩阵 光网络 波长分配
下载PDF
基于BLACS的2.5D并行矩阵乘法 被引量:1
6
作者 廖霞 李胜国 +1 位作者 卢宇彤 杨灿群 《计算机学报》 EI CAS CSCD 北大核心 2021年第5期1037-1050,共14页
并行矩阵乘法是线性代数中最重要的基本运算之一,同时也是许多科学应用的基石.随着高性能计算(HPC)向E级计算发展,并行矩阵乘法的通信开销所占比重越来越大.如何降低并行矩阵乘法的通信开销,提高并行矩阵乘的可扩展性是当前研究的热点之... 并行矩阵乘法是线性代数中最重要的基本运算之一,同时也是许多科学应用的基石.随着高性能计算(HPC)向E级计算发展,并行矩阵乘法的通信开销所占比重越来越大.如何降低并行矩阵乘法的通信开销,提高并行矩阵乘的可扩展性是当前研究的热点之一.本文提出一种新型的分布式并行稠密矩阵乘算法,即2.5D版本的PUMMA(Parallel Universal Matrix Multiplication Algorithm)算法,该算法是通过将初始的进程分成c组,利用计算节点的额外内存,在每个进程组上同时存储矩阵A、B和执行1/c的PUMMA算法,最后通过规约操作来得到矩阵乘的最终结果.本文基于BLACS(Basic Linear Algebra Communication Subprograms)通信库实现了一种从2D到2.5D的新型数据重分配算法,与PUMMA算法相结合,最终得到2.5D PUMMA算法,可直接替换PDGEMM(Parallel Double-precision General Matrix-matrix Multiplication),具有良好的可移植性.与国际标准算法库ScaLAPACK(Scalable Linear Algebra PACKage)中的PDGEMM等经典2D算法相比,本文算法缩减了通信次数,提高了数据局部性,具有更好的可扩展性.在进程数较多时,例如4096进程时,系统测试表明相对PDGEMM的加速比可达到2.20~2.93.进一步地,本文将2.5D PUMMA算法应用于加速计算对称三对角矩阵的特征值分解,其加速比可达到1.2以上.本文通过大量数值算例分析了2.5D PUMMA算法的性能,并给出了实用性建议和总结了未来的工作. 展开更多
关键词 2.5D并行矩阵算法 SCALAPACK PUMMA矩阵算法 SUMMA算法 分布式并行
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部