期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
多态并行处理器中的SIMD控制器设计与实现 被引量:4
1
作者 蒲林 李涛 +1 位作者 易学渊 韩俊刚 《电子技术应用》 北大核心 2013年第11期53-55,59,共4页
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了... 设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。 展开更多
关键词 多态并行处理器 simd控制器 数据级并行 阵列机
下载PDF
Hypercube多处理器上图的最优算法 被引量:4
2
作者 梁维发 陈国良 《计算机学报》 EI CSCD 北大核心 1991年第9期641-650,共10页
已知一个无向图G(V,E),|V|=n.本文在SIMD机器-Hype-rcube上提出了计算图的连通分支和最小生成树的两个最优算法.若Hypercu-be由P个处理器组成,则上述两个算法的时间复杂性都是O(n^2/p),1≤p且PlogP≤n.
关键词 多处理器 最优算法 互连网络
下载PDF
多处理器上求最小生成树的并行算法
3
作者 童明生 刘长河 《北京理工大学学报》 EI CAS CSCD 1999年第3期329-333,共5页
目的给出无向图G(V,E),|V|=n的最小生成树在单指令流多数据流(SIMD)机器、Incomplete-hypercube上的并行算法.方法利用有p个处理器的不完全超立方网络,求加权无向连通图G(V,E),|V|... 目的给出无向图G(V,E),|V|=n的最小生成树在单指令流多数据流(SIMD)机器、Incomplete-hypercube上的并行算法.方法利用有p个处理器的不完全超立方网络,求加权无向连通图G(V,E),|V|=n的最小生成树.结果与结论若处理器的个数为p,则其时间复杂性为t(n)=O(n2/p·(lbp)),成本C(n)=O(n2(lbp)),它几乎是最优的. 展开更多
关键词 并行算法 最小生成树 simd机器 多处理器
下载PDF
时钟共享多线程处理器SIMD控制器设计与实现
4
作者 刘欢 韩俊刚 +1 位作者 李卯良 杨铮 《电子技术应用》 北大核心 2016年第11期29-32,共4页
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前... 针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。 展开更多
关键词 多线程处理器 simd控制器 数据级并行 状态机
下载PDF
Sorting Data Elements by SOCD Using Centralized Diamond Architecture
5
作者 Masumeh Damrudi Kamal Jadidy Aval 《Computer Technology and Application》 2011年第5期374-377,共4页
Several parallel sorting techniques on different architectures have been studied for many years. Due to the need for faster systems in today's world, parallelism can be used to accelerate applications. Nowadays, para... Several parallel sorting techniques on different architectures have been studied for many years. Due to the need for faster systems in today's world, parallelism can be used to accelerate applications. Nowadays, parallel operations are used to solve computer problems such as sort and search, which result in a reasonable speed. Sorting is one of the most important operations in computing world. The authors always try to find the best in different areas which the premier is speedup. In this paper, the authors issued a sort with O(logn) time complexity on PRAM EREW (Parallel Random Access Machine Exclusive Read Exclusive Write). The algorithm is designed in a manner that keeps the tradeoff between the number of processor elements in the architecture and execution time. The simulation of the algorithm proves the theoretical analysis of the algorithm. The results of this research can be utilized in developing faster embedded systems. Sorting on Centralized Diamond (SOCD) algorithm is issued on the novel Centralized Diamond architecture which takes the advantages of Single Instruction Multiple Data (SIMD) architecture. This architecture and the sort on it are intuitive and optimal. 展开更多
关键词 Parallel sorting diamond architecture single instruction multiple data simd parallel random access machine exclusive read exclusive write (PRAM EREW) sorting on centralized diamond (SOCD).
下载PDF
PARALLEL(M-N) SVD ALGORITHMS ON THE SIMD COMPUTERS
6
作者 Wang Guorong Wei Yimin(Dept. of Mathematics, Shanghai Normal University Shanghai 200234, P. R. China Institute of Mathematics, Fudan University Shanghai 200133, P. R. China) 《Wuhan University Journal of Natural Sciences》 CAS 1996年第Z1期541-546,共6页
Let A be m by n matrix, M and N be positive definite matrices of order in and n respectively. This paper presents an efficient method for computing (M-N) singular value decomposition((M-N) SVD) of A on a cube connecte... Let A be m by n matrix, M and N be positive definite matrices of order in and n respectively. This paper presents an efficient method for computing (M-N) singular value decomposition((M-N) SVD) of A on a cube connected single instruction stream-multiple data stream(SIMD) parallel computer. This method is based on a one-sided orthogonalization algorithm due to Hestenes. On the cube connected SIMD parallel computer with o(n) processors, the (M -- N) SVD of a matrix A requires a computation time of o(m3 log m/n). 展开更多
关键词 Parallel algorithm cube connected simd machine (M-N) SVD.
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部