期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
基于数据级任务分解的配电网分布式并行计算平台 被引量:14
1
作者 黄伟 庞琳 +1 位作者 曹彬 焦润海 《电网技术》 EI CSCD 北大核心 2014年第4期1103-1108,共6页
为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和... 为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和客户端4个子系统,分别实现任务生成、任务分解、任务派发以及子任务计算等功能,形成分布式并行计算平台框架。引入消息中间件ZeroMQ技术,采用不同类型套接字的组合实现分布式系统内部的N-N高效通信及与外部系统的数据交互。为验证该平台的实用性及并行计算性能,在平台上实现了山东省某市的城市配电网全局状态估计的分布式并行计算。算例分析表明:在配电网节点达到一定规模时,采用该平台进行分布式并行计算具有明显的速度优势。 展开更多
关键词 数据级并行 分布式并行计算平台 配电网 分布式通信架构
下载PDF
面向OpenCL架构的GPGPU量化性能模型 被引量:3
2
作者 朱俊峰 陈钢 +1 位作者 张珂良 吴百锋 《小型微型计算机系统》 CSCD 北大核心 2013年第5期1118-1125,共8页
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响GPGPU程序性能的各种因素:全局存储器访问、局部存储器访问、计算与访存重叠、条件分支转移和同步.通过对... 为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响GPGPU程序性能的各种因素:全局存储器访问、局部存储器访问、计算与访存重叠、条件分支转移和同步.通过对DLP应用的静态分析并设定具体的OpenCL执行配置,在无需编写实际GPGPU程序的前提下采用该模型即可估算出DLP应用在GPU体系结构上的执行时间.在AMD RadeonTMHD 5870 GPU和NVIDIA GeForceTMGTX 280 GPU上对矩阵乘法与并行前缀和的分析与实验结果表明:该性能模型能够相对准确地评估DLP应用并行化后的执行时间. 展开更多
关键词 GPU GPGPU 数据并行 OPENCL 性能模型
下载PDF
基于异构GPU集群的并行分布式编程解决方案 被引量:1
3
作者 李佳佳 胡新明 吴百锋 《计算机应用与软件》 CSCD 北大核心 2014年第9期28-31,176,共5页
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大... 由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。 展开更多
关键词 GPU集群 编程模型 数据级并行
下载PDF
时钟共享多线程处理器SIMD控制器设计与实现
4
作者 刘欢 韩俊刚 +1 位作者 李卯良 杨铮 《电子技术应用》 北大核心 2016年第11期29-32,共4页
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前... 针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。 展开更多
关键词 多线程处理器 SIMD控制器 数据级并行 状态机
下载PDF
多态并行处理器中的SIMD控制器设计与实现 被引量:4
5
作者 蒲林 李涛 +1 位作者 易学渊 韩俊刚 《电子技术应用》 北大核心 2013年第11期53-55,59,共4页
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了... 设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。 展开更多
关键词 多态并行处理器 SIMD控制器 数据级并行 阵列机
下载PDF
一种图形处理用的多格式定点运算器
6
作者 易学渊 李涛 蒲林 《计算机技术与发展》 2014年第10期147-150,共4页
典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超... 典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超标量处理机制,访存采用直接寻址,不含通用寄存器和LD/ST操作。值得一提的是,指令字中设置了阻塞标志位,用于控制互连通信模式,数据字中设置了格式标志位,用于控制多格式定点数据的处理。处理器实现了指令级并行、数据级并行等并行处理方式。 展开更多
关键词 图形处理 超标量 阻塞标志位 指令级并行 数据级并行
下载PDF
流化H.264编码的数据并行方法
7
作者 文梅 任巨 +3 位作者 伍楠 苏华友 荀长庆 张春元 《国防科技大学学报》 EI CAS CSCD 北大核心 2011年第3期66-71,共6页
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编... 流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法。采用这些方法能够保证大数据并行粒度,最终达到高效并行流化编码的目的。实验表明采用数据并行流化编码方法,帧间预测、帧内预测、熵编码和去块滤波模块都获得了显著加速。 展开更多
关键词 H.264编码 流模型 并行计算 数据并行
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部