期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
7
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于数据级任务分解的配电网分布式并行计算平台
被引量:
14
1
作者
黄伟
庞琳
+1 位作者
曹彬
焦润海
《电网技术》
EI
CSCD
北大核心
2014年第4期1103-1108,共6页
为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和...
为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和客户端4个子系统,分别实现任务生成、任务分解、任务派发以及子任务计算等功能,形成分布式并行计算平台框架。引入消息中间件ZeroMQ技术,采用不同类型套接字的组合实现分布式系统内部的N-N高效通信及与外部系统的数据交互。为验证该平台的实用性及并行计算性能,在平台上实现了山东省某市的城市配电网全局状态估计的分布式并行计算。算例分析表明:在配电网节点达到一定规模时,采用该平台进行分布式并行计算具有明显的速度优势。
展开更多
关键词
数据级并行
分布式并行计算平台
配电网
分布式通信架构
下载PDF
职称材料
面向OpenCL架构的GPGPU量化性能模型
被引量:
3
2
作者
朱俊峰
陈钢
+1 位作者
张珂良
吴百锋
《小型微型计算机系统》
CSCD
北大核心
2013年第5期1118-1125,共8页
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响GPGPU程序性能的各种因素:全局存储器访问、局部存储器访问、计算与访存重叠、条件分支转移和同步.通过对...
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响GPGPU程序性能的各种因素:全局存储器访问、局部存储器访问、计算与访存重叠、条件分支转移和同步.通过对DLP应用的静态分析并设定具体的OpenCL执行配置,在无需编写实际GPGPU程序的前提下采用该模型即可估算出DLP应用在GPU体系结构上的执行时间.在AMD RadeonTMHD 5870 GPU和NVIDIA GeForceTMGTX 280 GPU上对矩阵乘法与并行前缀和的分析与实验结果表明:该性能模型能够相对准确地评估DLP应用并行化后的执行时间.
展开更多
关键词
GPU
GPGPU
数据并行
OPENCL
性能模型
下载PDF
职称材料
基于异构GPU集群的并行分布式编程解决方案
被引量:
1
3
作者
李佳佳
胡新明
吴百锋
《计算机应用与软件》
CSCD
北大核心
2014年第9期28-31,176,共5页
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大...
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。
展开更多
关键词
GPU集群
编程模型
数据级并行
下载PDF
职称材料
时钟共享多线程处理器SIMD控制器设计与实现
4
作者
刘欢
韩俊刚
+1 位作者
李卯良
杨铮
《电子技术应用》
北大核心
2016年第11期29-32,共4页
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前...
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。
展开更多
关键词
多线程处理器
SIMD控制器
数据级并行
状态机
下载PDF
职称材料
多态并行处理器中的SIMD控制器设计与实现
被引量:
4
5
作者
蒲林
李涛
+1 位作者
易学渊
韩俊刚
《电子技术应用》
北大核心
2013年第11期53-55,59,共4页
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了...
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。
展开更多
关键词
多态并行处理器
SIMD控制器
数据级并行
阵列机
下载PDF
职称材料
一种图形处理用的多格式定点运算器
6
作者
易学渊
李涛
蒲林
《计算机技术与发展》
2014年第10期147-150,共4页
典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超...
典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超标量处理机制,访存采用直接寻址,不含通用寄存器和LD/ST操作。值得一提的是,指令字中设置了阻塞标志位,用于控制互连通信模式,数据字中设置了格式标志位,用于控制多格式定点数据的处理。处理器实现了指令级并行、数据级并行等并行处理方式。
展开更多
关键词
图形处理
超标量
阻塞标志位
指令级并行
数据级并行
下载PDF
职称材料
流化H.264编码的数据并行方法
7
作者
文梅
任巨
+3 位作者
伍楠
苏华友
荀长庆
张春元
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2011年第3期66-71,共6页
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编...
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法。采用这些方法能够保证大数据并行粒度,最终达到高效并行流化编码的目的。实验表明采用数据并行流化编码方法,帧间预测、帧内预测、熵编码和去块滤波模块都获得了显著加速。
展开更多
关键词
H.264编码
流模型
并行计算
数据并行
下载PDF
职称材料
题名
基于数据级任务分解的配电网分布式并行计算平台
被引量:
14
1
作者
黄伟
庞琳
曹彬
焦润海
机构
华北电力大学电气与电子工程学院
华北电力大学控制与计算机工程学院
出处
《电网技术》
EI
CSCD
北大核心
2014年第4期1103-1108,共6页
基金
中央高校基本科研业务费专项资金资助项目(11MG13)~~
文摘
为实现大规模配电网的实时分析计算,构建了基于数据级任务分解的配电网分布式并行计算平台。结合配电网运行结构和设备配置,以配电网馈线作为分析单元,采用数据级并行计算方式对配电网计算任务进行分解。配置管理模块、实例、执行端和客户端4个子系统,分别实现任务生成、任务分解、任务派发以及子任务计算等功能,形成分布式并行计算平台框架。引入消息中间件ZeroMQ技术,采用不同类型套接字的组合实现分布式系统内部的N-N高效通信及与外部系统的数据交互。为验证该平台的实用性及并行计算性能,在平台上实现了山东省某市的城市配电网全局状态估计的分布式并行计算。算例分析表明:在配电网节点达到一定规模时,采用该平台进行分布式并行计算具有明显的速度优势。
关键词
数据级并行
分布式并行计算平台
配电网
分布式通信架构
Keywords
ZeroMQ
data
-
level
parallel
distributed
and
parallel
computing
platform
distribution
network
ZeroMQ
distributed
communication
architecture
分类号
TM721 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
面向OpenCL架构的GPGPU量化性能模型
被引量:
3
2
作者
朱俊峰
陈钢
张珂良
吴百锋
机构
复旦大学计算机科学与技术学院
中国电子科技集团公司第三十八研究所
出处
《小型微型计算机系统》
CSCD
北大核心
2013年第5期1118-1125,共8页
基金
上海市重点学科建设基金项目(B114)资助
AMD大学合作计划基金项目资助
文摘
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响GPGPU程序性能的各种因素:全局存储器访问、局部存储器访问、计算与访存重叠、条件分支转移和同步.通过对DLP应用的静态分析并设定具体的OpenCL执行配置,在无需编写实际GPGPU程序的前提下采用该模型即可估算出DLP应用在GPU体系结构上的执行时间.在AMD RadeonTMHD 5870 GPU和NVIDIA GeForceTMGTX 280 GPU上对矩阵乘法与并行前缀和的分析与实验结果表明:该性能模型能够相对准确地评估DLP应用并行化后的执行时间.
关键词
GPU
GPGPU
数据并行
OPENCL
性能模型
Keywords
GPU
GPGPU
data
-
level
parallel
OpenCL
performance
model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于异构GPU集群的并行分布式编程解决方案
被引量:
1
3
作者
李佳佳
胡新明
吴百锋
机构
复旦大学计算机科学技术学院
出处
《计算机应用与软件》
CSCD
北大核心
2014年第9期28-31,176,共5页
文摘
由于超强的计算能力、高速访存带宽、支持大规模数据级并行程序设计等特点,GPU已经成为超级计算机和高性能计算(HPC)集群的主流加速器。随着处理单元的发展和集群节点的拓展,GPU集群不仅在节点层面呈现异构化,节点内也趋于异构化,大大提高了在GPU集群中编程的复杂度。主流GPU异构集群系统大多采用针对GPU的异构计算编程模型与面向分布式内存的消息传递模型的简单结合方式,这种方式使得GPU集群程序设计缺乏确定的准则,往往是低效而且易错的。为了提高在GPU集群中编程的效率,降低编程复杂度,以及实现平台无关性,提出一套异构GPU集群的并行分布式编程的解决方案。该方案通过采用扩展语言方法提出了编程框架DISPAR,并实现了预处理器系统StreamCC。实验证明了其可行性。
关键词
GPU集群
编程模型
数据级并行
Keywords
GPU
clusters
Programming
framework
data
-
level
parallel
分类号
TP3 [自动化与计算机技术—计算机科学与技术]
下载PDF
职称材料
题名
时钟共享多线程处理器SIMD控制器设计与实现
4
作者
刘欢
韩俊刚
李卯良
杨铮
机构
西安邮电大学计算机学院
西安邮电大学电子工程学院
出处
《电子技术应用》
北大核心
2016年第11期29-32,共4页
基金
国家自然科学基金重点资助项目(61136002)
教育部科学研究计划重点资助项目(2111180)
文摘
针对图形图像处理器中指令与数据加载以及数据收集的问题,设计和实现了一种时钟共享多线程处理器中的SIMD控制器,完成相关SIMD指令的发送、数据的加载和数据的收集。该控制器以实现高效的数据级并行计算为目标,采用有限状态机实现了前向处理单元、行控制器和列控制器的设计。实验结果表明,所设计的专用硬件电路能够有效提高图形图像处理器处理并行数据的能力。
关键词
多线程处理器
SIMD控制器
数据级并行
状态机
Keywords
multi-threaded
processor
SIMD
controller
data
-
level
parallel
state
machine
分类号
TP302 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
多态并行处理器中的SIMD控制器设计与实现
被引量:
4
5
作者
蒲林
李涛
易学渊
韩俊刚
机构
西安邮电大学电子工程学院
西安邮电大学计算机学院
出处
《电子技术应用》
北大核心
2013年第11期53-55,59,共4页
基金
国家自然科学基金重点资助项目(61136002)
陕西省科学技术研究发展计划资助项目(2011K06-47)
文摘
设计和实现了一种多态并行处理器中的SIMD控制器。为满足图像并行处理的需要,以实现高效的数据级并行计算为目标,采用状态机实现了行、列、簇控制器的设计,完成了SIMD指令的发送、数据的加载和远程数据的传输。在阵列机上分区并发实现了SIMD和MIMD两种计算模式,能够实现两种计算模式的切换。专用的硬件电路设计提高了该处理器处理并行数据的能力。
关键词
多态并行处理器
SIMD控制器
数据级并行
阵列机
Keywords
polymorphism
parallel
processor
SIMD
controller
data
level
parallel
array
machine
分类号
TN492 [电子电信—微电子学与固体电子学]
下载PDF
职称材料
题名
一种图形处理用的多格式定点运算器
6
作者
易学渊
李涛
蒲林
机构
西安邮电大学计算机学院
西安邮电大学电子工程学院
出处
《计算机技术与发展》
2014年第10期147-150,共4页
基金
国家自然科学基金重点资助项目(61136002)
陕西省科学技术研究发展计划资助项目(2011K06-47)
文摘
典型图形处理管线中的隐藏面消除、视窗变换、图元光栅化和像素着色等渲染阶段只需要定点运算,但是这些定点运算的数值范围需要变动。因此,设计了一种多格式定点处理单元来满足这些运算需求。设计中采用了指令双发射和多配置流水线等超标量处理机制,访存采用直接寻址,不含通用寄存器和LD/ST操作。值得一提的是,指令字中设置了阻塞标志位,用于控制互连通信模式,数据字中设置了格式标志位,用于控制多格式定点数据的处理。处理器实现了指令级并行、数据级并行等并行处理方式。
关键词
图形处理
超标量
阻塞标志位
指令级并行
数据级并行
Keywords
graphics
processing
superscalar
blockbing
bit
instruction
level
parallel
data
level
parallel
分类号
TP332 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
流化H.264编码的数据并行方法
7
作者
文梅
任巨
伍楠
苏华友
荀长庆
张春元
机构
国防科技大学计算机学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2011年第3期66-71,共6页
基金
国家自然科学基金资助项目(60703073
60903041
61033008)
文摘
流模型是一种源于媒体处理的新型并行计算模型。然而H.264编码作为媒体处理领域中的重要应用,在与流模型适配时,却出现重要障碍,主要是由于相关性问题极大地限制了流化过程中数据级并行的开发。针对这个问题,首先根据编码算法分析了编码过程中遇到的相关性问题,然后为各主要编码模块分别提出解除相关性限制的数据并行编码方法。采用这些方法能够保证大数据并行粒度,最终达到高效并行流化编码的目的。实验表明采用数据并行流化编码方法,帧间预测、帧内预测、熵编码和去块滤波模块都获得了显著加速。
关键词
H.264编码
流模型
并行计算
数据并行
Keywords
H.264
coding
stream
processing
model
parallel
processing
data
level
parallel
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于数据级任务分解的配电网分布式并行计算平台
黄伟
庞琳
曹彬
焦润海
《电网技术》
EI
CSCD
北大核心
2014
14
下载PDF
职称材料
2
面向OpenCL架构的GPGPU量化性能模型
朱俊峰
陈钢
张珂良
吴百锋
《小型微型计算机系统》
CSCD
北大核心
2013
3
下载PDF
职称材料
3
基于异构GPU集群的并行分布式编程解决方案
李佳佳
胡新明
吴百锋
《计算机应用与软件》
CSCD
北大核心
2014
1
下载PDF
职称材料
4
时钟共享多线程处理器SIMD控制器设计与实现
刘欢
韩俊刚
李卯良
杨铮
《电子技术应用》
北大核心
2016
0
下载PDF
职称材料
5
多态并行处理器中的SIMD控制器设计与实现
蒲林
李涛
易学渊
韩俊刚
《电子技术应用》
北大核心
2013
4
下载PDF
职称材料
6
一种图形处理用的多格式定点运算器
易学渊
李涛
蒲林
《计算机技术与发展》
2014
0
下载PDF
职称材料
7
流化H.264编码的数据并行方法
文梅
任巨
伍楠
苏华友
荀长庆
张春元
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2011
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部