期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
4
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于GPGPU的Lattice-Boltzmann数值模拟算法
被引量:
11
1
作者
周季夫
钟诚文
+2 位作者
尹世群
解建飞
张勇
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008年第7期912-918,共7页
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、...
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、多通道渲染和乒乓技术来设计一套基于方腔的LBM数值模拟程序,最终使GPU的计算时间缩短到CPU计算时间的六分之一.
展开更多
关键词
基于图形处理器的通用计算
帧缓存扩展
多重渲染目标
Lattice-Boltzmann方法
反弹边界
乒乓技术
下载PDF
职称材料
基于GPGPU的生物序列快速比对
被引量:
5
2
作者
马海晨
韦刚
吴百峰
《计算机工程》
CAS
CSCD
2012年第4期241-244,共4页
在CPU-GPU异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL框架下重构Smith-Waterman算法,加快生物序列比对速度。实验结果证明,与CPU上传统的串...
在CPU-GPU异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL框架下重构Smith-Waterman算法,加快生物序列比对速度。实验结果证明,与CPU上传统的串行算法相比,该算法最高可获得约100倍的性能提升。
展开更多
关键词
生物信息学
序列比对
通用图形处理器
SMITH-WATERMAN算法
OpenCL框架
下载PDF
职称材料
并行时空处理模型下的快速N-body算法
被引量:
3
3
作者
王伟
曾栩鸿
+2 位作者
王福焕
傅丽丽
曾国荪
《计算机科学与探索》
CSCD
2011年第11期1006-1013,共8页
图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的...
图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。
展开更多
关键词
N-BODY
并行计算
通用图形处理器(
gpgpu
)
时间空间模型
下载PDF
职称材料
面向CPU-GPU架构的源到源自动映射方法
被引量:
2
4
作者
朱正东
刘袁
+3 位作者
魏洪昌
颜康
王寅峰
董小社
《计算机工程与应用》
CSCD
北大核心
2015年第21期41-47,共7页
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端...
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。
展开更多
关键词
通用计算图形处理器(
gpgpu
)
统一计算架构(CUDA)
自动映射
源到源编译
下载PDF
职称材料
题名
基于GPGPU的Lattice-Boltzmann数值模拟算法
被引量:
11
1
作者
周季夫
钟诚文
尹世群
解建飞
张勇
机构
西北工业大学高性能计算研究与发展中心
西南大学计算机与信息科学学院
西北工业大学翼型
中国人民解放军
出处
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008年第7期912-918,共7页
基金
航空科学基金(20061453020)
西北工业大学基础科学研究基金重点项目
文摘
对Lattice Boltzmann方法(LBM)在GPGPU下的建模和算法进行了一系列研究,使得该方法在GPU下的计算加速比提升,大大缩短计算过程的时间消耗.重新设计了GPU的计算流程,在舍弃pixel buffer离屏渲染的同时,采用最新的帧缓存对象,多重纹理、多通道渲染和乒乓技术来设计一套基于方腔的LBM数值模拟程序,最终使GPU的计算时间缩短到CPU计算时间的六分之一.
关键词
基于图形处理器的通用计算
帧缓存扩展
多重渲染目标
Lattice-Boltzmann方法
反弹边界
乒乓技术
Keywords
general
purpose
graphic
processing unit
(
gpgpu
)
frame
buffer
object
multiple
render
target
Lattice-Boltzmann
method
rebound
boundary
ping-pang
technique
分类号
TP391.9 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
基于GPGPU的生物序列快速比对
被引量:
5
2
作者
马海晨
韦刚
吴百峰
机构
复旦大学计算机科学技术学院
出处
《计算机工程》
CAS
CSCD
2012年第4期241-244,共4页
文摘
在CPU-GPU异构平台下,提出一种高效的生物序列比对方案。该方案利用GPU的并行处理能力,通过对读延迟、写延迟、重组函数及数据传输进行优化,在OpenCL框架下重构Smith-Waterman算法,加快生物序列比对速度。实验结果证明,与CPU上传统的串行算法相比,该算法最高可获得约100倍的性能提升。
关键词
生物信息学
序列比对
通用图形处理器
SMITH-WATERMAN算法
OpenCL框架
Keywords
bioinformatics
sequence
alignment
general
purpose
graphic
processing unit
(
gpgpu
)
Smith-Waterman(SW)
algorithm
OpenCL
framework
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
并行时空处理模型下的快速N-body算法
被引量:
3
3
作者
王伟
曾栩鸿
王福焕
傅丽丽
曾国荪
机构
同济大学计算机科学与技术系
国家高性能计算机工程技术中心同济分中心
同济大学嵌入式系统与服务计算教育部重点实验室
出处
《计算机科学与探索》
CSCD
2011年第11期1006-1013,共8页
基金
国家自然科学基金No.61103068
61174158
+5 种基金
NSFC-微软亚洲研究院联合资助项目No.60970155
教育部博士点基金No.20090072110035
上海市优秀学科带头人计划项目No.10XD1404400
高效能服务器和存储技术国家重点实验室开放基金No.2009HSSA06
同济大学青年基金No.0800219105
2009KJ030~~
文摘
图形处理器(graphic processing unit,GPU)的最新发展已经能够以低廉的成本提供高性能的通用计算。基于GPU的CUDA(compute unified device architecture)和OpenCL(open computing language)编程模型为程序员提供了充足的类似于C语言的应用程序接口(application programming interface,API),便于程序员发挥GPU的并行计算能力。采用图形硬件进行加速计算,通过一种新的GPU处理模型——并行时间空间模型,对现有GPU上的N-body实现进行了分析,从而提出了一种新的GPU上快速仿真N-body问题的算法,并在AMD的HD Radeon 5850上进行了实现。实验结果表明,相对于CPU上的实现,获得了400倍左右的加速;相对于已有GPU上的实现,也获得了2至5倍的加速。
关键词
N-BODY
并行计算
通用图形处理器(
gpgpu
)
时间空间模型
Keywords
N-body
parallel
computing
general
purpose
graphic
processing unit
(
gpgpu
)
time-space
model
分类号
TP301 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
面向CPU-GPU架构的源到源自动映射方法
被引量:
2
4
作者
朱正东
刘袁
魏洪昌
颜康
王寅峰
董小社
机构
西安交通大学电子与信息工程学院
深圳信息职业技术学院
出处
《计算机工程与应用》
CSCD
北大核心
2015年第21期41-47,共7页
基金
国家自然科学基金(No.61173039)
青年基金项目(No.61202041)
+2 种基金
国家高技术研究发展计划(863)(No.2012AA010904
No.2012AA01A306)
深圳市科技计划(No.JCYJ20120615101127404)
文摘
针对GPU上应用开发移植困难的问题,提出了一种串行计算源程序到并行计算源程序的映射方法。该方法从串行源程序中获得可并行化循环的层次信息,建立循环体结构与GPU线程的对应关系,生成GPU端核心函数代码;根据变量引用读写属性生成CPU端控制代码。基于该方法实现了一个编译原型系统,完成了C语言源程序到CUDA源程序的自动生成。对原型系统在功能和性能方面的测试结果表明,该系统生成的CUDA源程序与C语言源程序在功能上一致,其性能有显著提高,在一定程度上解决了计算密集型应用向CPU-GPU异构多核系统移植困难的问题。
关键词
通用计算图形处理器(
gpgpu
)
统一计算架构(CUDA)
自动映射
源到源编译
Keywords
general
purpose
graphic
processing unit
(
gpgpu
)
Compute
Unified
Device
Architecture
(CUDA)
auto-matic
mapping
source
to
source
compile
分类号
TP303 [自动化与计算机技术—计算机系统结构]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于GPGPU的Lattice-Boltzmann数值模拟算法
周季夫
钟诚文
尹世群
解建飞
张勇
《计算机辅助设计与图形学学报》
EI
CSCD
北大核心
2008
11
下载PDF
职称材料
2
基于GPGPU的生物序列快速比对
马海晨
韦刚
吴百峰
《计算机工程》
CAS
CSCD
2012
5
下载PDF
职称材料
3
并行时空处理模型下的快速N-body算法
王伟
曾栩鸿
王福焕
傅丽丽
曾国荪
《计算机科学与探索》
CSCD
2011
3
下载PDF
职称材料
4
面向CPU-GPU架构的源到源自动映射方法
朱正东
刘袁
魏洪昌
颜康
王寅峰
董小社
《计算机工程与应用》
CSCD
北大核心
2015
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部