期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
交替方向隐式CFD解法器的GPU并行计算及其优化 被引量:2
1
作者 邓亮 徐传福 +1 位作者 刘巍 张理论 《计算机应用》 CSCD 北大核心 2013年第10期2783-2786,共4页
交替方向隐格式(ADI)是常见的偏微分方程离散格式之一,目前对ADI格式在计算流体力学(CFD)实际应用中的GPU并行工作开展较少。从一个有限体积CFD应用出发,通过分析ADI解法器的特点和计算流程,基于统一计算架构(CUDA)编程模型设计了基于... 交替方向隐格式(ADI)是常见的偏微分方程离散格式之一,目前对ADI格式在计算流体力学(CFD)实际应用中的GPU并行工作开展较少。从一个有限体积CFD应用出发,通过分析ADI解法器的特点和计算流程,基于统一计算架构(CUDA)编程模型设计了基于网格点与网格线的两类细粒度GPU并行算法,讨论了若干性能优化方法。在天河-1A系统上,采用128×128×128网格规模的单区结构网格算例,无粘项、粘性项及ADI迭代计算的GPU并行性能相对于单CPU核,分别取得了100.1、40.1和10.3倍的加速比,整体ADI CFD解法器的GPU并行加速比为17.3。 展开更多
关键词 交替方向隐式 计算流体力学解法器 结构网格 GPU并行
下载PDF
Efficient Configuration Space Construction and Optimization for Motion Planning 被引量:1
2
作者 Jia Pan Dinesh Manocha 《Engineering》 SCIE EI 2015年第1期46-57,共12页
The configuration space is a fundamental concept that is widely used in algorithmic robotics. Many applications in robotics, computer-aided design, and related areas can be reduced to computational problems in terms o... The configuration space is a fundamental concept that is widely used in algorithmic robotics. Many applications in robotics, computer-aided design, and related areas can be reduced to computational problems in terms of configuration spaces. In this paper, we survey some of our recent work on solving two important challenges related to configuration spaces: ~ how to efficiently compute an approximate representation of high-dimensional configuration spaces; and how to efficiently perform geometric proximity and motion planning queries (n high-dimensional configuration spaces. We present new configuration space construction algorithms based on machine learning and geometric approximation techniques. These algorithms perform collision queries on many configuration samples. The collision query results are used to compute an approximate representation for the configuration space, which quickly converges to the exact configuration space. We also present parallel GPU-based algorithms to accelerate the performance of optimization and search computations in configuration spaces. In particular, we design efficient GPU-based parallel k-nearest neighbor and parallel collision detection algorithms and use these algorithms to accelerate motion planning. 展开更多
关键词 configuration space motion planning gpuparallel algorithm
下载PDF
选择性重排FDK算法及其GPU加速优化 被引量:2
3
作者 张文昆 闫镔 +3 位作者 蔡爱龙 魏峰 邓林 李磊 《CT理论与应用研究(中英文)》 2015年第3期383-392,共10页
FDK算法是目前三维图像重建的主流算法,但是传统重排FDK算法存在占用内存量较大、重建效率不高的问题,本文提出一种选择性重排FDK算法。根据重排前后投影数据的结构关系,计算出一轮重排所加载的最少锥形束投影,并使用循环队列对有限帧... FDK算法是目前三维图像重建的主流算法,但是传统重排FDK算法存在占用内存量较大、重建效率不高的问题,本文提出一种选择性重排FDK算法。根据重排前后投影数据的结构关系,计算出一轮重排所加载的最少锥形束投影,并使用循环队列对有限帧数的投影进行选择性加载,显著降低了重建对内存的消耗。此外,利用新算法较好的并行性,借助图形处理单元(GPU)对算法进行了硬件加速,大大提升算法的执行效率。为验证算法有效性,对5123规模的仿真数据和实际数据进行重建,在不损失重建精度的前提下,新算法占用内存约为传统算法的1/3或1/5。本文算法对传统重排FDK算法进行了改进,有效降低了计算机内存占用,较好地解决了大规模投影数据重建问题。 展开更多
关键词 FDK算法 选择性重排 循环队列 图形处理单元并行加速
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部