期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于PMVS算法的大规模数据细粒度并行优化方法 被引量:4
1
作者 刘金硕 李扬眉 +3 位作者 江庄毅 邓娟 眭海刚 Pan Jeff 《武汉大学学报(信息科学版)》 EI CSCD 北大核心 2019年第4期608-616,共9页
三维多视角立体视觉算法(patch-based multi-view stereo, PMVS)以其良好的三维重建效果广泛应用于数字城市等领域,但用于大规模计算时算法的执行效率低下。针对此,提出了一种细粒度并行优化方法,从任务划分和负载均衡、主系统存储和GP... 三维多视角立体视觉算法(patch-based multi-view stereo, PMVS)以其良好的三维重建效果广泛应用于数字城市等领域,但用于大规模计算时算法的执行效率低下。针对此,提出了一种细粒度并行优化方法,从任务划分和负载均衡、主系统存储和GPU存储、通信开销等3方面加以优化;同时,设计了基于面片的PMVS算法特征提取的GPU和多线程并行改造方法,实现了CPUs_GPUs多粒度协同并行。实验结果表明,基于CPU多线程策略能实现4倍加速比,基于统一计算设备架构(compute unified device architecture, CUDA)并行策略能实现最高34倍加速比,而提出的策略在CUDA并行策略的基础上实现了30%的性能提升,可以用于其他领域大数据处理中快速调度计算资源。 展开更多
关键词 CPUs_gpus多粒度并行 gpu并行优化 CUDA 负载均衡 存储与通信优化 图像处理
原文传递
基于容器化的快速射电暴搜寻GPU并行优化
2
作者 王玉明 吴开超 +1 位作者 牛晨辉 张晓丽 《数据与计算发展前沿》 CSCD 2024年第1期102-112,共11页
【应用背景】快速射电暴(Fast Radio Burst,FRB)搜寻是500米口径球面射电望远镜(FAST)的重要科学目标之一,其计算复杂度高,数据量大,当前算法GPU利用率偏低,数据处理需较多的人工介入操作。【目的】在不修改算法实现的前提下,实现进程级... 【应用背景】快速射电暴(Fast Radio Burst,FRB)搜寻是500米口径球面射电望远镜(FAST)的重要科学目标之一,其计算复杂度高,数据量大,当前算法GPU利用率偏低,数据处理需较多的人工介入操作。【目的】在不修改算法实现的前提下,实现进程级GPU并行优化,提高GPU整体资源利用率,简化算法运行调度,支持利用自动化脚本驱动计算过程。【方法】利用容器化封装FRB搜寻算法,结合GPU聚合技术实现多个FRB搜寻计算容器的多进程并行,支持GPU闲时复用。通过容器化封装屏蔽了GPU调用、依赖库管理等技术细节,减少人工介入操作。【结果】算法实验结果表明,在不修改原始算法、不增加GPU资源的前提下,将单GPU绑定6个计算进程,并行优化可实现FRB搜寻算法的加速比达到5.3,并行效率达到0.88,取得良好的并行效果。【结论】基于容器化封装及进程级GPU聚合的并行优化,可实现GPU利用率及计算效率的提升,有效支持自动化处理。该方法还具有良好的通用性,可适用于类似应用的并行优化。 展开更多
关键词 快速射电暴 容器化 进程级并行优化 gpu聚合
下载PDF
基于GPU的高光谱遥感岩矿信息快速提取方法 被引量:3
3
作者 柳家福 吴泽彬 +2 位作者 刘天石 韦志辉 王启聪 《中国科技论文》 CAS 北大核心 2014年第10期1137-1143,共7页
提出了基于图形处理单元(graphics processing unit,GPU)的高光谱岩矿信息快速提取方法,利用GPU的并行计算优势对高光谱岩矿信息提取的核心步骤进行了并行优化设计。针对高光谱岩矿信息提取的算法特点,提出了相应的性能优化策略,包括优... 提出了基于图形处理单元(graphics processing unit,GPU)的高光谱岩矿信息快速提取方法,利用GPU的并行计算优势对高光谱岩矿信息提取的核心步骤进行了并行优化设计。针对高光谱岩矿信息提取的算法特点,提出了相应的性能优化策略,包括优化算法流程、提高访存效率和减少数据访问冲突。实验结果表明,并行设计模型与优化方法能够快速有效地进行岩矿信息提取,并且最大加速比达到了81倍。 展开更多
关键词 高光谱遥感 岩矿信息提取 图形处理单元 并行优化
下载PDF
Bellman-Ford算法性能可移植的GPU并行优化 被引量:7
4
作者 刘磊 王燕燕 +2 位作者 申春 李玉祥 刘雷 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2015年第5期1559-1564,共6页
提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AM... 提出了一种面向GPU的性能可移植的并行归约求极值优化算法和全局访存优化算法,对Bellman-Ford算法进行并行化改造,以解决不同类型GPU设备上都存在的并行粒度不足和全局内存访问不连续等问题。实验结果表明:本文的优化算法在NVIDIA和AMD的多款GPU设备上都取得了很好的效果,经本文算法优化后的程序性能较原始GPU并行版本提升3~6倍。 展开更多
关键词 计算机软件 Bellman-Ford算法 gpu并行编程及优化技术 并行归约算法 性能可移植性
下载PDF
基于Cholesky分解的高光谱实时异常探测的GPU优化 被引量:2
5
作者 李萍 关桂霞 +2 位作者 吴太夏 彭波 黄晓 《传感器与微系统》 CSCD 2019年第3期7-10,共4页
高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表... 高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表明:提出的优化设计在保证探测精度的同时,进一步提升了计算效率,算法加速比最高达到3. 14倍,说明基于GPU的并行优化算法能够较好地满足高光谱遥感图像实时处理的应用需求。 展开更多
关键词 高光谱遥感图像 实时异常探测 CHOLESKY分解 图形处理器并行优化
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部