期刊文献+
共找到156篇文章
< 1 2 8 >
每页显示 20 50 100
基于Tensorflow对卷积神经网络的优化研究 被引量:18
1
作者 郭敏钢 宫鹤 《计算机工程与应用》 CSCD 北大核心 2020年第1期158-164,共7页
针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+... 针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+GPU计算模型在性耗比上更加优异。针对在卷积神经网络中Swish激活函数在反向传播求导误差梯度时涉及参数较多所导致的计算量较大,收敛速度慢,以及ReLU激活函数在x负区间内导数为零所导致的负梯度被置为零且神经元可能无法被激活的问题,提出了新的激活函数ReLU-Swish。通过测试训练对比并分析结果,将Swish激活函数小于零与ReLU激活函数大于零的部分组成分段函数,并且通过CIFAR-10和MNIST两个数据集进行测试对比实验。实验结果表明,ReLU-Swish激活函数在收敛速度以及模型测试训练的准确率上对比Swish激活函数及ReLU激活函数有较明显的提高。 展开更多
关键词 Tensorflow cpu+gpu 卷积神经网络 Swish激活函数 ReLU激活函数 ReLU-Swish激活函数
下载PDF
基于CPU/GPU处理器的雷达脉冲压缩算法并行机制研究 被引量:8
2
作者 彭培 张云雷 +1 位作者 李轲 席泽敏 《舰船电子工程》 2017年第10期30-32,107,共4页
为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算... 为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算法实现流程,分别从片上缓存、内核线程和数据并行等方面设计了三种GPU并行优化策略。仿真测试表明,所提出的GPU并行机制与典型多核CPU平台相比,具有更好的实时性能。 展开更多
关键词 cpu/gpu 并行机制 软件化雷达 脉冲压缩
下载PDF
基于CPU/GPU异构模式的高光谱遥感影像数据处理研究与实现 被引量:6
3
作者 汤媛媛 周海芳 +1 位作者 方民权 申小龙 《计算机科学》 CSCD 北大核心 2016年第2期47-50,77,共5页
近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和... 近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和CPU/GPU异构计算模式,总结了近几年国内外基于CPU/GPU异构模式的高光谱遥感数据处理研究现状和问题;并面向共享存储型小型桌面超级计算机,基于CPU/GPU异构模式实现了高光谱遥感影像MNF降维的并行化,通过与串行程序和共享存储的OpenMP同构模式对比,验证了异构模式在高光谱遥感处理领域的发展潜力。 展开更多
关键词 高光谱遥感 cpu/gpu OPENMP MNF
下载PDF
Simulation of dynamic fluid-solid interactions with an improved direct-forcing immersed boundary method 被引量:6
4
作者 Shengbin Di Wei Ge 《Particuology》 SCIE EI CAS CSCD 2015年第1期22-34,共13页
Dynamic fluid-solid interactions are widely found in chemical engineering, such as in particle-laden flows, which usually contain complex moving boundaries. The immersed boundary method (IBM) is a convenient approac... Dynamic fluid-solid interactions are widely found in chemical engineering, such as in particle-laden flows, which usually contain complex moving boundaries. The immersed boundary method (IBM) is a convenient approach to handle fluid-solid interactions with complex geometries. In this work, Uhlmann's direct-forcing IBM is improved and implemented on a supercomputer with CPU-GPU hybrid architec- ture. The direct-forcing IBM is modified as follows: the Poisson's equation for pressure is solved before evaluation of the body force, and the force is only distributed to the Cartesian grids inside the immersed boundary. A multidirect forcing scheme is used to evaluate the body force. These modifications result in a divergence-free flow field in the fluid domain and the no-slip boundary condition at the immersed boundary simultaneously. This method is implemented in an explicit finite-difference fractional-step scheme, and validated by 2D simulations of lid-driven cavity flow, Couette flow between two concentric cylinders and flow over a circular cylinder. Finally, the method is used to simulate the sedimentation of two circular particles in a channel. The results agree very well with previous experimental and numerical data, and are more accurate than the conventional direct-forcing method, especially in the vicinity of a moving boundary. 展开更多
关键词 Immersed boundary method Fluid-solid interactions No-slip condition Divergence-free condition cpu-gpu hybrid architecture
原文传递
CPU/GPU异构并行系统研究综述 被引量:6
5
作者 屈宜丽 蓝才会 任志国 《自动化与仪器仪表》 2016年第4期25-26,共2页
近年来,CPU/GPU异构并行系统凭借其强大的计算能力、高性价比和低功耗等优良特点,成为深受各大领域欢迎的新型高性能计算平台,但其复杂的体系结构也为并行计算的研究提出了巨大的挑战,成为一个热门的新兴研究领域。本综述从CPU/GPU异构... 近年来,CPU/GPU异构并行系统凭借其强大的计算能力、高性价比和低功耗等优良特点,成为深受各大领域欢迎的新型高性能计算平台,但其复杂的体系结构也为并行计算的研究提出了巨大的挑战,成为一个热门的新兴研究领域。本综述从CPU/GPU异构编程模型、存储模型、GPU集群、大数据环境下GPU系统的应用等几个方面对CPU/GPU异构并行系统的国内研究工作进行了回顾,并做了简要的分析,以期为初学者及其他研究者提供一定的参考。 展开更多
关键词 cpu/gpu 异构并行系统 gpu集群
原文传递
雷达回波模拟器的设计与实现
6
作者 李梦圆 开根深 杨刚 《火控雷达技术》 2024年第3期145-152,共8页
性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本... 性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本文通过对数字相控阵雷达建模,基于CPU+GPU平台设计了一种雷达回波模拟器,解决了传统模拟器难以升级维护的问题。在实验室内与雷达波控、信号处理、预处理、数据处理以及终端搭建起一套完整的仿真验证系统,经系统联调验证,该模拟器可以模拟雷达多种工作模式。 展开更多
关键词 回波模拟器 干扰 杂波 cpu+gpu
下载PDF
基于异构系统的多级并行稀疏张量向量乘算法
7
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 cpu-gpu 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于CPU+GPU混合架构的雷达信号处理方法
8
作者 常艳 何涛 朱占宇 《火力与指挥控制》 CSCD 北大核心 2024年第7期80-85,90,共7页
针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积... 针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积累、目标检测、目标检测后处理及解模糊过程,将对应处理映射到CPU+GPU核心以提高加速比。实验结果表明,相比多核DSP信号处理方法,该方法具有更好的性能。 展开更多
关键词 cpu+gpu 混合架构 信号处理 多核DSP
下载PDF
基于GPU的遥感图像前期处理算法研究与应用 被引量:5
9
作者 王化喆 魏先勇 《现代电子技术》 北大核心 2016年第3期47-50,54,共5页
针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可... 针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。 展开更多
关键词 遥感图像 几何校正 SIFT特征提取 cpu+gpu 并行计算
下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:5
10
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
下载PDF
媒体融合背景下网络直播技术模式分析与基于软硬结合平台网络直播的实现 被引量:1
11
作者 杨炎思 胡岳 《广播与电视技术》 2023年第12期28-32,共5页
本文介绍了媒体融合背景下网络直播技术的两种模式,对比了两种模式的适用场景、基本架构和技术特点,提出了“基于‘CPU+GPU’技术的软硬结合平台更适合专业传媒机构开展网络直播”的观点,并以新媒体直播节目《心动的盲盒》为例,重点阐... 本文介绍了媒体融合背景下网络直播技术的两种模式,对比了两种模式的适用场景、基本架构和技术特点,提出了“基于‘CPU+GPU’技术的软硬结合平台更适合专业传媒机构开展网络直播”的观点,并以新媒体直播节目《心动的盲盒》为例,重点阐述了基于软硬结合平台的网络直播模式的实现方式。 展开更多
关键词 网络直播 新媒体直播 cpu+gpu
下载PDF
基于负载均衡的CPU-GPU异构计算平台任务调度策略 被引量:5
12
作者 方娟 章佳兴 《北京工业大学学报》 CAS CSCD 北大核心 2020年第7期782-787,共6页
针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计... 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能. 展开更多
关键词 中央处理单元-图形处理单元(central processing unit-graphics processing unit cpu-gpu) 异构计算 高性能计算 任务调度 负载均衡 负载感知
下载PDF
基于改进包围盒树和GPU的水稻群体叶片间快速碰撞检测 被引量:4
13
作者 张兴邦 胡滨 +2 位作者 汤亮 伍艳莲 姜海燕 《农业工程学报》 EI CAS CSCD 北大核心 2018年第1期171-177,共7页
为了解决水稻群体动态生长模拟过程中叶片间碰撞检测效率较低的技术问题,该文利用水稻叶片抛物线的形态结构特性以及CPU/GPU硬件加速特性,提出了水稻叶片混合层次包围盒树(mixed level tree,MLT)快速构造方法以及基于CPU/GPU的群体叶片... 为了解决水稻群体动态生长模拟过程中叶片间碰撞检测效率较低的技术问题,该文利用水稻叶片抛物线的形态结构特性以及CPU/GPU硬件加速特性,提出了水稻叶片混合层次包围盒树(mixed level tree,MLT)快速构造方法以及基于CPU/GPU的群体叶片快速相交检测方法。提出了新的OBB包围盒方向轴计算方式,降低了OBB包围盒构建的复杂度,在此基础上,利用单株叶片之间、群体叶片之间碰撞检测计算关系的依赖性,设计了CPU/GPU加速方案,并使用CUDA在Tesla 40加速卡上实现。对分蘖期大规模水稻群体叶片进行了效率对比试验,结果表明,水稻群体规模从2 000株增长到10 000株的过程中,本文提出的基于MLT的碰撞检测方法耗时是传统的AABB方法耗时的50%,是OBB方法耗时的30%,有效地提升了叶片之间的碰撞检测速度;同时,基于CPU的碰撞检测方法耗时呈线性增长,而利用CPU/GPU并行加速耗时相较于在CPU上的运行时间节省了98%,大幅度提升碰撞检测效率。该研究可为虚拟作物可视化仿真提供参考。 展开更多
关键词 作物 算法 模型 虚拟水稻 叶片群体 碰撞检测 包围盒 cpu/gpu
下载PDF
A Hybrid Parallel Strategy for Isogeometric Topology Optimization via CPU/GPU Heterogeneous Computing
14
作者 Zhaohui Xia Baichuan Gao +3 位作者 Chen Yu Haotian Han Haobo Zhang Shuting Wang 《Computer Modeling in Engineering & Sciences》 SCIE EI 2024年第2期1103-1137,共35页
This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstr... This paper aims to solve large-scale and complex isogeometric topology optimization problems that consumesignificant computational resources. A novel isogeometric topology optimization method with a hybrid parallelstrategy of CPU/GPU is proposed, while the hybrid parallel strategies for stiffness matrix assembly, equationsolving, sensitivity analysis, and design variable update are discussed in detail. To ensure the high efficiency ofCPU/GPU computing, a workload balancing strategy is presented for optimally distributing the workload betweenCPU and GPU. To illustrate the advantages of the proposedmethod, three benchmark examples are tested to verifythe hybrid parallel strategy in this paper. The results show that the efficiency of the hybrid method is faster thanserial CPU and parallel GPU, while the speedups can be up to two orders of magnitude. 展开更多
关键词 Topology optimization high-efficiency isogeometric analysis cpu/gpu parallel computing hybrid OpenMPCUDA
下载PDF
基于CUDA技术模拟雷达余辉的方法 被引量:3
15
作者 谢永亮 汤晓迪 +1 位作者 刘尚富 曾海兵 《微型机与应用》 2011年第8期61-63,66,共4页
分析了目前基于光栅显示器模拟雷达余辉的方法。针对实现逼真余辉效果存在的主要瓶颈,通过采用CUDA技术可以解决模拟余辉时庞大的计算量的问题。主要采用CPU+GPU的编程模式模拟余辉,在GPU中为每一个像素点创建一个并行执行的线程来完成... 分析了目前基于光栅显示器模拟雷达余辉的方法。针对实现逼真余辉效果存在的主要瓶颈,通过采用CUDA技术可以解决模拟余辉时庞大的计算量的问题。主要采用CPU+GPU的编程模式模拟余辉,在GPU中为每一个像素点创建一个并行执行的线程来完成整个屏幕像素的数据处理,使得余辉效果逼真、画面流畅、扫描速度大幅提高。 展开更多
关键词 CUDA cpu+gpu 雷达余辉 光栅扫描
下载PDF
负载分配的CPU/GPU高分辨率卫星影像调制传递补偿方法 被引量:3
16
作者 方留杨 王密 +1 位作者 李德仁 潘俊 《测绘学报》 EI CSCD 北大核心 2014年第6期598-606,共9页
系统地探讨使用CPU/GPU协同处理理论对高分辨率卫星影像进行MTF补偿的方法。首先在GPU上对方法进行基本实现,并通过3种性能优化策略(执行配置优化、存储访问优化和指令优化)进一步提高了方法的执行效率。在Intel Xeon E5650CPU和NVIDIA ... 系统地探讨使用CPU/GPU协同处理理论对高分辨率卫星影像进行MTF补偿的方法。首先在GPU上对方法进行基本实现,并通过3种性能优化策略(执行配置优化、存储访问优化和指令优化)进一步提高了方法的执行效率。在Intel Xeon E5650CPU和NVIDIA Tesla C2050GPU组成的CPU/GPU系统中对高分一号卫星全色影像进行MTF补偿,加速比达到42.80倍。在此基础上,为充分利用CPU的计算性能,使用CPU/GPU负载分配策略将部分负载分配给CPU进行处理,使用该策略后,方法加速比达到47.82倍,相应的处理时间压缩至1.62s,可满足对高分辨率卫星影像进行近实时MTF补偿的需求。 展开更多
关键词 cpu/gpu 调制传递函数补偿 执行配置优化 存储访问优化 指令优化 负载分配策略
原文传递
面向Dataflow的异构集群混合式资源调度框架研究 被引量:2
17
作者 汤小春 赵全 +4 位作者 符莹 朱紫钰 丁朝 胡小雪 李战怀 《软件学报》 EI CSCD 北大核心 2022年第12期4704-4726,共23页
Dataflow模型的使用,使得大数据计算的批处理和流处理融合为一体.但是,现有的针对大数据计算的集群资源调度框架,要么面向流处理,要么面向批处理,不适合批处理与流处理作业共享集群资源的需求.另外,GPU用于大数据分析计算时,由于缺乏有... Dataflow模型的使用,使得大数据计算的批处理和流处理融合为一体.但是,现有的针对大数据计算的集群资源调度框架,要么面向流处理,要么面向批处理,不适合批处理与流处理作业共享集群资源的需求.另外,GPU用于大数据分析计算时,由于缺乏有效的CPU-GPU资源解耦方式,降低了资源使用效率.在分析现有的集群资源调度框架的基础上,设计并实现了一种可以感知批处理/流处理应用的混合式资源调度框架HRM.它以共享状态架构为基础,采用乐观封锁协议和悲观封锁协议相结合的方式,确保流处理作业和批处理作业的不同资源要求.在计算节点上,提供CPU-GPU资源的灵活绑定,采用队列堆叠技术,不但满足流处理作业的实时性需求,也减少了反馈延迟并实现了GPU资源的共享.通过模拟大规模作业的调度,结果显示,HRM的调度延迟只有集中式调度框架的75%左右;使用实际负载测试,批处理与流处理共享集群时,使用HRM调度框架,CPU资源利用率提高25%以上;而使用细粒度作业调度方法,不但GPU利用率提高2倍以上,作业的完成时间也能够减少50%左右. 展开更多
关键词 数据流模型 批处理 流处理 作业感知 cpu-gpu 队列堆叠
下载PDF
ANSYS和Abaqus软件GPU加速性能典型算例测试与分析 被引量:3
18
作者 王惠 郭培卿 陈小龙 《计算机工程与科学》 CSCD 北大核心 2013年第11期105-110,共6页
在高性能计算领域,CPU/GPU异构协同处理技术已经成为快速获得计算结果的有效手段之一。典型结构力学计算软件ANSYS和Abaqus最新版本中加入了CPU/GPU协同处理技术,以进一步提高问题的求解效率。利用NVIDIA公司Tesla系列M2090GPU和上海超... 在高性能计算领域,CPU/GPU异构协同处理技术已经成为快速获得计算结果的有效手段之一。典型结构力学计算软件ANSYS和Abaqus最新版本中加入了CPU/GPU协同处理技术,以进一步提高问题的求解效率。利用NVIDIA公司Tesla系列M2090GPU和上海超级计算中心"蜂鸟"超级计算平台,通过求解典型结构问题,对ANSYS和Abaqus软件在开启GPU加速功能前后对求解效率的影响进行了对比和分析。结果表明,当并行规模低于16核时,GPU加速能够不同程度地减少各类结构问题的求解时间,但加速效果随着并行规模的增加逐渐减弱,多GPU协同求解对加速性能的提高并不明显,在实际应用中,需要结合问题类型以及当前硬件架构选择合适的并行方式和协同处理模式。 展开更多
关键词 cpu gpu 协同处理 加速性能 高性能计算
下载PDF
SIFT算法在无人机遥感影像特征提取中的应用 被引量:5
19
作者 张庆功 赵现昌 《河南水利与南水北调》 2019年第11期63-65,共3页
无人机遥感快速、灵活,应用十分广泛,无人机影像特征点的提取和匹配是无人机遥感应用的基础工作。SIFT是目前应用十分广泛的尺度不变的图像特征点检测算法,对图像的多种变形都保持不变性,同时对噪声和光线变化也保持一定的稳定性。SIFT... 无人机遥感快速、灵活,应用十分广泛,无人机影像特征点的提取和匹配是无人机遥感应用的基础工作。SIFT是目前应用十分广泛的尺度不变的图像特征点检测算法,对图像的多种变形都保持不变性,同时对噪声和光线变化也保持一定的稳定性。SIFT算法属于计算密集型问题,运算时间长,文章利用GPU对SIFT算法进行了并行处理,经测试对比,在保证良好特征点提取和匹配效果的前提下取得了良好的加速比。 展开更多
关键词 无人机遥感 SIFT特征点提取 cpu+gpu
原文传递
CPU/GPU并行加速的多谐波正弦拟合算法 被引量:2
20
作者 陈建军 任勇峰 甄国涌 《中北大学学报(自然科学版)》 CAS 北大核心 2013年第6期636-641,共6页
多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的... 多谐波正弦拟合算法常用最小二乘法将多谐波正弦信号采样数据拟合到多谐波正弦函数模型中.而在实际测量过程中,当相关噪声存在时最小二乘法的拟合精度会下降,为减少相关噪声对多谐波正弦拟合算法拟合精度的影响,在四参数正弦拟合算法的基础上提出了一种基于加权最小二乘的多谐波正弦拟合算法.并结合遗传算法避免了四参数正弦拟合算法对初始估计频率的依赖,提高了算法的鲁棒性.将算法在CPU/GPU平台上进行了实现,提高了算法的执行效率.在CPU/GPU平台下对受相关噪声污染的多谐波正弦信号进行了分析.实验结果表明,相比基于遗传算法的多谐波正弦拟合算法,所提算法的谐波幅值估计精度提高了1个数量级,算法执行时间缩短了近96%. 展开更多
关键词 cpu gpu 多谐波正弦拟合 遗传算法 并行处理 参数估计
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部