期刊文献+
共找到349篇文章
< 1 2 18 >
每页显示 20 50 100
基于Tensorflow对卷积神经网络的优化研究 被引量:17
1
作者 郭敏钢 宫鹤 《计算机工程与应用》 CSCD 北大核心 2020年第1期158-164,共7页
针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+... 针对卷积神经网络在性耗比上的不足,提出了异构式CPU+GPU的协同计算模型,在模型计算过程中使CPU负责逻辑性强的事物处理和串行计算,使GPU执行高度线程化的并行处理任务。通过实验测试与单GPU训练、单CPU训练进行对比,结果表明异构式CPU+GPU计算模型在性耗比上更加优异。针对在卷积神经网络中Swish激活函数在反向传播求导误差梯度时涉及参数较多所导致的计算量较大,收敛速度慢,以及ReLU激活函数在x负区间内导数为零所导致的负梯度被置为零且神经元可能无法被激活的问题,提出了新的激活函数ReLU-Swish。通过测试训练对比并分析结果,将Swish激活函数小于零与ReLU激活函数大于零的部分组成分段函数,并且通过CIFAR-10和MNIST两个数据集进行测试对比实验。实验结果表明,ReLU-Swish激活函数在收敛速度以及模型测试训练的准确率上对比Swish激活函数及ReLU激活函数有较明显的提高。 展开更多
关键词 Tensorflow cpu+gpu 卷积神经网络 Swish激活函数 ReLU激活函数 ReLU-Swish激活函数
下载PDF
基于GPU的矩阵求逆性能测试和分析 被引量:10
2
作者 刘丽 沈杰 李洪林 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第6期812-817,共6页
在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并... 在CPU串行运算模式下实现大规模矩阵求逆是一个非常耗时的过程。为了解决这一问题,基于NVIDIA公司专为GPU(图形处理器)提供的CUDA(计算统一设备架构),从新的编程角度出发,利用GPU多线程并行处理技术,将矩阵求逆过程中大量的数据实现并行运算,从而获得了较大的加速比。同时,根据程序的执行结果,分析了GPU的单精度与双精度的浮点运算能力及其优、劣势。最后,通过分析数据传输时间对GPU性能的影响,总结出适合GPU的算法特征。 展开更多
关键词 图形处理器(gpu) 计算统一设备架构(CUDA) cpu 并行运算 矩阵求逆
下载PDF
面向异构融合处理器的性能分析、优化及应用综述 被引量:10
3
作者 张峰 翟季冬 +2 位作者 陈政 林甲灶 杜小勇 《软件学报》 EI CSCD 北大核心 2020年第8期2603-2624,共22页
随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来... 随着异构计算技术的不断进步,CPU和GPU等设备相集成的异构融合处理器在近些年得到了充分的发展,并引起了学术界和工业界的关注.将多种设备进行集成带来了许多好处,例如,多种设备可以访问同样的内存,可以进行细粒度的交互.然而,这也带来了系统编程和优化方面的巨大挑战.充分发挥异构融合处理器的性能,需要充分利用集成体系结构中共享内存等特性;同时,还需结合具体应用特征对异构融合处理器上的不同设备进行优化.首先对目前涉及异构融合处理器的研究工作进行了分析,之后介绍了异构融合处理器的性能分析工作,并进一步介绍了相关优化技术,随后对异构融合处理器的应用进行了总结.最后,对异构融合处理器未来的研究方向进行展望,并进行了总结. 展开更多
关键词 cpu gpu 异构融合处理器 性能分析 性能优化
下载PDF
基于CPU/GPU处理器的雷达脉冲压缩算法并行机制研究 被引量:8
4
作者 彭培 张云雷 +1 位作者 李轲 席泽敏 《舰船电子工程》 2017年第10期30-32,107,共4页
为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算... 为实现软件化雷达在不同信号处理器上的实时信号处理,需要研究通用高性能处理器,如CPU和GPU信号处理算法的并行机制。论文以雷达脉冲压缩运算模块为例,重点研究了利用GPU信号处理的并行机制。首先给出雷达脉冲压缩数学模型,然后针对算法实现流程,分别从片上缓存、内核线程和数据并行等方面设计了三种GPU并行优化策略。仿真测试表明,所提出的GPU并行机制与典型多核CPU平台相比,具有更好的实时性能。 展开更多
关键词 cpu/gpu 并行机制 软件化雷达 脉冲压缩
下载PDF
基于CPU-GPU异构的电力系统静态电压稳定域边界并行计算方法 被引量:7
5
作者 李雪 张琳玮 +2 位作者 姜涛 陈厚合 李国庆 《电工技术学报》 EI CSCD 北大核心 2021年第19期4070-4084,共15页
为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的... 为提升区域互联电力系统静态电压稳定域边界(SVSRB)的构建效率,该文以直接法为基础,提出一种基于CPU-GPU异构的静态电压稳定域边界并行计算方法。该方法首先依据SVSRB拓扑特性,基于边界追踪算法实现直接法求解鞍结分岔(SNB)点时初值的高效选取,克服直接法对初值敏感这一瓶颈;然后结合CPU-GPU异构平台,将直接法求解SNB点计算量较大、计算耗时占比高的修正量求解部分由GPU完成,其他逻辑性强但计算量较低的部分由CPU完成,以实现SNB点的并行求解,降低直接法计算量大、计算复杂度高的不足,从而提升SVSRB的搜索效率;最后以WECC3机9节点测试系统,波兰电网2737节点和3120节点测试系统,欧洲电网7092节点、9241节点、11624节点和13659节点测试系统算例对该文所提方法进行了分析与验证,结果表明所提并行计算方法可实现电力系统静态电压稳定域边界的快速、准确搜索。 展开更多
关键词 静态电压稳定域边界 边界追踪法 直接法 鞍结分岔点 cpu-gpu 异构平台
下载PDF
基于GPU的无人机遥感影像快速拼接 被引量:7
6
作者 孙和利 彭政杰 +1 位作者 李娟 陈镇 《地理空间信息》 2017年第2期9-11,共3页
近年来,无人机遥感技术得到较快的发展,无人机遥感技术有着实时性强、灵活性强、低成本以及获取影像分辨率高的特点,在处理应急响应任务时,运用无人机遥感技术,优势极为明显。在无人机进行对地航拍时,所获取的是单张影像,由于像幅的限制... 近年来,无人机遥感技术得到较快的发展,无人机遥感技术有着实时性强、灵活性强、低成本以及获取影像分辨率高的特点,在处理应急响应任务时,运用无人机遥感技术,优势极为明显。在无人机进行对地航拍时,所获取的是单张影像,由于像幅的限制,影像并不能覆盖完整的目标区域,相邻的多张影像都有着一定的重叠度,利用重叠区域来将多幅影像依次拼接,获得目标区域的一幅完整影像。随着各种传感器技术的提升,无人机上的相机所获取到的影像的分辨率越来越高,这对影像拼接的速度提出了新的要求。基于无人机遥感影像的特点,采用SIFT算子对无人机遥感影像进行拼接工作,并在CUDA平台下对配准算法进行加速处理,从而提高影像拼接的速度。 展开更多
关键词 无人机遥感 影像拼接 cpu gpu CUDA 影像配准
下载PDF
CPU/GPU异构并行系统研究综述 被引量:6
7
作者 屈宜丽 蓝才会 任志国 《自动化与仪器仪表》 2016年第4期25-26,共2页
近年来,CPU/GPU异构并行系统凭借其强大的计算能力、高性价比和低功耗等优良特点,成为深受各大领域欢迎的新型高性能计算平台,但其复杂的体系结构也为并行计算的研究提出了巨大的挑战,成为一个热门的新兴研究领域。本综述从CPU/GPU异构... 近年来,CPU/GPU异构并行系统凭借其强大的计算能力、高性价比和低功耗等优良特点,成为深受各大领域欢迎的新型高性能计算平台,但其复杂的体系结构也为并行计算的研究提出了巨大的挑战,成为一个热门的新兴研究领域。本综述从CPU/GPU异构编程模型、存储模型、GPU集群、大数据环境下GPU系统的应用等几个方面对CPU/GPU异构并行系统的国内研究工作进行了回顾,并做了简要的分析,以期为初学者及其他研究者提供一定的参考。 展开更多
关键词 cpu/gpu 异构并行系统 gpu集群
原文传递
基于CPU/GPU异构模式的高光谱遥感影像数据处理研究与实现 被引量:6
8
作者 汤媛媛 周海芳 +1 位作者 方民权 申小龙 《计算机科学》 CSCD 北大核心 2016年第2期47-50,77,共5页
近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和... 近年来,基于GPU的新型异构高性能计算模式的蓬勃发展为众多领域应用提供了良好的发展机遇,国内外遥感专家开始引入高性能异构计算来解决高光谱遥感影像高维空间特点所带来的数据计算量大、实时处理难等问题。在此简要介绍了高光谱遥感和CPU/GPU异构计算模式,总结了近几年国内外基于CPU/GPU异构模式的高光谱遥感数据处理研究现状和问题;并面向共享存储型小型桌面超级计算机,基于CPU/GPU异构模式实现了高光谱遥感影像MNF降维的并行化,通过与串行程序和共享存储的OpenMP同构模式对比,验证了异构模式在高光谱遥感处理领域的发展潜力。 展开更多
关键词 高光谱遥感 cpu/gpu OPENMP MNF
下载PDF
Simulation of dynamic fluid-solid interactions with an improved direct-forcing immersed boundary method 被引量:6
9
作者 Shengbin Di Wei Ge 《Particuology》 SCIE EI CAS CSCD 2015年第1期22-34,共13页
Dynamic fluid-solid interactions are widely found in chemical engineering, such as in particle-laden flows, which usually contain complex moving boundaries. The immersed boundary method (IBM) is a convenient approac... Dynamic fluid-solid interactions are widely found in chemical engineering, such as in particle-laden flows, which usually contain complex moving boundaries. The immersed boundary method (IBM) is a convenient approach to handle fluid-solid interactions with complex geometries. In this work, Uhlmann's direct-forcing IBM is improved and implemented on a supercomputer with CPU-GPU hybrid architec- ture. The direct-forcing IBM is modified as follows: the Poisson's equation for pressure is solved before evaluation of the body force, and the force is only distributed to the Cartesian grids inside the immersed boundary. A multidirect forcing scheme is used to evaluate the body force. These modifications result in a divergence-free flow field in the fluid domain and the no-slip boundary condition at the immersed boundary simultaneously. This method is implemented in an explicit finite-difference fractional-step scheme, and validated by 2D simulations of lid-driven cavity flow, Couette flow between two concentric cylinders and flow over a circular cylinder. Finally, the method is used to simulate the sedimentation of two circular particles in a channel. The results agree very well with previous experimental and numerical data, and are more accurate than the conventional direct-forcing method, especially in the vicinity of a moving boundary. 展开更多
关键词 Immersed boundary method Fluid-solid interactions No-slip condition Divergence-free condition cpu-gpu hybrid architecture
原文传递
基于异构系统的多级并行稀疏张量向量乘算法 被引量:1
10
作者 陈玥丹 肖国庆 +3 位作者 阳王东 金纪勇 龙军 李肯立 《计算机学报》 EI CSCD 北大核心 2024年第2期441-455,共15页
张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,... 张量在许多实际应用中被用来表示大规模、多源、高维、多模态的数据.稀疏张量分解作为挖掘数据中隐藏信息的有效方法之一,已被广泛应用于机器学习、文本分析、生物医疗等研究领域中.稀疏张量向量乘(Sparse Tensor-VectorMultiplication,SpTV)是张量分解中最基础、耗时最多的运算之一.为加速大数据和人工智能相关应用的运行效率,本文提出了基于CPU-GPU异构结构的多级并行SpTV加速算法.首先,为了将SpTV运算映射到混合、多级并行的分布式CPU-GPU异构多/众核构架,本文设计了一种多维并行SpTV划分方法,采用面向节点级并行的N-1维张量划分和面向GPU线程级并行的矩阵划分,充分利用计算节点间和节点内的多级并行计算能力.其次,设计了一种基于稀疏张量纤维的压缩存储格式,压缩稀疏张量的内存占用,优化SpTV运算的计算和访存模式.最后,提出了基于多流并行的异构高效SpTV算法,进一步设计了稀疏张量的细粒度划分方法、多流并行运行机制和基于张量块排序的多流并行优化技术,实现了SpTV运算中通信开销和计算开销的相互重叠与隐藏.实验结果表明,与相关工作aeSpTV相比,所提出的SpTV算法在所有测试数据集上最高能够获得3.28倍的加速比. 展开更多
关键词 cpu-gpu 异构并行计算 多级并行 稀疏张量 张量运算
下载PDF
基于GPU的遥感图像前期处理算法研究与应用 被引量:5
11
作者 王化喆 魏先勇 《现代电子技术》 北大核心 2016年第3期47-50,54,共5页
针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可... 针对传统的遥感图像前期处理算法在面对海量地面数据时计算时间很难满足需求的问题,基于RPC模型的遥感成像几何校正算法的并行加速和基于SIFT特征提取的图像匹配技术的并行加速研究。针对几何校正的主要步骤及其速度瓶颈问题,提出了可采用的并行加速方法,同时结合SIFT的特点提出了并行优化加速的方案。采用基于数据划分的并行方法对遥感图像的几何校正和SIFT特征提取算法进行加速。最后利用CUDA环境,在CPU+GPU异构系统下,设计试验对两个算法优化并行提速,试验结果表明,提出的加速方案和优化算法能大幅提高遥感图像的前期处理效率。 展开更多
关键词 遥感图像 几何校正 SIFT特征提取 cpu+gpu 并行计算
下载PDF
基于负载均衡的CPU-GPU异构计算平台任务调度策略 被引量:5
12
作者 方娟 章佳兴 《北京工业大学学报》 CAS CSCD 北大核心 2020年第7期782-787,共6页
针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计... 针对中央处理单元-图形处理单元(central processing unit-graphics processing unit,CPU-GPU)异构计算系统中,CPU和GPU负载不均导致系统性能降低的问题,提出了一种基于队列的混合调度策略.该策略通过探测获得CPU和GPU处理指定任务的计算能力,将计算任务按照探测比例分配给CPU和GPU;将并行任务存入双向队列,以降低调度带来的额外开销.结果表明,使用该策略的基准测试程序系统性能平均提升了28.07%.总体而言,该调度策略能够缩短CPU与GPU完成各自计算任务后的等待时间,有效平衡系统CPU与GPU之间的负载,提升系统性能. 展开更多
关键词 中央处理单元-图形处理单元(central processing unit-graphics processing unit cpu-gpu) 异构计算 高性能计算 任务调度 负载均衡 负载感知
下载PDF
基于GPU/CPU和震源随机编码技术的混合域全波形反演 被引量:5
13
作者 冯海新 刘洪 +2 位作者 孙军 胡婷 刘志伟 《石油物探》 EI CSCD 北大核心 2017年第1期107-115,共9页
传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数... 传统的全波形反演利用普通炮集进行反演,反演计算量过大;且利用传统的相位编码技术进行全波形反演,会产生炮间串扰问题,因此,提出了基于GPU/CPU和震源随机编码技术的混合域全波形反演。该方法将参与反演的多个炮集随机组合并分成炮集数相同的组,各组炮集叠加形成多个组合炮集,然后将组合炮集代替普通炮集进行反演。与传统的相位编码反演方法相比,震源随机编码技术在反演效率和收敛速度方面均有优势,且减少了炮间串扰噪声;并且在GPU的加速下,计算效率会再次提升。Marmousi模型数据测试结果表明:组合炮集方法得到了与普通炮集方法相同的反演效果,但计算效率却比普通炮集方法明显提高,且相较于传统的相位编码技术,组合炮集方法有效抑制了串扰噪声。 展开更多
关键词 混合域 全波形反演 gpu/cpu 组合炮集 震源随机编码
下载PDF
深度学习在GPU上的计算优化 被引量:5
14
作者 李彦峰 《信息与电脑》 2018年第13期16-18,共3页
随着深度学习领域的飞速发展,如何缩短深度神经网络的训练时间成为了重要课题。笔者首先介绍了深度神经网络的特征,以卷积神经网络为例说明了提高运算速度的必要性。探究了CPU和GPU结构的不同并比较了它们训练神经网络模型的优劣。对于... 随着深度学习领域的飞速发展,如何缩短深度神经网络的训练时间成为了重要课题。笔者首先介绍了深度神经网络的特征,以卷积神经网络为例说明了提高运算速度的必要性。探究了CPU和GPU结构的不同并比较了它们训练神经网络模型的优劣。对于使用GPU来训练神经网络的情况给出了优化建议,并分别阐述单个GPU和多GPU并行。 展开更多
关键词 深度学习 gpu cpu 卷积神经网络 并行
下载PDF
异构集群中CPU与GPU协同调度算法的设计与实现 被引量:7
15
作者 高原 顾文杰 +3 位作者 丁雨恒 彭晖 陈泊宇 顾雯轩 《计算机工程与设计》 北大核心 2020年第2期592-600,F0003,共10页
为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异... 为有效提高异构的CPU/GPU集群计算性能,提出一种支持异构集群的CPU与GPU协同计算的两级动态调度算法。根据各节点计算能力评测结果和任务请求动态分发数据,在节点内CPU和GPU之间动态调度任务,使用数据缓存和数据处理双队列机制,提高异构集群的传输和处理效率。该算法实现了集群各节点“能者多劳”,避免了单节点性能瓶颈造成的任务长尾现象。实验结果表明,该算法较传统MPI/GPU并行计算性能提高了11倍。 展开更多
关键词 异构 集群 中央处理器 图形处理器 协同调度 算法
下载PDF
基于VMware技术的虚拟化办公系统研究及应用 被引量:4
16
作者 李硕 毛承国 +1 位作者 张进铎 张卫华 《计算机时代》 2014年第10期11-13,16,共4页
对于云计算时代用户随时随地接入办公的要求,桌面、应用、数据三大要素集中的桌面虚拟化办公解决方案应运而生。利用VMware桌面虚拟化技术,开发了虚拟化办公系统,将桌面虚拟化与客户端计算资源合理搭配,使所有数据和应用都集中在数据中... 对于云计算时代用户随时随地接入办公的要求,桌面、应用、数据三大要素集中的桌面虚拟化办公解决方案应运而生。利用VMware桌面虚拟化技术,开发了虚拟化办公系统,将桌面虚拟化与客户端计算资源合理搭配,使所有数据和应用都集中在数据中心的服务器上,保证数据、应用和客户端分离,从而极大地提升了数据的安全性、可管理性和可应用性,也显著降低了本单位IT运营的总体成本。 展开更多
关键词 云计算 虚拟化技术 VMWARE 虚拟化办公系统 cpu gpu
下载PDF
雷达回波模拟器的设计与实现
17
作者 李梦圆 开根深 杨刚 《火控雷达技术》 2024年第3期145-152,共8页
性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本... 性能测试和算法验证是雷达信号处理分系统评估过程中必不可少的环节,为了获得精确的评估结果,通常需要回波模拟来验证雷达信号处理算法的有效性和稳定性。传统雷达回波模拟器大都基于DSP+FPGA的架构,其成本较高且升级维护比较困难。本文通过对数字相控阵雷达建模,基于CPU+GPU平台设计了一种雷达回波模拟器,解决了传统模拟器难以升级维护的问题。在实验室内与雷达波控、信号处理、预处理、数据处理以及终端搭建起一套完整的仿真验证系统,经系统联调验证,该模拟器可以模拟雷达多种工作模式。 展开更多
关键词 回波模拟器 干扰 杂波 cpu+gpu
下载PDF
基于CPU与GPU/CUDA的数字图像处理程序的性能比较 被引量:4
18
作者 岳俊 邹进贵 何豫航 《地理空间信息》 2012年第4期45-47,180,共3页
测绘系统通常有大量图像处理工作,而户外图像采集系统更需要极高的实时性。通过对GPU与CPU分别进行数字图像处理性能测试,结果表明GPU并行计算可以大幅提高图像处理性能:可优化图像预处理、后处理速度,使测绘系统更加实时高效。
关键词 cpu gpu CUDA 并行计算 数字图像处理
下载PDF
面向新型处理器的数据密集型计算 被引量:4
19
作者 王鹤澎 王宏志 +3 位作者 李佳宁 孔欣欣 李建中 高宏 《软件学报》 EI CSCD 北大核心 2016年第8期2048-2067,共20页
近年来,随着数据量的不断增大,数据密集型计算任务变得日益繁重.如何能够快速、高效地实现在大规模数据集上的计算,已成为数据密集型计算的主要研究方向.最近几年,研究人员利用新型的硬件处理器对数据密集型计算进行加速处理,并针对不... 近年来,随着数据量的不断增大,数据密集型计算任务变得日益繁重.如何能够快速、高效地实现在大规模数据集上的计算,已成为数据密集型计算的主要研究方向.最近几年,研究人员利用新型的硬件处理器对数据密集型计算进行加速处理,并针对不同新型处理器的特点,设计了不同形式的加速处理算法.主要对新型硬件处理器基于数据密集型计算的研究进行了综述.首先概述了新型硬件处理器的特点;然后,分别对新型处理器FPGA和GPU等硬件进行性能分析,并分析了每种处理器对数据密集型计算的效果;最后提出了进一步的研究方向. 展开更多
关键词 FPGA gpu cpu 数据密集型计算
下载PDF
基于CPU+GPU混合架构的雷达信号处理方法
20
作者 常艳 何涛 朱占宇 《火力与指挥控制》 CSCD 北大核心 2024年第7期80-85,90,共7页
针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积... 针对雷达系统复杂化趋势,提出了基于CPU+GPU混合架构的信号处理方法。依据运算复杂度进行任务的细粒度划分,将复杂处理任务解耦为逻辑处理和运算处理两部分,并映射到CPU+GPU核心进行处理。根据雷达信号处理的拆解包、脉冲压缩、相参积累、目标检测、目标检测后处理及解模糊过程,将对应处理映射到CPU+GPU核心以提高加速比。实验结果表明,相比多核DSP信号处理方法,该方法具有更好的性能。 展开更多
关键词 cpu+gpu 混合架构 信号处理 多核DSP
下载PDF
上一页 1 2 18 下一页 到第
使用帮助 返回顶部