期刊文献+
共找到38篇文章
< 1 2 >
每页显示 20 50 100
地球物理高性能计算的新选择:GPU计算技术 被引量:23
1
作者 赵改善 《勘探地球物理进展》 2007年第5期399-404,共6页
随着地球物理对高性能计算需求的不断提升,集群系统节点规模不断提高,一方面大大提高了系统建设、运行、维护、管理及应用软件开发的复杂性,另一方面在提高系统总体性能方面也受到越来越大的制约。随着微电子技术的发展,GPU计算技术与... 随着地球物理对高性能计算需求的不断提升,集群系统节点规模不断提高,一方面大大提高了系统建设、运行、维护、管理及应用软件开发的复杂性,另一方面在提高系统总体性能方面也受到越来越大的制约。随着微电子技术的发展,GPU计算技术与可重构计算技术,将有可能替代集群计算技术成为高性能计算的主流技术。充分利用GPU并行处理能力,可以将GPU作为计算加速器为基于CPU的通用计算平台提供高性能的科学计算能力补充,这样可以在现有通用计算平台的基础上实现高性价比的高性能计算解决方案。GPU计算平台上的应用软件开发比可重构计算平台上的应用软件开发要容易得多,这一点使得GPU计算技术可以更早地广泛应用于地球物理领域。GPU计算产品已达到很高的性能,相应的软件开发环境也已推出,对于GPU计算平台应用软件开发技术的研究将使得GPU计算技术在不远的将来广泛地应用于地球物理计算中。 展开更多
关键词 GPU计算 高性能计算 地球物理 cuda 流编程模式
下载PDF
基于SMP集群的MPI+CUDA模型的研究与实现 被引量:10
2
作者 许彦芹 陈庆奎 《计算机工程与设计》 CSCD 北大核心 2010年第15期3408-3412,共5页
为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式。利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩... 为了研究GPU的通用计算能力和适合SMP集群的编程模型,首次提出MPI+CUDA多粒度混合并行编程的新方法,节点间采用MPI实现粗粒度并行,节点内采用CUDA实现细粒度并行的混合编程方式。利用此方法在搭建的3节点SMP集群环境中,测试了大规模矩阵乘问题的并行计算能力。实验结果表明,该方法能够显著提升并行效率,同时证明MPI+CUDA混合编程模型能够充分发挥SMP集群节点间分布式存储和节点内共享内存的优势,为装有CUDA-enabled GPU的SMP集群提供了一种有效的并行策略。 展开更多
关键词 消息传递接口 统一计算设备架构 集群 混合编程 支持cuda的GPU
下载PDF
CUDA并行技术与数字图像几何变换 被引量:10
3
作者 覃方涛 房斌 《计算机系统应用》 2010年第10期168-172,116,共6页
CUDA是GPU通过并发执行多个线程以实现大规模快速并行计算能力的技术,它能使对GPU编程变得更容易。介绍了CUDA基本特性及主要编程模型,在此基础上,提出并实现了基于NVIDIA CUDA技术的图像快速几何变换。采用位置偏移增量代替原变换算法... CUDA是GPU通过并发执行多个线程以实现大规模快速并行计算能力的技术,它能使对GPU编程变得更容易。介绍了CUDA基本特性及主要编程模型,在此基础上,提出并实现了基于NVIDIA CUDA技术的图像快速几何变换。采用位置偏移增量代替原变换算法中大量乘法运算,并把CUDA技术的快速并行计算能力应用到数字图像几何变换中,解决了基于CPU的传统图像几何变换运算效率低下的问题。实验结果证明使用CUDA技术,随着处理图像尺寸的增加,对数字图像几何变换处理效率最高能够提高到近100倍。 展开更多
关键词 cuda 并行化 数字图像 GPU编程 位置偏移增量
下载PDF
GPU并行计算编程技术介绍 被引量:8
4
作者 王泽寰 王鹏 《科研信息化技术与应用》 2013年第1期81-87,共7页
近年来GPU通用计算蓬勃发展。程序开发者和GPU通用计算应用程序的数量增长很快。针对不同的应用程序的要求和程序开发者不同的使用习惯,围绕着CUDA架构的GPU,NVIDIA及其合作伙伴共同开发了很多种不同的编程技术。本文详细介绍了它们的... 近年来GPU通用计算蓬勃发展。程序开发者和GPU通用计算应用程序的数量增长很快。针对不同的应用程序的要求和程序开发者不同的使用习惯,围绕着CUDA架构的GPU,NVIDIA及其合作伙伴共同开发了很多种不同的编程技术。本文详细介绍了它们的特点和适用对象。希望可以帮助广大开发人员针对自己的编程习惯和程序要求选择最为合适的编程技术。 展开更多
关键词 GPU高性能计算 cuda 编程技术
原文传递
一种高图像质量的虚拟视点绘制方法及GPU加速 被引量:6
5
作者 陈璐瑶 陈思洁 +1 位作者 岑宽 朱威 《小型微型计算机系统》 CSCD 北大核心 2020年第10期2212-2218,共7页
自由视点视频允许用户自由选择观看视角,给人带来传统视频无法比拟的交互式视觉体验.本文针对自由视点视频实时显示应用,提出了一种高图像质量的虚拟视点绘制方法,并对其进行GPU加速.首先,将参考视点深度图向前映射得到虚拟视点深度图,... 自由视点视频允许用户自由选择观看视角,给人带来传统视频无法比拟的交互式视觉体验.本文针对自由视点视频实时显示应用,提出了一种高图像质量的虚拟视点绘制方法,并对其进行GPU加速.首先,将参考视点深度图向前映射得到虚拟视点深度图,再对该深度图进行中值滤波以减少小空洞;然后对滤波后的深度图进行反向映射得到初始的虚拟视点彩色图像;接着对空洞掩模图进行基于边界检测的膨胀处理,以消除虚假边缘,并融合经过亮度校正后的两幅虚拟视点图像,以填充大空洞;最后采用考虑深度的插值方法填补剩余的空洞,提升虚拟视点的图像质量.此外,本文进一步采用CUDA编程技术,将虚拟视点绘制的主要计算都放在GPU内进行,减少CPU和GPU之间的数据拷贝,并在每个计算环节为每个像素单独分配线程,实现像素级的并行处理.实验结果表明,本文方法的主客观图像质量优于现有方法,并且经过GPU加速之后,运行速度达到实时处理的要求. 展开更多
关键词 自由视点视频 虚拟视点绘制 cuda编程 GPU加速
下载PDF
一种跨平台的并行编程框架设计与实现 被引量:1
6
作者 李婷 徐云 +1 位作者 聂鹏宇 潘玮华 《计算机工程》 CAS CSCD 2014年第8期43-47,共5页
并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数... 并行程序设计的复杂性及并行计算平台的多样性导致程序可移植性较差。为此,设计并实现一种跨平台、分层次的并行编程框架OpenCH。该框架通过两层并行函数库和层次化的API设计,对上层应用程序隐藏并行化细节,为基于不同计算平台的库函数设计了统一的函数接口,使底层平台的变化对上层应用程序透明。根据底层函数库的开发,给出一种填充式的编程方法和任务调度系统。将OpenCH应用于遥感影像分类,实验结果证明,基于该框架开发的并行程序可运行于多种并行计算平台,并具有较高的并行加速比,编程框架本身造成的时间开销低于15%。 展开更多
关键词 并行计算 并行编程框架 跨平台 OpenMP编程 MPI编程 cuda编程
下载PDF
基于Matlab平台有限元方法的GPU加速 被引量:3
7
作者 苏辉 邱夏青 马文鹏 《信阳师范学院学报(自然科学版)》 CAS 北大核心 2018年第4期677-680,共4页
基于Matlab平台,采用有限元方法实现了对二维拉普拉斯(Laplace)方程在GPU平台上的加速.通过对物理问题的分析与物理模型的构建,完成总体CSR格式存储的刚度矩阵的生成;使用Matlab和CUDA混合编程,在Matlab平台上实现该有限元问题的并行加... 基于Matlab平台,采用有限元方法实现了对二维拉普拉斯(Laplace)方程在GPU平台上的加速.通过对物理问题的分析与物理模型的构建,完成总体CSR格式存储的刚度矩阵的生成;使用Matlab和CUDA混合编程,在Matlab平台上实现该有限元问题的并行加速;并结合Cu Blas数值计算库采用PCG算法求解装配后的大型线性稀疏方程组,从而高效地迭代出各格点的速度势.该算法既充分发挥了Matlab在数值计算方面的高效性,又充分发挥了GPU在细粒度并行加速方面的优势. 展开更多
关键词 cuda程序设计 有限元方法 GPU 预处理共轭梯度算法
下载PDF
基于CUDA的梯级泵站调度算法实现 被引量:3
8
作者 项武铭 李雪巍 《计算机与现代化》 2018年第11期60-64,共5页
动态规划方法求解梯级泵站调度问题十分经典,但在计算上存在"维数灾难"问题,GPU并行计算技术能对重复性计算进行加速,提高算法计算性能。本文对梯级泵站调度问题进行动态规划方法分析,利用CUDA(统一计算设备架构)对调度算法... 动态规划方法求解梯级泵站调度问题十分经典,但在计算上存在"维数灾难"问题,GPU并行计算技术能对重复性计算进行加速,提高算法计算性能。本文对梯级泵站调度问题进行动态规划方法分析,利用CUDA(统一计算设备架构)对调度算法进行改进,给出改进动态规划方法的算法实现,并比较不同计算规模下调度算法计算耗时。实验结果表明,基于CUDA改进动态规划方法实现的梯级泵站调度算法能够降低计算维度,在计算规模较大时,加速效果较好。 展开更多
关键词 梯级泵站调度 动态规划 并行计算 cuda
下载PDF
一种基于CUDA的并行多目标进化算法 被引量:3
9
作者 胡宾宾 祁荣宾 钱锋 《计算机与应用化学》 CAS 2015年第1期1-8,共8页
传统的多目标进化算法多是基于Pareto最优概念的类随机搜索算法,求解速度较慢,特别是当问题维度变高,需要群体规模较大时,上述问题更加凸显。这一问题已经获得越来越多研究人员以及从业人员的关注。实验仿真中可以发现,构造非支配集和... 传统的多目标进化算法多是基于Pareto最优概念的类随机搜索算法,求解速度较慢,特别是当问题维度变高,需要群体规模较大时,上述问题更加凸显。这一问题已经获得越来越多研究人员以及从业人员的关注。实验仿真中可以发现,构造非支配集和保持群体多样性这两部分工作占用了算法99%以上的执行时间。解决上述问题的一个有效方法就是对这一部分算法进行并行化改造。本文提出了一种基于CUDA平台的并行化解决方案,采用小生境技术实现共享适应度来维持候选解集的多样性,将多目标进化算法的实现全部置于GPU端,区别于以往研究中非支配排序的部分工作以及群体多样性保持的全部工作仍在CPU上执行。通过对ZDT系列函数的仿真结果,可以看出本文算法性能远远优于NSGA-Ⅱ和NPGA。最后通过求解油品调和过程这一有约束多目标优化问题,可以看出在解决化工应用中的有约束多目标优化问题时,该算法依然表现出优异的加速效果。 展开更多
关键词 多目标 进化算法 cuda GPU 并行计算
原文传递
基于CPU-GPU异构混合编程的遥感数据时空融合 被引量:2
10
作者 陈凯 曹云刚 +2 位作者 杨秀春 潘梦 张敏 《地理信息世界》 2019年第6期6-13,共8页
现有的遥感数据时空融合算法复杂,计算时间长,获取海量时序的高时空分辨率遥感影像非常困难。因此,通过分析GPU并行运算模式与遥感数据时空融合算法的实现步骤,合理地设计了一种基于CPU-GPU异构混合编程的遥感数据时空融合并行处理算法... 现有的遥感数据时空融合算法复杂,计算时间长,获取海量时序的高时空分辨率遥感影像非常困难。因此,通过分析GPU并行运算模式与遥感数据时空融合算法的实现步骤,合理地设计了一种基于CPU-GPU异构混合编程的遥感数据时空融合并行处理算法流程,将融合算法中的数据密集型计算部分由CPU移植到GPU中执行。遥感数据时空融合算法种类繁多,不同算法的可并行程度与算法复杂度有着很大的差异,选取3种不同类型的遥感数据时空融合算法STDFA、STARFM、CDSTARFM进行GPU并行设计,并使用CUDA架构实现。实验结果表明,基于CPU-GPU异构混合编程技术可大幅度缩减遥感数据时空融合时间,提升计算效率,最高加速比可达到195.6,从而可为海量时空遥感数据的深度应用提供技术支撑。 展开更多
关键词 遥感数据时空融合 GPU cuda 混合编程 并行计算
下载PDF
基于GPU的图像增强实验设计与实现 被引量:2
11
作者 傅志中 赵宇飞 徐进 《实验技术与管理》 CAS 北大核心 2017年第5期37-40,94,共5页
图像增强旨在改善和提高图像的显示质量,通过梯度进行增强是一种十分有效的方法。图形计算单元(GPU)因为其较高并行性和其特殊的结构特性,正被广泛地应用在算法加速和科学计算领域。为了提高学生对图像增强原理的理解,以及使学生掌握利... 图像增强旨在改善和提高图像的显示质量,通过梯度进行增强是一种十分有效的方法。图形计算单元(GPU)因为其较高并行性和其特殊的结构特性,正被广泛地应用在算法加速和科学计算领域。为了提高学生对图像增强原理的理解,以及使学生掌握利用GPU进行算法实现的原理与过程,设计了基于GPU的图像增强实验。 展开更多
关键词 图像增强 梯度场 图形计算单元 cuda编程 实验设计
下载PDF
基于CUDA技术的离散小波变换算法研究与实现 被引量:2
12
作者 张金霜 《现代信息科技》 2020年第17期72-75,78,共5页
针对离散小波变换过程比较耗时、不利于实际工程应用的问题,提出利用基于GPU平台的CUDA技术对小波变换算法做并行化改造,从而提高算法执行效率。该文分析了小波Mallat算法并行化的可行性,并详细介绍了算法的改造过程。实验表明,基于GPU/... 针对离散小波变换过程比较耗时、不利于实际工程应用的问题,提出利用基于GPU平台的CUDA技术对小波变换算法做并行化改造,从而提高算法执行效率。该文分析了小波Mallat算法并行化的可行性,并详细介绍了算法的改造过程。实验表明,基于GPU/CUDA技术的并行小波Mallat算法,相较于串行小波变换算法,执行速度最高提升了50余倍,且算法效率与计算量成正向关系。 展开更多
关键词 cuda 并行程序设计 离散小波变换 图像压缩
下载PDF
基于GPU的局部指纹频谱特性估计的实现 被引量:1
13
作者 南余荣 王福良 《浙江工业大学学报》 CAS 北大核心 2018年第5期492-495,共4页
针对已知指纹图像增强系统中指纹局部频谱特性估计的计算负荷大,基于CPU实现后执行时间较长的问题,提出了一种基于GPU的CUDA并行实现方法来提高运算速度.利用不同CUDA线程块来并行处理不同的局部指纹图像,同时线程块中的多线程对相应局... 针对已知指纹图像增强系统中指纹局部频谱特性估计的计算负荷大,基于CPU实现后执行时间较长的问题,提出了一种基于GPU的CUDA并行实现方法来提高运算速度.利用不同CUDA线程块来并行处理不同的局部指纹图像,同时线程块中的多线程对相应局部指纹的频谱特性估计进行并行优化,从而完成整个指纹图像的局部频谱特性估计的优化.通过对FVC2000数据库中大量的指纹图像进行测试,得到相应的执行时间并与其基于CPU实现的执行时间相比较.结果显示:通过该基于GPU的CUDA并行实现方法,局部指纹频谱特性估计的执行时间显著减少,从而可以提高已知指纹图像增强系统的运算速度. 展开更多
关键词 指纹 图像增强 cuda编程 GPU 并行运算
下载PDF
Real-time stereo matching on CUDA using Fourier descriptors and dynamic programming 被引量:1
14
作者 Mohamed Hallek Fethi Smach Mohamed Atri 《Computational Visual Media》 CSCD 2019年第1期59-71,共13页
Computation of stereoscopic depth and disparity map extraction are dynamic research topics.A large variety of algorithms has been developed,among which we cite feature matching, moment extraction, and image representa... Computation of stereoscopic depth and disparity map extraction are dynamic research topics.A large variety of algorithms has been developed,among which we cite feature matching, moment extraction, and image representation using descriptors to determine a disparity map. This paper proposes a new method for stereo matching based on Fourier descriptors. The robustness of these descriptors under photometric and geometric transformations provides a better representation of a template or a local region in the image. In our work, we specifically use generalized Fourier descriptors to compute a robust cost function.Then, a box filter is applied for cost aggregation to enforce a smoothness constraint between neighboring pixels. Optimization and disparity calculation are done using dynamic programming, with a cost based on similarity between generalized Fourier descriptors using Euclidean distance. This local cost function is used to optimize correspondences. Our stereo matching algorithm is evaluated using the Middlebury stereo benchmark; our approach has been implemented on parallel high-performance graphics hardware using CUDA to accelerate our algorithm, giving a real-time implementation. 展开更多
关键词 generalized FOURIER DESCRIPTORS STEREO matching dynamic programming cuda
原文传递
利用GPU技术使去噪方法并行化 被引量:1
15
作者 林茂 董玉敏 +2 位作者 蒋立 许涛 刘新军 《计算机与应用化学》 CAS CSCD 北大核心 2012年第11期1379-1383,共5页
野外采集的地震勘探原始记录中通常包含多种噪声。噪声的存在降低了地震资料的信噪比,影响地震资料处理成果品质,因此,去噪方法研究和应用是处理工作的重要环节之一。"加权中值滤波自动检测并压制强能量干扰方法"是一种在准... 野外采集的地震勘探原始记录中通常包含多种噪声。噪声的存在降低了地震资料的信噪比,影响地震资料处理成果品质,因此,去噪方法研究和应用是处理工作的重要环节之一。"加权中值滤波自动检测并压制强能量干扰方法"是一种在准噶尔盆地油气勘探中非常有效的噪声压制方法。该方法在地震数据原始记录频率域剖面上采用加权中值滤波的方法自动检测可能存在的强能量干扰,并针对性地对相应频段上的噪声信号进行压制,去噪效果较为理想。但该方法的算法运行过程中涉及大量的数据计算,开发的程序需要花费大量时间才能完成一次去噪过程。提高计算效率成为该噪声压制方法推广应用的关键。高质量图像处理用途的高端图形处理器(GPU)在大规模高带宽计算方面表现出色,近年来更多地应用于高性能计算工作。CUDA并行计算开发平台帮助应用人员开发高效率计算程序,使GPU能更容易应用于高性能计算。通过分析"加权中值滤波自动检测并压制强能量干扰方法"算法实现方式,发现该算法适宜利用GPU进行并行化改造。利用CUDA并行编程技术将该算法中部分串行执行的数据计算过程改造成适合GPU计算的并行计算过程,使整个去噪方法工作效率提升3倍。GPU并行计算技术能使油气勘探数据处理过程中类似应用有效并行化,利用较小成本实现高效计算效率。 展开更多
关键词 并行编程 cuda(Compute UNIFIED Device Architecture) 加权中值 强能量干扰 噪声压制
原文传递
三维医学图像核回归算法的GPU加速研究 被引量:1
16
作者 王玉琨 刘蓉 +1 位作者 温铁祥 李凌 《中国医学物理学杂志》 CSCD 2018年第12期1417-1425,共9页
核回归理论被广泛应用于医学图像处理和医学图像重建领域,并取得了十分显著的效果。它包括传统核回归方法(CKR)和控制核回归方法(SKR)。三维SKR算法比三维CKR算法具有更优的去噪效果和边缘保持效果,但三维SKR算法的计算量过于庞大且复杂... 核回归理论被广泛应用于医学图像处理和医学图像重建领域,并取得了十分显著的效果。它包括传统核回归方法(CKR)和控制核回归方法(SKR)。三维SKR算法比三维CKR算法具有更优的去噪效果和边缘保持效果,但三维SKR算法的计算量过于庞大且复杂,使其应用领域受到限制。目前,医学图像重建使用的是基于GPU的三维CKR算法,所以基于GPU的三维SKR算法的实现是一项有研究价值且具有挑战性的工作。本文首先优化三维SKR算法的计算过程,然后利用GPU进行CUDA编程实现三维SKR并行加速算法。实验表明,基于GPU的三维SKR算法与基于CPU单线程三维SKR算法相比能获得约244.9~246.3倍的加速比,与基于CPU多线程三维SKR算法相比能获得约123.0~137.4倍的加速比。 展开更多
关键词 GPU加速 cuda编程 三维传统核回归方法 三维控制核回归方法
下载PDF
GPU计算在油气勘探中应用前景 被引量:1
17
作者 林茂 塔依尔 +2 位作者 邹杰 景少军 关宇 《计算机系统应用》 2013年第3期6-10,共5页
油气勘探数据处理工作涉及大量计算,需要高性能计算技术的扶助,目前流行的PC集群在处理工作中存在一些问题,GPU作为一种辅助计算设备能够配合CPU完成一些密集计算的工作.作为一种新兴的高性能计算技术,GPU编程技术的特点使其更适合于中... 油气勘探数据处理工作涉及大量计算,需要高性能计算技术的扶助,目前流行的PC集群在处理工作中存在一些问题,GPU作为一种辅助计算设备能够配合CPU完成一些密集计算的工作.作为一种新兴的高性能计算技术,GPU编程技术的特点使其更适合于中小规模密集型计算环境,因此需要计算机人员在引进该技术时谨慎考虑配置模式,以GPU/CPU协同工作模式有效提升处理系统计算效率. 展开更多
关键词 GPU cuda 油气勘探数据处理 高性能计算 并行编程
下载PDF
基于不规则性的并行计算方法 被引量:1
18
作者 杨鑫 许端清 杨冰 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第11期2057-2064,共8页
为了有效使用异构多核架构强大的并行计算能力,根据硬件架构的特点重新组织数据并合理调度任务的执行是非常有必要的.提出一个基于不规则性的并行计算方法,是一个融合数据并行、任务并行、管道并行的多重并行计算方法,特别适合具有动态... 为了有效使用异构多核架构强大的并行计算能力,根据硬件架构的特点重新组织数据并合理调度任务的执行是非常有必要的.提出一个基于不规则性的并行计算方法,是一个融合数据并行、任务并行、管道并行的多重并行计算方法,特别适合具有动态特征执行行为和不规则数据结构的复杂算法,能够在程序运行时根据存储局部性原则和单指令多数据流(SIMD)操作机制对任务执行进行基于优先级的动态调度和数据管理,能够最大限度地有效使用CPU和GPU的硬件计算资源和存储资源.实验结果表明,该方法能够提高图形并行绘制算法关于动态执行过程和不规则数据结构构造和维护的性能. 展开更多
关键词 编程模型 不规则性 并行 cuda
下载PDF
基于GPU的受限玻尔兹曼机并行加速 被引量:1
19
作者 张立民 刘凯 范晓磊 《电子设计工程》 2016年第2期28-31,34,共5页
为针对受限玻尔兹曼机处理大数据时存在的训练缓慢、难以得到模型最优的问题,提出了基于GPU的RBM模型训练并行加速方法。首先重新规划了对比散度算法在GPU的实现步骤;其次结合以往GPU并行方案,提出采用CUBLAS执行训练的矩阵乘加运算,设... 为针对受限玻尔兹曼机处理大数据时存在的训练缓慢、难以得到模型最优的问题,提出了基于GPU的RBM模型训练并行加速方法。首先重新规划了对比散度算法在GPU的实现步骤;其次结合以往GPU并行方案,提出采用CUBLAS执行训练的矩阵乘加运算,设计周期更长、代码更为简洁的Tausworthe113和CLCG4的组合随机数生成器,利用CUDA拾取纹理内存的读取模式实现了Sigmoid函数值计算;最后对训练时间和效果进行检验。通过MNIST手写数字识别集实验证明,相较于以往RBM并行代码,新设计的GPU并行方案在处理大规模数据集训练上优势较为明显,加速比达到25以上。 展开更多
关键词 受限玻尔兹曼机 GPU cuda 加速比 并行加速
下载PDF
C语言教学实验中的CUDA技术
20
作者 刘忆宁 张永昌 罗家华 《电脑编程技巧与维护》 2010年第10期134-137,共4页
C语言在本科信息技术教学中具有重要的地位,随着GPU性能的增强,以C语言为核心的CUDA具有广阔的应用前景。在C语言实验中引入CUDA开发平台的训练,具有重要的意义。
关键词 C程序 图形处理器 cuda架构
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部