期刊文献+
共找到11篇文章
< 1 >
每页显示 20 50 100
基于GPU的并行协同差分进化算法研究 被引量:5
1
作者 刘剑英 《计算机工程与应用》 CSCD 2012年第7期48-50,123,共4页
针对大规模高维数复杂非线性函数优化的问题,提出一种新的基于GPU的协同差分进化算法。该方法将协同进化的思想引入启发式差分进化算法,随机分解大规模计算问题,利用GPU处理数据的并行性,同步计算分解后的子问题,加快算法的精度和收敛... 针对大规模高维数复杂非线性函数优化的问题,提出一种新的基于GPU的协同差分进化算法。该方法将协同进化的思想引入启发式差分进化算法,随机分解大规模计算问题,利用GPU处理数据的并行性,同步计算分解后的子问题,加快算法的精度和收敛速度。实验对比结果表明,所提出的基于GPU的协同差分进化算法对大规模非线性函数优化具有更高的精度和效率。 展开更多
关键词 并行计算 协同进化 差分进化 图形图像处理单元
下载PDF
基于GPU的地下管线三维可视化建模研究 被引量:4
2
作者 刘浩 赵文吉 +2 位作者 段福洲 曹巍 潘李亮 《计算机工程与应用》 CSCD 2013年第18期145-148,共4页
地下管线的三维建模与可视化是构建"数字城市"的重要内容,总结现有地下管线实时建模算法的不足,提出一种利用GPU编程实现的地下管线实时三维可视化建模算法。利用现代GPU的可编程特性将管线建模的计算任务全部移植到GPU端完成... 地下管线的三维建模与可视化是构建"数字城市"的重要内容,总结现有地下管线实时建模算法的不足,提出一种利用GPU编程实现的地下管线实时三维可视化建模算法。利用现代GPU的可编程特性将管线建模的计算任务全部移植到GPU端完成,CPU端只需传入管径和管线节点坐标,利用GPU提供的几何着色器完成管线模型的顶点坐标计算、管线顶点数据自动生成及管线三角网构建等工作,并通过光照和纹理映射实现管线材质的真实感效果。实验结果表明,该算法克服了现有建模算法的缺陷,能够在保证管线拟合逼真度的基础上完成大规模管网系统三维实时可视化建模的任务。 展开更多
关键词 地下管线 三维建模 图形处理器(GPU) 几何着色器
下载PDF
基于CUDA的2D-3D配准技术的研究 被引量:4
3
作者 徐建 秦安 +1 位作者 卜祥磊 冯前进 《计算机工程与应用》 CSCD 北大核心 2010年第11期56-59,共4页
Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中... Nvidia从GeForce8系列开始,在显卡上推出统一计算设备框架技术,使GPU的通用计算(GPGPU)从图形硬件流水线和高级绘制语言中解放出来,开发人员无须掌握图形学编程方法即可在单任务多数据模式(SIMD)下完成高性能并行计算。在医学图像分析中,图像配准通常是一个耗时的过程,不利于临床应用,为了加速医学图像的2D-3D配准过程,研究了CUDA的设计思想和编程方式,提出了一种基于CUDA并行编程模型的加速配准新技术,在构建的虚拟X线摄像系统下,采用并行计算的方式快速生成高质量DRR图像,以对应像素的灰度值残差作为相似性测度,使用Powell优化方法寻找最优变换。实验结果表明,该技术既很好地保持了配准精度,同时又大大提高了配准速度,加速比达到了十几甚至几十倍。 展开更多
关键词 医学图像 2D-3D图像配准 数字影像重建 图形处理器 统一计算设备架构 虚拟X线摄像系统
下载PDF
基于GPU的动态地形实时可视化 被引量:3
4
作者 王冬 张豫南 +1 位作者 李瀚飞 田鹏 《计算机工程与应用》 CSCD 北大核心 2010年第14期173-175,共3页
针对动态地形中车辙实时可视化的要求,利用OpenGL帧缓冲区对象(framebuffer object)和顶点纹理拾取(vertex texture fetch)功能,提出了一种基于GPU的动态地形可视化算法。首先利用高程图(heightmap)直接产生初始的地形深度纹理,然后通... 针对动态地形中车辙实时可视化的要求,利用OpenGL帧缓冲区对象(framebuffer object)和顶点纹理拾取(vertex texture fetch)功能,提出了一种基于GPU的动态地形可视化算法。首先利用高程图(heightmap)直接产生初始的地形深度纹理,然后通过配置渲染状态生成车辆深度纹理,接着生成表示地表顶点下陷位移的地形深度偏移纹理,最后利用顶点纹理拾取实现了连续更新的车辙效果。给出了完整的动态地形可视化算法,最后通过实验证明该方法是可行的、有效的。 展开更多
关键词 动态地形 图形处理器 顶点纹理拾取 帧缓冲区对象
下载PDF
GPU加速希尔加解密方法的研究 被引量:3
5
作者 刘丹 赵广辉 钟珞 《计算机工程与应用》 CSCD 北大核心 2010年第18期49-51,共3页
GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析... GPU有效地利用了数量巨大的晶体管制造大量的处理单元,适用于处理单任务多数据(SIMD)的计算任务。研究了GPU的体系结构及CUDA的编程模式,改进了基于CPU的希尔加解密方法,使用多个线程将计算中耗时的矩阵相乘部分改造成SIMD模式,并分析了线程块内线程数对加速比的影响。实验结果表明,基于GPU的并行矩阵相乘的希尔加解密方法成功实现了硬件加速,相对于CPU上运行的希尔加解密方法,其执行效率明显提高,可获取12倍以上的加速,并易于扩展,对大规模数据加密和解密处理呈现出高效的处理能力。 展开更多
关键词 统一计算设备架构 图形处理单元 希尔加密 希尔解密
下载PDF
gAC:基于GPU的高性能AC算法 被引量:2
6
作者 陈虎 彭江锋 施少怀 《计算机工程与应用》 CSCD 2012年第12期43-48,共6页
字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经... 字符串匹配是计算科学中研究最广泛的问题之一,已成为信息检索和生物计算等领域的核心操作。然而受限于CPU的计算能力和存储器访问带宽,传统的串行字符串匹配算法难以进一步提升性能。GPU在计算能力和存储器访问带宽上有很大提升,已经在很多应用上取得了卓越成效。gAC作为一种基于GPU的并行AC算法,针对GPU的SIMT(Single-Instruction Multiple-Thread)以及合并存储器访问的技术特点,采取了减少条件分支、合并访问全局存储器等优化方法,使得在C1060GPU上的字符串扫描速度达到51Gb/s,比基于CPU的串行算法提升了28倍。 展开更多
关键词 图形处理器(GPU) 计算统一设备框架(CUDA) 多字符串匹配 并行计算 AC算法
下载PDF
一种云场景的实时渲染方法 被引量:2
7
作者 葛亮 姜晓峰 倪小军 《计算机工程与应用》 CSCD 北大核心 2011年第11期167-170,共4页
探讨了真实感云场景的模拟技术,设计了一种云场景的实时渲染方法。基于Perlin噪声建模生成云浓度图,并采用考虑浓度的Phong光照模型与单向散射光照模型,分别计算反射光和透射光,改善了传统方法无法真实反映不同角度太阳光照的问题,实现... 探讨了真实感云场景的模拟技术,设计了一种云场景的实时渲染方法。基于Perlin噪声建模生成云浓度图,并采用考虑浓度的Phong光照模型与单向散射光照模型,分别计算反射光和透射光,改善了传统方法无法真实反映不同角度太阳光照的问题,实现了不同时段动态云场景的绘制。通过引入基于GPU的Bumping纹理算法与Render-to-Texture技术,极大提高了云场景的渲染速度。实验结果进一步表明该方法能够同时满足真实感与实时性两个方面的要求。 展开更多
关键词 云场景 PERLIN噪声 三线性插值 图形处理器(GPU) Bumping纹理 单向散射
下载PDF
NTRU加解密算法的GPU实现研究 被引量:1
8
作者 朱瑶 严承华 李强 《计算机工程与应用》 CSCD 北大核心 2011年第34期81-85,共5页
GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的... GPU拥有高度并行性和可编码的特点,在大规模数据并行计算方面得到广泛应用。NTRU算法是一种安全性高,易于并行化的公钥密码算法。研究了NTRU算法基于CUDA的并行化实现技术,将计算中最耗时的卷积运算分解到多个线程并行计算,引入大量的独立并发的加解密线程块来完成整个加解密过程,并给出了具体的数据编码及存储结构、线程组织以及基于合并访问和共享内存的性能优化技术。实验结果表明,基于CUDA的NTRU加解密算法实现了硬件加速,相对于NTRU算法在CPU的实现,CUDA实现能够达到12.38MB/s的吞吐量,可获得最大为95倍的加速比。 展开更多
关键词 统一计算设备架构 图形处理单元 NTRU算法 并行
下载PDF
GPU加速的光滑轮廓线绘制 被引量:1
9
作者 方建文 于金辉 《计算机工程与应用》 CSCD 北大核心 2011年第11期1-2,14,共3页
轮廓线的高效提取是非真实感绘制的一个关键问题。提出了一个完全利用GPU生成光滑轮廓线的高效算法。在几何处理阶段,先根据相邻三角形的法向量与视向量的关系检测出轮廓线,然后对轮廓线进行宽度扩充,同时对轮廓线顶点设置相应的渐变因... 轮廓线的高效提取是非真实感绘制的一个关键问题。提出了一个完全利用GPU生成光滑轮廓线的高效算法。在几何处理阶段,先根据相邻三角形的法向量与视向量的关系检测出轮廓线,然后对轮廓线进行宽度扩充,同时对轮廓线顶点设置相应的渐变因子;在像素处理阶段把渐变因子转化为相应的alpha值,通过光照生成卡通渲染,最后通过alpha混合得到光滑轮廓线。算法完全在GPU里实现,能满足实时的绘制要求。 展开更多
关键词 图形处理器 卡通风格 实时绘制
下载PDF
基于GPU的高速网络入侵检测系统设计 被引量:1
10
作者 卢永菁 王东 《计算机工程与应用》 CSCD 北大核心 2011年第33期78-81,共4页
随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高检测速度,不但价格昂贵且无法大规模普及。通过对Linux网络... 随着网络带宽的不断增加,以及处理能力的限制,传统的网络入侵检测系统(Network Intrusion Detecting System,NIDS)面临挑战,如何提高NIDS的处理能力备受关注。通过专用设备提高检测速度,不但价格昂贵且无法大规模普及。通过对Linux网络协议栈的优化,以及常用入侵检测系统Snort的多线程化,结合了图形处理器(Graphic Processing Unit,GPU)的高性能并行计算能力,设计了一种高性能的软件入侵检测架构,突破现有NIDS使用普通CPU的计算瓶颈,以应对高速链路对入侵检测性能的要求。实验结果表明,高速网络中的数据包可以采用GPU来处理。 展开更多
关键词 网络入侵检测系统(NIDS) 图形处理器(GPU) SNORT 并行计算
下载PDF
采用重要性面片采样的实时全局光照
11
作者 柴学梁 吴向阳 +1 位作者 王毅刚 戴大蒙 《计算机工程与应用》 CSCD 北大核心 2010年第2期174-176,217,共4页
提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算了各面片上的形状因子来解决遮挡问题,并记录形状因子较大的重要性面片作为间接光源。渲染时先从光源方... 提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算了各面片上的形状因子来解决遮挡问题,并记录形状因子较大的重要性面片作为间接光源。渲染时先从光源方向对场景记录了一个扩展的阴影图,包含了光源照射到的面片ID和其光通量,再根据采样好的间接光源来计算间接光照。使用CUDA,整个光照计算过程在GPU中完成,可以对静态场景进行实时渲染,并能达到逼真的渲染效果。 展开更多
关键词 重要性面片采样 全局光照 遮挡 图形处理器 统一计算架构
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部