期刊文献+
共找到142篇文章
< 1 2 8 >
每页显示 20 50 100
通过GPU加速数据挖掘的研究进展和实践 被引量:9
1
作者 戴春娥 陈维斌 +1 位作者 傅顺开 李志强 《计算机工程与应用》 CSCD 北大核心 2015年第16期109-116,共8页
将计算密度高的部分迁移到GPU上是加速经典数据挖掘算法的有效途径。首先介绍GPU特性和主要的GPU编程模型,随后针对数据挖掘主要任务类型分别介绍基于GPU加速的工作,包括分类、聚类、关联分析、时序分析和深度学习。最后分别基于CPU和GP... 将计算密度高的部分迁移到GPU上是加速经典数据挖掘算法的有效途径。首先介绍GPU特性和主要的GPU编程模型,随后针对数据挖掘主要任务类型分别介绍基于GPU加速的工作,包括分类、聚类、关联分析、时序分析和深度学习。最后分别基于CPU和GPU实现协同过滤推荐的两类经典算法,并基于经典的Movie Lens数据集的实验验证GPU对加速数据挖掘应用的显著效果,进一步了解GPU加速的工作原理和实际意义。 展开更多
关键词 数据挖掘 gpu加速 并行计算 协同过滤
下载PDF
一种网格化高并发Skyline查询处理方法 被引量:1
2
作者 李佳佺 刘晏如 李传文 《小型微型计算机系统》 CSCD 北大核心 2023年第4期881-887,共7页
为减少冗余支配测试对Skyline查询性能的影响并提高Skyline查询处理的效率,本文将测试单位扩大为网格,并设计了一种基于网格分层划分的Skyline查询方法.通过不断缩小Skyline点集所在网格的方式,使网格之间的支配关系与点支配关系重合,... 为减少冗余支配测试对Skyline查询性能的影响并提高Skyline查询处理的效率,本文将测试单位扩大为网格,并设计了一种基于网格分层划分的Skyline查询方法.通过不断缩小Skyline点集所在网格的方式,使网格之间的支配关系与点支配关系重合,从而避免了点与点之间大量无效的支配测试,提升了Skyline查询处理的效率.方法中同一层的网格可并行计算,且层次计算过程可达到任意精度,适用于计算能力有限但对结果精度要求不高的场合.实验结果表明,方法与现有Skyline查询处理方式相比具有数据吞吐量大、响应速度快等特点,在拥有高性能GPU或多核CPU等高并发环境下其优势更为明显. 展开更多
关键词 SKYLINE 对象索引 动态网格索引 空间数据 并行加速
下载PDF
基于GPU的并行遗传算法在时频差估计中的应用 被引量:1
3
作者 逯志宇 王建辉 +1 位作者 王大鸣 王跃 《信息工程大学学报》 2015年第5期552-556,共5页
互模糊函数可以估计时频差参数,但在弱信号条件下,需要大量采样点才能获得较好的估计结果,面临巨大的计算压力,现有算法大都基于遍历思想进行时频二维搜索,实时性较差。针对此问题,提出基于GPU加速的并行遗传算法进行时频差快速估计,该... 互模糊函数可以估计时频差参数,但在弱信号条件下,需要大量采样点才能获得较好的估计结果,面临巨大的计算压力,现有算法大都基于遍历思想进行时频二维搜索,实时性较差。针对此问题,提出基于GPU加速的并行遗传算法进行时频差快速估计,该算法针对互模糊函数的特点,结合GPU设计高速并行的遗传进化架构,通过对适应度函数的并行化计算,选择、交叉、变异的并行化操作,提升算法的执行效率。实验表明,文章设计的GPU加速算法能够带来较大的速度提升,可以快速得到时频差估计结果。 展开更多
关键词 遗传算法 互模糊函数 gpu加速 时差估计 频差估计
下载PDF
GAPI:GPU加速的移动对象并行索引方法 被引量:1
4
作者 车庆首 李传文 +1 位作者 张轶 邓庆绪 《计算机科学与探索》 CSCD 北大核心 2017年第11期1713-1722,共10页
为减少加锁操作对移动对象数据库并行性能的影响并提高其吞吐量,提出一种由GPU加速的网格结合四叉树的索引方法。采用由GPU对出入节点对象进行计数并持续计算节点拆分/合并条件的方式,在不影响CPU计算能力的前提下,将存在性能瓶颈的网... 为减少加锁操作对移动对象数据库并行性能的影响并提高其吞吐量,提出一种由GPU加速的网格结合四叉树的索引方法。采用由GPU对出入节点对象进行计数并持续计算节点拆分/合并条件的方式,在不影响CPU计算能力的前提下,将存在性能瓶颈的网格节点转化为四叉树,从而减少对象数据更新时加锁操作造成的其他线程等待时间。该方法结构简单且更适用于对象不均匀分布的场景,避免了现有索引方式或在热点区域存在性能瓶颈,或需花费大量计算资源进行结构平衡等缺点。实验结果表明,该方法与现有移动对象索引方式相比具有数据吞吐量大、响应速度快等特点,在移动对象空间分布不均匀的场景下其优势更为明显。 展开更多
关键词 移动对象索引 动态网格索引 空间数据库 gpu加速
下载PDF
高效高精度水动力模型在洪水演进中的应用研究 被引量:58
5
作者 侯精明 李桂伊 +2 位作者 李国栋 LIANG Qiuhua 支再兴 《水力发电学报》 EI CSCD 北大核心 2018年第2期96-107,共12页
针对现有的洪水演进及淹没过程二维数值模型中存在的计算精度不高、稳定性差、计算效率低下等问题,本文提出一套基于GPU加速技术的地表水动力数值模型(GAST)。选用英国莫帕斯小镇百年一遇洪灾为研究对象,模拟5 m和2 m分辨率地形下的城... 针对现有的洪水演进及淹没过程二维数值模型中存在的计算精度不高、稳定性差、计算效率低下等问题,本文提出一套基于GPU加速技术的地表水动力数值模型(GAST)。选用英国莫帕斯小镇百年一遇洪灾为研究对象,模拟5 m和2 m分辨率地形下的城区淹没过程及范围,分析GAST模型的模拟精度、效率及稳定性。研究发现:GAST模型模拟淹没面积与实测结果百分误差仅为0.96%~4.36%,同时计算5 m、2 m分辨率地形用时分别为2.17 h、9.00 h,具有较高的模拟精度、效率及计算稳定性;对比相同输入条件下的MIKE21 FM模型,GAST模型计算精度提升1.07~19.55倍;GAST模型计算效率提升3.4~11.78倍,且随着计算网格数的增加效率优势更为明显,故其应用前景广阔。 展开更多
关键词 水动力学模型 数值模拟 gpu加速计算 洪水演进 计算效率
原文传递
基于全水动力模型的流域雨洪过程数值模拟 被引量:11
6
作者 刘菲菲 侯精明 +3 位作者 郭凯华 李东来 许苏秦 张现国 《水动力学研究与进展(A辑)》 CSCD 北大核心 2018年第6期778-785,共8页
为精确模拟流域降雨成洪过程,该文引入了一套基于二维动力波方法的耦合了水文及水动力过程的数值模型。模型采用二阶Godunov格式的有限体积法来保证计算精度并采用GPU加速技术提高了运算效率。通过模拟理论流域、试验流域和实际流域的... 为精确模拟流域降雨成洪过程,该文引入了一套基于二维动力波方法的耦合了水文及水动力过程的数值模型。模型采用二阶Godunov格式的有限体积法来保证计算精度并采用GPU加速技术提高了运算效率。通过模拟理论流域、试验流域和实际流域的雨洪过程,发现对于特征简单的小流域及地形复杂范围较广的实际流域,模型模拟流量过程、洪峰流量及水位过程与已有解析解或实测结果吻合度均较高。同时应用GPU加速技术有效解决了动力波方法计算量大的问题,在PC机上仅用了51min便完成了具有56万个计算单元的研究流域内一场16h洪水过程的模拟计算。可见该模型是研究流域雨洪过程的理想工具,能够为洪水形成机理的研究及洪涝灾害管理工作提供技术支持。 展开更多
关键词 雨洪过程 动力波方法 数值模拟 gpu加速计算
原文传递
GPU数据库OLAP优化技术研究
7
作者 张延松 刘专 +2 位作者 韩瑞琛 张宇 王珊 《软件学报》 EI CSCD 北大核心 2023年第11期5205-5229,共25页
GPU数据库近年来在学术界和工业界吸引了大量的关注.尽管一些原型系统和商业系统(包括开源系统)开发了作为下一代的数据库系统,但基于GPU的OLAP引擎性能是否真的超过CPU系统仍然存有疑问,如果能够超越,那什么样的负载/数据/查询处理模... GPU数据库近年来在学术界和工业界吸引了大量的关注.尽管一些原型系统和商业系统(包括开源系统)开发了作为下一代的数据库系统,但基于GPU的OLAP引擎性能是否真的超过CPU系统仍然存有疑问,如果能够超越,那什么样的负载/数据/查询处理模型更加适合,则需要更深入的研究.基于GPU的OLAP引擎有两个主要的技术路线:GPU内存处理模式和GPU加速模式.前者将所有的数据集存储在GPU显存来充分利用GPU的计算性能和高带宽内存性能,不足之处在于GPU容量有限的显存制约了数据集大小以及稀疏访问模式的数据存储降低GPU显存的存储效率.后者只在GPU显存中存储部分数据集并通过GPU加速计算密集型负载来支持大数据集,主要的挑战在于如何为GPU显存选择优化的数据分布和负载分布模型来最小化PCIe传输代价和最大化GPU计算效率.致力于将两种技术路线集成到OLAP加速引擎中,研究一个定制化的混合CPU-GPU平台上的OLAP框架OLAP Accelerator,设计CPU内存计算、GPU内存计算和GPU加速3种OLAP计算模型,实现GPU平台向量化查询处理技术,优化显存利用率和查询性能,探索GPU数据库的不同的技术路线和性能特征.实验结果显示GPU内存向量化查询处理模型在性能和内存利用率两方面获得最佳性能,与OmniSciDB和Hyper数据库相比性能达到3.1和4.2倍加速.基于分区的GPU加速模式仅加速了连接负载来平衡CPU和GPU端的负载,能够比GPU内存模式支持更大的数据集. 展开更多
关键词 混合CPU-gpu平台 gpu加速OLAP OLAP gpu内存 gpu量化处理模型
下载PDF
基于GAST模型的突发水污染事故中污染物输移模拟 被引量:3
8
作者 石宝山 侯精明 +4 位作者 王俊珲 康永德 孙亚联 郭敏鹏 张兆安 《武汉大学学报(工学版)》 CAS CSCD 北大核心 2022年第11期1112-1119,共8页
突发水污染事故后,高效准确模拟预测是快速采取有效防控措施和制定应急预案的基础。采用基于非均匀网格的图形处理器(graphics processing unit,GPU)加速的水动力及污染物输移数值模型(GPU accelerated surface water flow and associat... 突发水污染事故后,高效准确模拟预测是快速采取有效防控措施和制定应急预案的基础。采用基于非均匀网格的图形处理器(graphics processing unit,GPU)加速的水动力及污染物输移数值模型(GPU accelerated surface water flow and associated transport,GAST)对暴雨山洪或溃坝洪水引起的突发水污染事故中污染物输移规律进行了模拟预测。模型采用Godunov格式的有限体积法求解二维浅水方程和污染物输移方程,采用一种基于HLLC(Harten-Lax-Van Leer-contact)的近似黎曼求解器计算单元网格界面通量,采用二阶高精度格式(monotonic upstream-centred scheme for conservation laws,MUSCL)限坡线性重建和龙格-库塔时间积分法实现了二阶精度,同时采用GPU加速计算技术提高模型计算效率。算例结果表明:采用非均匀网格技术局部细化地形复杂区域生成精细网格,地势平坦区域粗化网格,大幅度减少了计算域网格数量,并且在保证模拟精度的同时,提升了模型计算效率。该模型可高效准确地模拟突发水污染事件中污染物输移过程,适用于大规模水污染事故的快速预警和评估。 展开更多
关键词 GAST模型 突发水污染 gpu加速 非均匀网格 有限体积法 污染物输移
原文传递
GPU加速电子剪切散斑干涉图像处理 被引量:4
9
作者 邵珩 周勇 +1 位作者 祁俊峰 聂中原 《液晶与显示》 CAS CSCD 北大核心 2019年第10期1021-1029,共9页
电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间... 电子剪切散斑干涉是在电子散斑干涉基础上发展起来的一种测量位移导数的新方法,尤其适合于无损检测实时测量。由于噪声干扰,测量得到的相位差图有大量噪点需要滤波去除。滤波处理计算量大,采用CPU计算需要很长时间完成。为缩短滤波时间,实现实时滤波处理,对四步相移法和Butterworth低通滤波、正余弦均值滤波和复数均值滤波算法,利用GPU并行计算能力强和存储带宽高的特性,开发了基于GPU加速计算的解相位差和滤波算法。对比基于CPU的解相位差和滤波计算,GPU加速计算将图像总体处理时间约1.9s(i7 6500U)降低到了239~366ms(GeForce940MX)或86~116ms(Quadro P3000),且正余弦均值滤波和复数均值滤波算法均可以通过降低滤波次数缩短滤波时间,从而保证在性能较弱的GPU上也能将计算时间压缩到0.2s内,满足实时图像处理的需求。 展开更多
关键词 电子剪切散斑干涉 图像处理 滤波 gpu加速计算
下载PDF
一种基于REC.2020高清色域的视频级显微高动态范围成像方法 被引量:2
10
作者 郑驰 BERNAL Salvador Garcia +2 位作者 张克奇 毛磊 刘旭 《光学仪器》 2019年第3期35-41,共7页
高动态范围成像已经成为数字显微镜发展的一大趋势。目前视频级高动态范围显微成像技术由于计算复杂度较高,还无法做到实时处理和显示。提出利用高清电视领域中的REC.2020色域变换,结合GPU实时加速处理技术,成功实现了高动态范围显微图... 高动态范围成像已经成为数字显微镜发展的一大趋势。目前视频级高动态范围显微成像技术由于计算复杂度较高,还无法做到实时处理和显示。提出利用高清电视领域中的REC.2020色域变换,结合GPU实时加速处理技术,成功实现了高动态范围显微图像视频流的实时显示,图像具有良好的色彩还原性和细节恢复性。实验结果表明,设计的算法不仅能够提供稳定的高清、高动态范围视频,其细节和色彩还原性也有了很大的提高,突破了传统的高动态范围图像技术在成像速度和质量方面的限制。 展开更多
关键词 高动态范围(HDR) 视频级REC.2020 gpu实时加速处理
下载PDF
泥石流的数值模拟及危险性评价 被引量:1
11
作者 康永德 侯精明 +4 位作者 石宝山 郭敏鹏 潘占鹏 于国强 洪增林 《水利水运工程学报》 CSCD 北大核心 2021年第4期75-84,共10页
泥石流具有突发性、速度快、破坏力强的特点,其运动规律研究和危险性预测,具有重要的现实意义和理论价值。基于GPU(图形处理单元)加速技术的二维水动力模型,采用二阶Godunov格式有限体积法求解方程,以确保计算精度,并使用GPU加速技术提... 泥石流具有突发性、速度快、破坏力强的特点,其运动规律研究和危险性预测,具有重要的现实意义和理论价值。基于GPU(图形处理单元)加速技术的二维水动力模型,采用二阶Godunov格式有限体积法求解方程,以确保计算精度,并使用GPU加速技术提高了计算效率。以溃坝型水槽泥石流运动特征及贵州省普洒村滑坡泥石流危险范围预测作为模拟参照,利用所构建的GAST(GPU Accelerated Surface Water Flow and Transport Model)二维水动力模型完成泥石流理想水槽试验模拟和危险范围预测。结果表明:数值模拟与实测结果吻合度较高;GPU加速技术的应用有效解决了泥石流模拟过程中计算量大的问题,在PC机上模型运行快速高效。此模型为泥石流运动规律模拟与预测提供了新方法,为防灾减灾提供了技术支撑。 展开更多
关键词 泥石流 gpu加速计算 数值模拟
下载PDF
三维图像重建中基于GPU的轮廓插值加速方法 被引量:1
12
作者 韩凤禹 勾成俊 +1 位作者 侯氢 吴章文 《中国医学物理学杂志》 CSCD 2012年第1期3145-3149,共5页
目的:针对传统的的轮廓插值算法在CPU上计算效率低的缺点,将基于距离图像的轮廓插值算法做基于GPU的并行计算加速。方法:基于形状的插值算法主要过程有:(1)轮廓平移使上下两层原始轮廓图像的形心对齐;(2)对原始轮廓图像建立一个对应的... 目的:针对传统的的轮廓插值算法在CPU上计算效率低的缺点,将基于距离图像的轮廓插值算法做基于GPU的并行计算加速。方法:基于形状的插值算法主要过程有:(1)轮廓平移使上下两层原始轮廓图像的形心对齐;(2)对原始轮廓图像建立一个对应的标记图像;(3)对原始轮廓图像进行距离变换,得到有不同符号标记的距离图像;(4)对距离图像进行线性插值;(5)从得到的插值距离图像中提取出插值层轮廓;(6)将插值层轮廓回移。将轮廓插值算法中的距离变换过程进行GPU并行化,使距离图像像素标识与GPU线程标识一一对应。GPU的每个线程分别计算距离图像中的一个像素:从显存中读取标记与轮廓坐标,计算出最小欧氏距离,并将有标记的距离结果保存在显存中,作为距离图像的一个像素。结果:测试表明,该方法在测验平台上加速最高达到600倍。结论:该方法加速效果明显,满足实际应用中的实时交互要求。 展开更多
关键词 三维图像重建 轮廓插值 gpu加速计算 距离变换
下载PDF
基于Silverlight5.0+XNA4.0的3D机房展现的研究
13
作者 李飞 《贵州电力技术》 2015年第5期45-47,共3页
阐述利用微软公司发布的Silverlight5.0、Visual Studio 2010和微软公司于2010年9月16日发布的XNA4.0技术,实现了具有丰富视觉效果、涵盖电源状态、机房告警、人员出入、实时视频、温湿度控制、运行值班监管,全公司数据中心实时视频、... 阐述利用微软公司发布的Silverlight5.0、Visual Studio 2010和微软公司于2010年9月16日发布的XNA4.0技术,实现了具有丰富视觉效果、涵盖电源状态、机房告警、人员出入、实时视频、温湿度控制、运行值班监管,全公司数据中心实时视频、电源、环境等,集中容灾中心实时工业视频、电源等监管可视化3D机房监控。并实现模拟化画面立体式、多角度、交互式和实时性3D机房展现通信。 展开更多
关键词 Silverlight5.0 XNAgpu加速富界面 3D技术
下载PDF
高性能联盟区块链技术研究 被引量:54
14
作者 朱立 俞欢 +2 位作者 詹士潇 邱炜伟 李启雷 《软件学报》 EI CSCD 北大核心 2019年第6期1577-1593,共17页
以上海证券交易所“去中心化的主板核心交易系统”作为业务场景,旨在研究高性能联盟区块链的优化算法.在联盟链关键技术研究的基础上,结合现有主板证券竞价交易系统的业务,提出了系统架构以及关键技术的实现.对业务逻辑与共识分离、存... 以上海证券交易所“去中心化的主板核心交易系统”作为业务场景,旨在研究高性能联盟区块链的优化算法.在联盟链关键技术研究的基础上,结合现有主板证券竞价交易系统的业务,提出了系统架构以及关键技术的实现.对业务逻辑与共识分离、存储优化和数字签名验证优化(包括合并验签和 GPU 加速)等可提高联盟链性能的优化策略进行了详细的介绍和分析.最后,通过一系列对比实验来验证优化策略的有效性.实验结果表明,这些优化手段极大地提高了去中心化的主板核心交易系统的性能. 展开更多
关键词 联盟链性能 业务逻辑与共识分离 合并验签 gpu 加速 存储优化
下载PDF
GPU中的流体场景实时模拟算法 被引量:20
15
作者 陈曦 王章野 +2 位作者 何戬 延诃 彭群生 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2010年第3期396-405,共10页
为了实时模拟真实的大规模流体场景,提出一种基于平滑粒子流体力学(SPH)进行流体场景模拟的算法.首先提出了新的精细程度函数作为非均匀采样的依据,以减少实际模拟时所需的粒子数,提高模拟的速度;然后引入一种三维空间网格划分算法和改... 为了实时模拟真实的大规模流体场景,提出一种基于平滑粒子流体力学(SPH)进行流体场景模拟的算法.首先提出了新的精细程度函数作为非均匀采样的依据,以减少实际模拟时所需的粒子数,提高模拟的速度;然后引入一种三维空间网格划分算法和改进的并行基数排序算法,以加快模拟过程中对邻域粒子和边界的查找及其相互作用的计算;最后使用最新的NVIDIA(CUDA(架构,将SPH的全部模拟计算分配到GPU流处理器中,充分利用GPU的高并行性和可编程性,使得对SPH方法的流体计算和模拟达到实时.实验结果表明,采用文中算法能对流体场景的计算模拟达到实时,并实现比较真实的模拟效果.与已有的SPH流体CPU模拟方法相比,其加速比达到2个数量级以上,同时相比已有GPUSPH方法,能模拟出更为丰富的细节效果. 展开更多
关键词 流体场景 实时模拟 gpu加速 基于物理的模拟 自适应平滑粒子水动力学
下载PDF
城市二维内涝模型的GPU并行方法 被引量:18
16
作者 向小华 陈颖悟 +3 位作者 吴晓玲 李超 王志伟 康爱卿 《河海大学学报(自然科学版)》 CAS CSCD 北大核心 2020年第6期528-533,共6页
针对二维水动力模型应用于城市内涝模拟时,在大尺度区域或精细分辨率情形下运行耗时过长的问题,通过耦合SWMM模型和LISFLOOD-FP模型构建城市内涝模型,采用GPU的并行计算技术加速城市二维内涝模型。以盐城响水县城区的内涝模拟为例,对并... 针对二维水动力模型应用于城市内涝模拟时,在大尺度区域或精细分辨率情形下运行耗时过长的问题,通过耦合SWMM模型和LISFLOOD-FP模型构建城市内涝模型,采用GPU的并行计算技术加速城市二维内涝模型。以盐城响水县城区的内涝模拟为例,对并行模型的效率进行分析,结果表明,基于GPU的并行计算技术可以显著提升模型运行效率,在5 m分辨率下能够8 min内模拟12 h的内涝事件,可用于突发内涝事件下的快速响应;并行模型的加速效果在更高的空间分辨率下表现更明显,在2 m分辨率下取得最高10.86倍的加速比;要最大化发挥GPU计算效率,首先需要单步长有较大的计算量,其次是要尽量减少与GPU的数据频繁传输导致的额外开销。 展开更多
关键词 城市二维内涝模型 gpu加速 CUDA 加速比 网格分辨率
下载PDF
基于GPU加速的实时4K全景视频拼接 被引量:17
17
作者 卢嘉铭 朱哲 《计算机科学》 CSCD 北大核心 2017年第8期18-21,26,共5页
虚拟现实是近年来热门的新技术,而全景视频摄制是生产虚拟现实内容的一种重要方式。介绍了一个全景视频拼接系统,其能够对六路的2K视频实时进行拼接,生成4K的输出视频。设计了一个并行化的拼接流程,对整个拼接过程中的不同步骤都进行了... 虚拟现实是近年来热门的新技术,而全景视频摄制是生产虚拟现实内容的一种重要方式。介绍了一个全景视频拼接系统,其能够对六路的2K视频实时进行拼接,生成4K的输出视频。设计了一个并行化的拼接流程,对整个拼接过程中的不同步骤都进行了并行化处理,并在GPU上进行了实现。实验结果表明,该系统能够实时拼接出高质量的4K全景视频。 展开更多
关键词 图像拼接 图像融合 gpu加速
下载PDF
家居布局的层次化约束及其粒子群优化 被引量:11
18
作者 陈光明 李桂清 +2 位作者 刘培 叶天阳 冼楚华 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2014年第10期1603-1612,共10页
家居布局作为虚拟场景设计的重要内容,在虚拟现实、三维游戏以及室内家居设计中都有应用.针对现有的家居自动布局方法存在约束冲突容易导致局部最优,以及由于全局优化方法收敛速度慢而达不到实时要求的问题,提出层次优化的思想化解约束... 家居布局作为虚拟场景设计的重要内容,在虚拟现实、三维游戏以及室内家居设计中都有应用.针对现有的家居自动布局方法存在约束冲突容易导致局部最优,以及由于全局优化方法收敛速度慢而达不到实时要求的问题,提出层次优化的思想化解约束冲突并采用粒子群优化算法解决布局优化问题.首先引入层次树对家具之间的约束关系进行结构化组织,避免约束冲突;然后引入粒子群优化算法进行优化求解,由于粒子群优化算法有着良好的并行结构,便于GPU加速,从而提高算法效率.通过多样化的实例对算法的有效性进行了验证,并对运行效率进行细致分析,结果表明,文中方法提升了家居布局的质量和效率. 展开更多
关键词 家居布局 室内设计 层次树 粒子群优化算法 gpu加速
下载PDF
基于GPU加速的水文模型参数率定 被引量:10
19
作者 阚光远 洪阳 +3 位作者 梁珂 何晓燕 丁留谦 张大伟 《人民长江》 北大核心 2019年第5期65-69,75,共6页
针对水文模型参数率定问题,为显著提升计算效率,选择SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以GPU硬件平台和通用计算设备架构(CUDA)软... 针对水文模型参数率定问题,为显著提升计算效率,选择SCE-UA算法和新安江模型为研究对象,围绕SCE-UA算法并行化与程序化实现、并行SCE-UA算法在图形处理器(GPU)上的加速效果这两个关键科学问题,以GPU硬件平台和通用计算设备架构(CUDA)软件平台为工具,采用时空复杂度分析、算法并行性挖掘、代码深度优化、数值模拟实验等多种手段相结合的方法,进行了水文模型参数率定提速研究。内容包括:①搭建基于CUDA和GPU的并行计算软硬件平台,进行配置与调优;②并行SCE-UA算法及其程序化实现;③并行SCE-UA算法在GPU上的加速效果。研究结果表明:所提出的方法显著提升了参数率定效率,能够促进水文模拟、最优化方法、计算机科学与技术等多学科的交叉、融合与发展,对水文模拟与预报、防洪快速应急响应具有科学意义和实用价值。 展开更多
关键词 参数率定 gpu加速 CUDA 水文模型 并行计算
下载PDF
静态程序分析并行化研究进展 被引量:9
20
作者 陆申明 左志强 王林章 《软件学报》 EI CSCD 北大核心 2020年第5期1243-1254,共12页
静态程序分析发展至今,已在多个方面取得了长足的进步,应用于软件开发的众多方面.但对现代大规模复杂软件系统(如千万行代码规模的Linux操作系统、分布式大数据处理系统Hadoop等)进行高精度的静态分析,因其极大规模数据量的计算,仍有一... 静态程序分析发展至今,已在多个方面取得了长足的进步,应用于软件开发的众多方面.但对现代大规模复杂软件系统(如千万行代码规模的Linux操作系统、分布式大数据处理系统Hadoop等)进行高精度的静态分析,因其极大规模数据量的计算,仍有一定难度.精度、效率和可扩展性相互制约,是静态分析技术在工业界应用的主要障碍.对此,近年来,随着多核、众核架构的兴起,研究人员提出了静态分析的各种并行化解决方案.首先梳理了静态分析的发展历程,然后针对当前静态分析面临的挑战,在分析了传统算法优化研究的不足后,对利用硬件资源进行并行优化的方法进行了充分讨论,包括单机的CPU并行、分布式和GPU实现这3个方面;在此基础上,对一些使用较为广泛的支持并行的静态分析工具进行了评估;最后,对未来如何从算法和算力角度对静态分析进行并行优化作了讨论和展望. 展开更多
关键词 静态程序分析 软件质量保障 并行计算 分布式处理 gpu加速
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部