期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
多核CPU下的K-means遥感影像分类并行方法 被引量:11
1
作者 吴洁璇 陈振杰 +2 位作者 张云倩 骈宇哲 周琛 《计算机应用》 CSCD 北大核心 2015年第5期1296-1301,共6页
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并... 针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。 展开更多
关键词 K-MEANS算法 并行计算 负载均衡 数据粒度划分 消息传递接口 open MP
下载PDF
基于OpenMP的分子动力学并行算法的性能分析与优化 被引量:10
2
作者 白明泽 程丽 +1 位作者 豆育升 孙世新 《计算机应用》 CSCD 北大核心 2012年第1期163-166,共4页
为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三... 为提高分子动力学模拟在共享内存式服务器上的计算速度,对基于OpenMP的分子动力学并行算法(Critical方法)进行了性能分析与优化。通过在多核服务器上的测试,以及加速比和并行效率的计算分析了Critical方法的并行性能,进而提出优化的三角形方法。所提方法中每个线程所计算的粒子数固定,且粒子数目呈阶梯状上升,使得各线程能够错时到达临界区。从而使程序在临界区的闲置时间比Critical方法减半,加速比明显提高。 展开更多
关键词 分子动力学 并行计算 多核中央处理器 openmp 临界区
下载PDF
多核CPU和GPU加速分子动力学模拟 被引量:6
3
作者 林江宏 林锦贤 吕暾 《计算机应用》 CSCD 北大核心 2011年第3期843-847,共5页
在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了... 在多核中央处理器(CPU)—图形处理器(GPU)异构并行体系结构上,采用OpenMP和计算统一设备架构(CUDA)编程实现了基于AMBER力场的蛋白质分子动力学模拟程序。通过合理地将程序划分为CPU单线程、CPU多线程和GPU多线程执行部分,高效地利用了计算机的处理能力。性能测试结果表明,相对于优化后的CPU串行计算,多核CPU-GPU异构并行计算模型有强大的性能优势,特别是将占整个程序执行时间90%的作用力的计算移植到GPU上执行,获得了最高可达12倍的计算加速比。 展开更多
关键词 分子动力学 图形处理器 多核中央处理器 AMBER力场 计算统一设备架构 openmp
下载PDF
基于CPU与GPU的异构模板计算优化研究 被引量:2
4
作者 李博 黄东强 +3 位作者 贾金芳 吴利 王晓英 黄建强 《计算机工程》 CAS CSCD 北大核心 2023年第4期131-137,共7页
模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基... 模板计算是一类使用固定模板的算法,被广泛应用于图像处理、计算流体动力学模拟等领域,现有的模板计算存在计算并行度弱、缓存命中率低、无法充分利用计算资源等问题。在消息传递接口(MPI)计算模型和跨平台多线程(OpenMP)计算模型的基础上提出MPI+OpenMP、统一计算设备架构(CUDA)+OpenMP两种混合计算模型。相较于常规的MPI计算模型,MPI+OpenMP计算模型通过使用MPI进行多节点之间的粗粒度通信,使用OpenMP实现进程内部的细粒度并行计算,并结合单指令多数据、非一致内存访问、数据预取、数据分块等技术,提高模板计算过程中的缓存命中率与计算并行能力,加快计算速度。在只采用CUDA进行模板计算时,CPU的计算资源没有得到充分利用,浪费了大量计算资源,CUDA+OpenMP计算模型通过对计算任务的负载划分让CPU也参与到计算中,以减少通信开销及充分利用CPU的多核并行计算能力。实验结果表明,OpenMP+MPI计算模型相较于MPI计算模型的平均加速比为3.67,CUDA+OpenMP计算模型相较于CUDA计算模型的平均加速比为1.26,OpenMP+MPI和CUDA+OpenMP两种计算模型的性能均得到了显著提升。 展开更多
关键词 模板计算 消息传递接口 跨平台多线程 单指令多数据 非一致内存访问 统一计算设备架构
下载PDF
基于并行技术的在线监测系统燃耗计算优化开发 被引量:1
5
作者 郭凤晨 高露露 +5 位作者 芦韡 赵德华 于洋 徐睿杰 马永强 魏桐 《核动力工程》 EI CSCD 北大核心 2023年第S02期29-32,共4页
为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DE... 为了提高在线监测系统程序DESCAR模块在燃耗区数目较大时燃耗计算求解的计算效率,本文使用开放式多处理(OpenMP)和信息传递接口(MPI)并行技术,对DESCAR模块进行优化重构,以提高在线监测系统程序的计算效率。验证结果表明,优化重构后的DESCAR模块在保证计算结果正确性的同时,可以有效地提高在线监测系统程序的计算速度,加速效果显著,满足在线监测系统实时性的要求。 展开更多
关键词 并行技术 燃耗计算 开放式多处理(openmp) 信息传递接口(MPI)
原文传递
并行Harris特征点检测算法 被引量:1
6
作者 朱超 吴素萍 《计算机科学》 CSCD 北大核心 2019年第S11期289-293,共5页
针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对... 针对三维重建大数据量问题中的特征点提取算法,存在运算量大、耗时多、效率低等问题,文中对Harris特征点检测算法进行改进,提出了基于OpenMP的多核CPU和基于CUDA及OpenCL框架的GPU下的Harris特征点检测并行算法。在不同实验平台进行对比实验,实验结果表明,基于CUDA及OpenCL框架的GPU并行特征点检测算法具有良好的数据和平台可扩展性,基于GPU并行特征点检测算法的加速比最高可达91.19,加速效果显著。基于OpenMP的多核CPU特征点检测算法具有良好的多核可扩展性。 展开更多
关键词 HARRIS 特征点检测 共享存储并行编程 计算机统一设备架构 开放式计算语言 并行算法
下载PDF
面向嵌入式多核的OpenMP扩展方法(英文)
7
作者 王庆 季振洲 刘涛 《计算机科学与探索》 CSCD 2011年第1期81-86,共6页
为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌... 为多核平台开发一种有效的编程方法已经成为并行软件研究的一个重要目标。在嵌入式多核平台上进行了OpenMP并行程序的有效的实施运行。针对嵌入式具有有限内存资源的特点,提出了通过扩展OpenMP自定义制导语句tiling来提高并行程序在嵌入式多核平台上的运行效率。扩展后的OpenMP并行程序支持循环分片,从而能够充分利用层次内存结构。实验结果证明,该方法在嵌入式多核平台上的运行性能能够提高10%。 展开更多
关键词 嵌入式多核 openmp 循环分片
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部