期刊文献+
共找到135篇文章
< 1 2 7 >
每页显示 20 50 100
并行最短路径搜索算法的设计与实现 被引量:21
1
作者 卢照 师军 《计算机工程与应用》 CSCD 北大核心 2010年第3期69-71,共3页
针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,... 针对串行最短路径搜索算法本身固有的局限性,难以随着网络规模的增大而提高搜索速度的问题,设计并实现了一种基于并行Dijkstra思想的并行最短路径搜索算法,使算法复杂度由O(N2)减少到O(N2/p+N*(p-1)),提高了算法的效率。实验结果表明,该算法搜索速度快且性能稳定,当结点数目相当庞大时,算法的优越性更加明显。 展开更多
关键词 最短路径 并行机环境 MESSAGE PASSING interface(mpi) 并行搜索算法
下载PDF
An MPI parallel DEM-IMB-LBM framework for simulating fluid-solid interaction problems 被引量:2
2
作者 Ming Xia Liuhong Deng +3 位作者 Fengqiang Gong Tongming Qu Y.T.Feng Jin Yu 《Journal of Rock Mechanics and Geotechnical Engineering》 SCIE CSCD 2024年第6期2219-2231,共13页
The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive comp... The high-resolution DEM-IMB-LBM model can accurately describe pore-scale fluid-solid interactions,but its potential for use in geotechnical engineering analysis has not been fully unleashed due to its prohibitive computational costs.To overcome this limitation,a message passing interface(MPI)parallel DEM-IMB-LBM framework is proposed aimed at enhancing computation efficiency.This framework utilises a static domain decomposition scheme,with the entire computation domain being decomposed into multiple subdomains according to predefined processors.A detailed parallel strategy is employed for both contact detection and hydrodynamic force calculation.In particular,a particle ID re-numbering scheme is proposed to handle particle transitions across sub-domain interfaces.Two benchmarks are conducted to validate the accuracy and overall performance of the proposed framework.Subsequently,the framework is applied to simulate scenarios involving multi-particle sedimentation and submarine landslides.The numerical examples effectively demonstrate the robustness and applicability of the MPI parallel DEM-IMB-LBM framework. 展开更多
关键词 Discrete element method(DEM) Lattice Boltzmann method(LBM) Immersed moving boundary(IMB) Multi-cores parallelization Message passing interface(mpi) CPU Submarine landslides
下载PDF
High-Performance Flow Classification of Big Data Using Hybrid CPU-GPU Clusters of Cloud Environments
3
作者 Azam Fazel-Najafabadi Mahdi Abbasi +5 位作者 Hani H.Attar Ayman Amer Amir Taherkordi Azad Shokrollahi Mohammad R.Khosravi Ahmed A.Solyman 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2024年第4期1118-1137,共20页
The network switches in the data plane of Software Defined Networking (SDN) are empowered by an elementary process, in which enormous number of packets which resemble big volumes of data are classified into specific f... The network switches in the data plane of Software Defined Networking (SDN) are empowered by an elementary process, in which enormous number of packets which resemble big volumes of data are classified into specific flows by matching them against a set of dynamic rules. This basic process accelerates the processing of data, so that instead of processing singular packets repeatedly, corresponding actions are performed on corresponding flows of packets. In this paper, first, we address limitations on a typical packet classification algorithm like Tuple Space Search (TSS). Then, we present a set of different scenarios to parallelize it on different parallel processing platforms, including Graphics Processing Units (GPUs), clusters of Central Processing Units (CPUs), and hybrid clusters. Experimental results show that the hybrid cluster provides the best platform for parallelizing packet classification algorithms, which promises the average throughput rate of 4.2 Million packets per second (Mpps). That is, the hybrid cluster produced by the integration of Compute Unified Device Architecture (CUDA), Message Passing Interface (MPI), and OpenMP programming model could classify 0.24 million packets per second more than the GPU cluster scheme. Such a packet classifier satisfies the required processing speed in the programmable network systems that would be used to communicate big medical data. 展开更多
关键词 OPENMP Compute Unified Device Architecture(CUDA) Message Passing interface(mpi) packet classification medical data tuple space algorithm Graphics Processing Unit(GPU)cluster
原文传递
An MPI+OpenACC-Based PRM Scalar Advection Scheme in the GRAPES Model over a Cluster with Multiple CPUs and GPUs 被引量:1
4
作者 Huadong Xiao Yang Lu +1 位作者 Jianqiang Huang Wei Xue 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2022年第1期164-173,共10页
A moisture advection scheme is an essential module of a numerical weather/climate model representing the horizontal transport of water vapor.The Piecewise Rational Method(PRM) scalar advection scheme in the Global/Reg... A moisture advection scheme is an essential module of a numerical weather/climate model representing the horizontal transport of water vapor.The Piecewise Rational Method(PRM) scalar advection scheme in the Global/Regional Assimilation and Prediction System(GRAPES) solves the moisture flux advection equation based on PRM.Computation of the scalar advection involves boundary exchange,and computation of higher bandwidth requirements is complicated and time-consuming in GRAPES.Recently,Graphics Processing Units(GPUs) have been widely used to solve scientific and engineering computing problems owing to advancements in GPU hardware and related programming models such as CUDA/OpenCL and Open Accelerator(OpenACC).Herein,we present an accelerated PRM scalar advection scheme with Message Passing Interface(MPI) and OpenACC to fully exploit GPUs’ power over a cluster with multiple Central Processing Units(CPUs) and GPUs,together with optimization of various parameters such as minimizing data transfer,memory coalescing,exposing more parallelism,and overlapping computation with data transfers.Results show that about 3.5 times speedup is obtained for the entire model running at medium resolution with double precision when comparing the scheme’s elapsed time on a node with two GPUs(NVIDIA P100) and two 16-core CPUs(Intel Gold 6142).Further,results obtained from experiments of a higher resolution model with multiple GPUs show excellent scalability. 展开更多
关键词 Graphics Processing Unit(GPU)computing Open Accelerator(OpenACC) Message Passing interface(mpi) Global/Regional Assimilation and Prediction System(GRAPES) Piecewise Rational Method(PRM)scalar advection scheme
原文传递
An efficient parallel algorithm for ocean circulation numerical model based on irregular rectangle decomposition scheme
5
作者 ZHUANG Zhanpeng YUAN Yeli +2 位作者 ZHANG Jie HAN Lei YANG Jungang 《Acta Oceanologica Sinica》 SCIE CAS CSCD 2016年第5期18-23,共6页
A parallel algorithm of circulation numerical model based on message passing interface(MPI) is developed using serialization and an irregular rectangle decomposition scheme. Neighboring point exchange strategy(NPES... A parallel algorithm of circulation numerical model based on message passing interface(MPI) is developed using serialization and an irregular rectangle decomposition scheme. Neighboring point exchange strategy(NPES) is adopted to further enhance the computational efficiency. Two experiments are conducted on HP C7000 Blade System, the numerical results show that the parallel version with NPES(PVN) produces higher efficiency than the original parallel version(PV). The PVN achieves parallel efficiency in excess of 0.9 in the second experiment when the number of processors increases to 100, while the efficiency of PV decreases to 0.39 rapidly. The PVN of ocean circulation model is used in a fine-resolution regional simulation, which produces better results. The capability of universal implementation of this algorithm makes it applicable in many other ocean models potentially. 展开更多
关键词 irregular rectangle decomposition scheme message passing interfacempi neighboring point exchange strategy data communication
下载PDF
MPI-RCDD: A Framework for MPI Runtime Communication Deadlock Detection 被引量:1
6
作者 Hong-Mei Wei Jian Gao +3 位作者 Peng Qing Kang Yu Yan-Fei Fang Ming-Lu Li 《Journal of Computer Science & Technology》 SCIE EI CSCD 2020年第2期395-411,共17页
The message passing interface (MPI) has become a de facto standard for programming models of highperformance computing, but its rich and flexible interface semantics makes the program easy to generate communication de... The message passing interface (MPI) has become a de facto standard for programming models of highperformance computing, but its rich and flexible interface semantics makes the program easy to generate communication deadlock, which seriously affects the usability of the system. However, the existing detection tools for MPI communication deadlock are not scalable enough to adapt to the continuous expansion of system scale. In this context, we propose a framework for MPI runtime communication deadlock detection, namely MPI-RCDD, which contains three kinds of main mechanisms. Firstly, MPI-RCDD has a message logging protocol that is associated with deadlock detection to ensure that the communication messages required for deadlock analysis are not lost. Secondly, it uses the asynchronous processing thread provided by the MPI to implement the transfer of dependencies between processes, so that multiple processes can participate in deadlock detection simultaneously, thus alleviating the performance bottleneck problem of centralized analysis. In addition, it uses an AND⊕OR model based algorithm named AODA to perform deadlock analysis work. The AODA algorithm combines the advantages of both timeout-based and dependency-based deadlock analysis approaches, and allows the processes in the timeout state to search for a deadlock circle or knot in the process of dependency transfer. Further, the AODA algorithm cannot lead to false positives and can represent the source of the deadlock accurately. The experimental results on typical MPI communication deadlock benchmarks such as Umpire Test Suit demonstrate the capability of MPIRCDD. Additionally, the experiments on the NPB benchmarks obtain the satisfying performance cost, which show that the MPI-RCDD has strong scalability. 展开更多
关键词 high-performance computing message PASSING interface(mpi) COMMUNICATION DEADLOCK DEADLOCK detection AND⊕OR model
原文传递
基于模式记忆并行蚁群算法的输电网规划 被引量:35
7
作者 翟海保 程浩忠 +2 位作者 吕干云 陈小良 马则良 《中国电机工程学报》 EI CSCD 北大核心 2005年第9期17-22,共6页
该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上... 该文讨论了目前大规模输电网规划求解中常见的无法完成对解空间的充分搜索,从而难于求得全局最优解的问题;给出了泛函形式的输电网规划模型,并重点分析了输电网规划解的模式。在分析了传统蚁群算法易产生未成熟收敛现象及其原因的基础上,设计了一种基于模式记忆的并行蚁群算法,该算法通过模式记忆实现了解空间分解,能够有效地识别、记忆和跳出局部最优解;通过局部细化搜索进一步加强了局部搜索能力;通过并行计算提高了计算速度。某实际77 节点的算例分析表明了该算法具有很高的计算效率和优秀的局部、全局收敛性,有效克服了现代启发式算法在求解输电网规划问题时存在的效率不高及未成熟收敛等现象。 展开更多
关键词 输电网规划 蚁群算法 记忆 模式 现代启发式算法 未成熟收敛 局部搜索能力 全局最优解 局部最优解 全局收敛性 规划求解 规划模型 空间分解 计算速度 并行计算 计算效率 规划问题 解空间 分析表
下载PDF
多阶段输电网络最优规划的并行蚁群算法 被引量:25
8
作者 翟海保 程浩忠 +3 位作者 吕干云 陈春霖 江峰青 房领峰 《电力系统自动化》 EI CSCD 北大核心 2004年第20期37-42,共6页
多阶段输电网络最优规划是一个复杂的非线性组合优化问题,难以采用传统的数学优化方法求解。蚁群算法是近年来出现的用于解决组合优化问题的一种高效的内启发式搜索技术,但存在着未成熟收敛问题。文中给出了多阶段输电网络最优规划的数... 多阶段输电网络最优规划是一个复杂的非线性组合优化问题,难以采用传统的数学优化方法求解。蚁群算法是近年来出现的用于解决组合优化问题的一种高效的内启发式搜索技术,但存在着未成熟收敛问题。文中给出了多阶段输电网络最优规划的数学模型及其解的向量形式;详细分析了传统蚁群算法的未成熟收敛现象及其原因;提出一种并行蚁群算法并用于求解多阶段输电网络最优规划问题。并行蚁群算法无需初始可行解,能很好地协调局部搜索与全局搜索,在加快计算速度的同时有效地避免了因参数设置、种群规模等不同而引起的未成熟收敛。对实际算例的计算结果表明,该方法具有很高的计算效率和良好的全局收敛性。 展开更多
关键词 输电网络 多阶段规划 最优规划 蚁群算法 并行蚁群算法 消息传递接口
下载PDF
基于MPI的云计算模型 被引量:38
9
作者 郭本俊 王鹏 +1 位作者 陈高云 黄健 《计算机工程》 CAS CSCD 北大核心 2009年第24期84-86,共3页
根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为... 根据消息传递接口(MPI)的特点,提出云计算在MPI领域的应用方法,包括MPI的云计算算法设计模型、云计算原理、核心计算模式、处理流程,并介绍云计算的分布式及并行化特性。理论分析结果表明,该算法是有效可行的,优于传统并行技术,能够为算法分布化及并行化提供新思路。 展开更多
关键词 云计算 消息传递接口 机群系统 Hadoop架构
下载PDF
并行计算技术及其在勘探地球物理学中的现状与展望 被引量:18
10
作者 黄易 师学明 +1 位作者 范建柯 胡文宝 《地球物理学进展》 CSCD 北大核心 2010年第2期642-649,共8页
本文详细阐述了并行计算技术及其在地球物理勘探数据处理中的发展现状和发展趋势,分析了几个代表性的并行算法实例.这些结果表明,在拥有强大的并行机的基础上,基于并行计算开发环境(MPI和PVM等)设计高效的并行算法,通过分配合理的并行... 本文详细阐述了并行计算技术及其在地球物理勘探数据处理中的发展现状和发展趋势,分析了几个代表性的并行算法实例.这些结果表明,在拥有强大的并行机的基础上,基于并行计算开发环境(MPI和PVM等)设计高效的并行算法,通过分配合理的并行粒度、通信开销、负载平衡等执行高效的并行计算,可以有效加快处理速度、降低成本.目前,并行算法在地震数据处理中应用已较为成熟,近年来向更实用的基于PC机群的并行技术发展.然而,在非地震方法中,并行算法应用较少见文献报道,研究尚处于初级研究阶段.在大地电磁的二维和三维正、反演问题上,并行计算技术逐渐得到越来越多关注和重视.随着资源和能源需求的增长,地球物理勘探向深度和广度快速发展,大幅增长的数据量使得高性能并行计算机和高效的并行算法在勘探地球物理学中的发展和应用将占据愈来愈重要的地位. 展开更多
关键词 并行计算 机群 mpi PVM 地球物理勘探 数据处理
下载PDF
梯级水电站群长期优化调度云计算随机动态规划算法 被引量:16
11
作者 周东清 彭世玉 +1 位作者 程春田 王健 《中国电机工程学报》 EI CSCD 北大核心 2017年第12期3437-3448,共12页
为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式... 为了应对随机动态规划算法在解决梯级水电站群长期发电优化调度时的"维数灾"问题,并行化方法得到了广泛研究。单机多核并行算法扩展性不强;传统的分布式并行算法编程复杂,缺少负载均衡和容错机制。云计算平台作为新的分布式计算平台能够充分利用资源,具有诸多优势。为了探索云平台下的分布式并行随机动态规划模型,该文基于消息传递接口(message passing interface,MPI)和Spark框架分别实现了传统集群计算和云计算分布式随机动态规划算法,后者将计算模型转换为数据处理模型进行计算,并通过三库优化调度实验对算法进行了比较。算法分析及实验结果表明,基于云计算的分布式并行随机动态规划算法则可以有效利用云平台的优势,同时拥有完善的容错以及负载均衡机制,具有广阔的应用前景。 展开更多
关键词 随机动态规划 并行计算 云计算 消息传递接口(mpi) spark框架
下载PDF
复合机恒张力控制系统 被引量:13
12
作者 禹恒洲 鲁五一 +1 位作者 郭爱红 黄俊勇 《电气传动》 北大核心 2007年第3期37-40,共4页
张力控制技术广泛应用于卷绕类自动化控制系统中。以湿式复合机为研究对象,详细论述了复合机系统的张力控制原理;并设计了一套以SIEMENS公司的S7-300可编程序控制器为控制器,以TP27触摸屏为人机界面,以多点接口为通信方式的张力控制系... 张力控制技术广泛应用于卷绕类自动化控制系统中。以湿式复合机为研究对象,详细论述了复合机系统的张力控制原理;并设计了一套以SIEMENS公司的S7-300可编程序控制器为控制器,以TP27触摸屏为人机界面,以多点接口为通信方式的张力控制系统。生产运行表明,该系统运行稳定,控制精度满足要求。 展开更多
关键词 张力控制系统 可编程序控制器 多点接口 复合机
下载PDF
基于并行协同粒子群优化算法和PC集群的无功优化 被引量:13
13
作者 李英 江全元 +2 位作者 L.JIANG Q. H. WU 曹一家 《电力系统自动化》 EI CSCD 北大核心 2010年第19期42-47,80,共7页
针对大规模电力系统无功优化高维度、非线性、不连续的问题,提出一种并行协同粒子群优化算法。该算法基于消息传递接口技术,采用二级并行的方案求解无功优化问题。第1级并行是通过控制变量分组,将原优化问题分解成几个相互关联的子优化... 针对大规模电力系统无功优化高维度、非线性、不连续的问题,提出一种并行协同粒子群优化算法。该算法基于消息传递接口技术,采用二级并行的方案求解无功优化问题。第1级并行是通过控制变量分组,将原优化问题分解成几个相互关联的子优化问题,每一个子优化问题对应一个子粒子群,各子粒子群相互协同,共同求取最优解。第2级并行是指用粒子群优化算法求解子优化问题时使用多个进程并行求解,进程间采用对等模式分配计算任务,提高了优化效率。此外,为了增强粒子群优化算法的全局寻优能力,在优化过程中对其参数进行了动态调整。通过在PC集群上对IEEE118节点系统和IEEE300节点系统进行仿真计算,验证了该算法能取得较好的优化结果,具有较高的加速比和可扩展性,能满足大规模电力系统无功优化的需要。 展开更多
关键词 无功优化调度 并行计算 消息传递接口 协同进化 粒子群优化算法 PC集群
下载PDF
基于MPI+OpenMP混合编程模型的城市路网最短路径并行算法 被引量:11
14
作者 杨庆芳 刘冬 杨兆升 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2011年第6期1581-1584,共4页
针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效... 针对城市路网最短路径求解计算量庞大、实时性要求高的问题,提出了用Floyd算法为核心的MPI+OpenMP混合编程模型来解决这个问题。MPI+OpenMP混合编程提供结点内和结点间的两级并行处理,能充分利用共享存储模型和消息传递模型的优点,有效改善系统性能,提高系统计算速度。经由长春市路网验证可知,混合模型比MPI模型具有更好的加速比和运算效率,并且随着计算节点个数的增加,加速比提高幅度更大,表明MPI+OpenMP混合模型有着更好的可扩展性。 展开更多
关键词 交通运输系统工程 消息传递接口 mpi+OpenMP混合模型 最短路径 FLOYD算法
下载PDF
基于MPI的并行PSO混合K均值聚类算法 被引量:13
15
作者 吕奕清 林锦贤 《计算机应用》 CSCD 北大核心 2011年第2期428-431,437,共5页
传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算... 传统的串行聚类算法在对海量数据进行聚类时性能往往不尽如人意,为了适应海量数据聚类分析的性能要求,针对传统聚类算法的不足,提出一种基于消息传递接口(MPI)集群的并行PSO混合K均值聚类算法。首先将改进的粒子群与K均值结合,提高该算法的全局搜索能力,然后利用该算法提出一种新的并行聚类策略,并将该算法与K均值聚类算法、粒子群优化(PSO)聚类算法进行比较。实验结果表明,该算法不仅具有较好的全局收敛性,而且具有较高的加速比。 展开更多
关键词 消息传递接口集群 粒子群优化算法 K均值算法 并行聚类
下载PDF
分布式并行混合遗传算法在无功优化中的应用 被引量:9
16
作者 李运华 吴宏昺 +1 位作者 盛万兴 刘科研 《电力系统及其自动化学报》 CSCD 北大核心 2008年第2期36-41,共6页
将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标... 将模拟退火算法与普通遗传算法结合,同时引入分布式MPI技术,实现了分布式的多种群算法。该算法用个体迁移策略来协调优化各个种群,用最优值恢复策略来稳定优化方向,并通过分布式计算的应用,有效地缩短了计算时间。通过运用IEEE14节点标准数据运算,证明了这种算法在电力系统无功优化计算中具有很高的稳定性和快速求解能力。 展开更多
关键词 无功优化 消息传递界面 分布式并行混合遗传算法 模拟退火 个体迁移 最优值恢复
下载PDF
多核CPU下的K-means遥感影像分类并行方法 被引量:11
17
作者 吴洁璇 陈振杰 +2 位作者 张云倩 骈宇哲 周琛 《计算机应用》 CSCD 北大核心 2015年第5期1296-1301,共6页
针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并... 针对海量遥感影像快速分类的应用需求,提出一种基于K-means算法的遥感影像并行分类方法。该方法结合CPU下进程级与线程级模式的并行特征,设计融合进程级与线程级并行的两阶段数据粒度划分方法和任务调度方法,在保证精度的基础上实现并行加速。利用大数据量的多尺度遥感影像进行实验,结果表明:所提并行方法可大大减少遥感影像的分类时间,取得了良好的加速比(13.83),并可达到负载均衡,从而解决了大区域遥感影像快速分类的问题。 展开更多
关键词 K-MEANS算法 并行计算 负载均衡 数据粒度划分 消息传递接口 Open MP
下载PDF
格网DEM水系提取并行算法研究 被引量:8
18
作者 江岭 刘学军 +2 位作者 阳建逸 刘凯 宋效东 《地理与地理信息科学》 CSCD 北大核心 2013年第4期62-66,共5页
作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的... 作为数字地形分析的重要内容,基于格网DEM的水系提取包括DEM预处理、汇流累积及河网分级3个子过程。面对海量DEM数据,单机计算十分耗时,很难满足用户的时间相应需求。该文分析了提取过程的串行实现,基于MPI并行化工具,提出了基于双栈的并行策略,实现了DEM预处理、汇流累积及河网分级串行算法的并行化,完成了水系提取的并行计算。在配置Linux操作系统的集群环境下,利用不同大小的DEM数据,测试了算法的并行性能,结果表明并行算法运行时间明显低于串行算法,具有较好的并行效率。 展开更多
关键词 数字高程模型(DEM) 水系提取 并行计算 消息传递接口(mpi)
下载PDF
一种基于MPI的并行体绘制算法 被引量:5
19
作者 梁峰 鲁强 曾绍群 《计算机工程》 CAS CSCD 北大核心 2005年第13期171-173,共3页
介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国... 介绍了基于MPI并行程序开发平台实现的一种三维重建并行处理算法。算法采用了Master-Slave并行计算模型,针对射线投射方法的特点,为减少运算时间,选择对图像空间进行任务划分的策略,并用任务池方法实现了动态负载平衡。通过对虚拟中国人女性一号(VCH-F1)的头部和脚部数据集的重建,表明该算法在任务规模和节点规模上具有较好的可扩展性。 展开更多
关键词 并行算法 消息传递接口 体绘制 虚拟中国人
下载PDF
任务分配均衡的双参数CFAR舰船检测并行算法 被引量:8
20
作者 张临杰 张杰 +1 位作者 张晰 郎海涛 《遥感学报》 EI CSCD 北大核心 2016年第2期344-351,共8页
双参数恒虚警率CFAR(Constant False Alarm Rate)是舰船目标检测中的常用算法。近年来,合成孔径雷达(SAR)分辨率不断提高,SAR图像幅宽增大,并且在检测时希望尽量保持舰船轮廓以便后续的舰船目标识别。双参数CFAR算法虽然能满足目标检测... 双参数恒虚警率CFAR(Constant False Alarm Rate)是舰船目标检测中的常用算法。近年来,合成孔径雷达(SAR)分辨率不断提高,SAR图像幅宽增大,并且在检测时希望尽量保持舰船轮廓以便后续的舰船目标识别。双参数CFAR算法虽然能满足目标检测需求,但算法运行时间过长,不利于信息的及时处理。传统的MPI(Message Passing Interface)并行化解决方案在分配检测任务给各进程时,没有考虑因陆地掩膜,几何校正等预处理所导致的图像中待检测点分布不均。针对这一问题,本文提出改进的MPI并行化解决方案。与传统的MPI并行化解决方案相比,该方案能较为均衡地为各个进程分配检测任务。在集群计算机上的实验结果表明,改进后并行标准效率提高约43%。为应对机载SAR实时舰船目标检测的需求,在多核PC机上进行实验,结果表明,本文算法在多核PC机上也能有效地缩短检测时间,对实现机载SAR实时舰船目标检测有积极意义。 展开更多
关键词 舰船检测 双参数恒虚警率CFAR 合成孔径雷达SAR mpi并行化 检测窗口尺寸
原文传递
上一页 1 2 7 下一页 到第
使用帮助 返回顶部