期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
半航空瞬变电磁L1范数自适应正则化反演 被引量:5
1
作者 何可 郭明 +2 位作者 胡章荣 易国财 王仕兴 《物探与化探》 CAS 北大核心 2021年第5期1338-1346,共9页
长导线源半航空瞬变电磁正则化反演正则项通常采用L2范数,其拟合结果较光滑,不能有效刻画层界面信息。针对层状介质陡变模型实现正则项为L1范数的反演算法,采用迭代重加权最小二乘法将原问题转化为L2正则化子问题求解,解决L1范数存在不... 长导线源半航空瞬变电磁正则化反演正则项通常采用L2范数,其拟合结果较光滑,不能有效刻画层界面信息。针对层状介质陡变模型实现正则项为L1范数的反演算法,采用迭代重加权最小二乘法将原问题转化为L2正则化子问题求解,解决L1范数存在不可导问题;采用OpenMP技术对雅可比矩阵并行计算,提高了反演速度;对自适应正则化因子分段迭代法的调整策略进行分析并改进,改进后的自适应正则化因子调整策略更适合半航空瞬变电磁L1正则反演算法。最后对电阻率进行反演并与Occam反演结果作比较,结果表明L1正则反演充分迭代后能够突出符合真实模型的电性界面,反演电阻率与模型真实值更接近。 展开更多
关键词 L1范数 自适应正则化反演 半航空瞬变电磁 迭代重加权最小二乘 openmp并行
下载PDF
电特大天线增益的高效求解
2
作者 孙旭敏 潘小敏 盛新庆 《北京理工大学学报》 EI CAS CSCD 北大核心 2016年第7期718-722,共5页
为解决电特大天线辐射特性计算效率低的问题,提出并实现了一种基于多极子的聚集思想快速求解远场信息的高效并行算法.根据目标在并行多层快速多极子中几何树的特征,提出高层远场模式直接聚集,并且按行并行插值的混合MPI-OpenMP并行计算... 为解决电特大天线辐射特性计算效率低的问题,提出并实现了一种基于多极子的聚集思想快速求解远场信息的高效并行算法.根据目标在并行多层快速多极子中几何树的特征,提出高层远场模式直接聚集,并且按行并行插值的混合MPI-OpenMP并行计算方案.将该算法应用于大射电天文望远镜FAST(five-hundred-meter aperture spherical telescope)的远场方向图和增益的计算,通过与等效电流直接积分法计算对比展示其计算精度与效率.结果验证该算法的远场辐射特性计算精度,且同等远场计算任务量下,平均单方向计算效率提高近万倍. 展开更多
关键词 并行多层快速多极子 MPI并行 openmp并行 电特大 增益
下载PDF
多核环境下的分子动力学模拟 被引量:2
3
作者 杨爱贤 吴江涛 《工程热物理学报》 EI CAS CSCD 北大核心 2009年第10期1639-1642,共4页
本文在多核环境下,使用OpenMP实现了经典分子动力学模拟程序的并行;同时对分子动力学模拟进行了两项主要的优化:分子排序及运用SIMD指令运算。在4核下获得了4.13倍的计算性能提升,将经典分子动力学模拟的模拟规模提高至4000分子... 本文在多核环境下,使用OpenMP实现了经典分子动力学模拟程序的并行;同时对分子动力学模拟进行了两项主要的优化:分子排序及运用SIMD指令运算。在4核下获得了4.13倍的计算性能提升,将经典分子动力学模拟的模拟规模提高至4000分子×10^7模拟总步数。 展开更多
关键词 分子动力学模拟 openmp并行 多核
下载PDF
BP算法的多核并行研究及其在枣无损检测的应用 被引量:1
4
作者 黄磊 王凡 吴素萍 《计算机工程与设计》 北大核心 2016年第9期2502-2506,共5页
为提高BP神经网络算法的训练速度,针对BP网络训练过程中层间数据传播,权值更新耗时大的问题进行深入分析。基于单机多核CPU系统环境,运用OpenMP并行技术,设计实现多核架构下基于OpenMP的BP并行算法。将该算法应用于基于高光谱图像技术... 为提高BP神经网络算法的训练速度,针对BP网络训练过程中层间数据传播,权值更新耗时大的问题进行深入分析。基于单机多核CPU系统环境,运用OpenMP并行技术,设计实现多核架构下基于OpenMP的BP并行算法。将该算法应用于基于高光谱图像技术的长枣糖度无损检测中,实验结果表明,与原串行算法相比,并行算法可以保证算法的相对误差较低,取得较好加速比,该算法在不同平台随着核数的增加,加速比也在增加,验证了其可行性、有效性和可扩展性。 展开更多
关键词 BP神经网络 openmp并行 多核 并行优化 无损检测
下载PDF
联合EGM2008模型重力异常和GOCE观测数据构建超高阶地球重力场模型SGG-UGM-1 被引量:20
5
作者 梁伟 徐新禹 +1 位作者 李建成 朱广彬 《测绘学报》 EI CSCD 北大核心 2018年第4期425-434,共10页
本文研究了联合卫星观测数据和重力异常数据确定超高阶重力场模型的理论方法,并使用EGM2008模型重力异常和GOCE(gravity field and ocean circulation explorer)观测数据构建了重力场模型SGG-UGM-1。重点研究了由球面格网重力异常快速... 本文研究了联合卫星观测数据和重力异常数据确定超高阶重力场模型的理论方法,并使用EGM2008模型重力异常和GOCE(gravity field and ocean circulation explorer)观测数据构建了重力场模型SGG-UGM-1。重点研究了由球面格网重力异常快速构建超高阶重力场模型的块对角最小二乘方法,将OpenMP技术引入到块对角最小二乘中以提高计算效率,并基于模拟数据验证了方法及算法和软件模块的正确性。采用本文制定的联合解算策略,利用GOCE重力卫星观测数据构建的220阶次法方程和EGM2008模型重力异常构建的2159阶次块对角法方程,联合求解了2159阶次的重力场模型SGG-UGM-1。将SGG-UGM-1与EGM2008、EIGEN-6C2、EIGEN-6C4等超高阶模型在频谱域内进行了比较分析,结果表明SGG-UGM-1相对参考模型的系数误差较小,且在220阶次内的系数精度相比EGM2008模型有了提高。采用中国与美国的GPS/水准数据和毛乌素测区的航空重力观测数据对这些模型进行了外符合精度的检验。检核结果表明,在中国区域,SGG-UGM-1模型大地水准面的精度在EIGEN-6C2和EIGEN-6C4两个模型之间,优于GOSG-EGM模型和EGM2008模型,与美国区域几个模型的精度相当。利用毛乌素测区的航空重力数据对几个模型进行了检核,结果表明SGG-UGM-1模型计算的重力扰动精度与EGM2008、EIGEN-6C4模型相当,优于GOSG-EGM模型和EIGEN-6C2模型。 展开更多
关键词 SGG-UGM-1 超高阶重力场模型 块对角最小二乘方法 openmp并行计算
下载PDF
浅层初至波旅行时层析并行算法及在地裂缝调查中的应用 被引量:6
6
作者 俞岱 孙渊 +2 位作者 路婧 王颖 边瑞峰 《物探与化探》 CAS CSCD 2017年第5期977-985,共9页
随着浅层地裂缝等地质灾害问题精细探测需求的增大,采用初至波速度层析反演技术,可以提供较高精度的浅层速度场的纵横向异常变化,可为识别地裂缝等地质灾害现象提供依据。通常,在采集参数一定的条件下,其反演成像精度受算法、网格类型... 随着浅层地裂缝等地质灾害问题精细探测需求的增大,采用初至波速度层析反演技术,可以提供较高精度的浅层速度场的纵横向异常变化,可为识别地裂缝等地质灾害现象提供依据。通常,在采集参数一定的条件下,其反演成像精度受算法、网格类型和剖分尺度的限制,在网格类型不变的条件下,要提高精度就必须加密正反演计算网格,改进算法,从而实现增量而不减速且高精度的效果。文中利用OpenMP的单机多核并行技术,探讨并实现了初至波层析成像并行算法,其中正演部分使用了改进的旅行时线性插值法,针对原有的按列计算,加入了按行计算,充分考虑到来自各方向的射线,使得计算出的旅行时最小,反演部分使用了能迅速稳定收敛的LSQR法以及正则化技术,通过理论和实际资料测试,其收敛速度快,反演结果较好。同时,在加密采样和缩小网格尺度的条件下,与常规串行算法相比,其运算速度和效率有较大提高,与商业软件比较,其运算效率差异不大,但反演结果的精度和可分辨性较好。 展开更多
关键词 初至波层析 正反演 openmp并行技术 计算速度 超线程技术 地裂缝
下载PDF
基于Woodbury+OpenMP的结构非线性地震反应并行分析方法 被引量:1
7
作者 余丁浩 李钢 《振动与冲击》 EI CSCD 北大核心 2023年第3期21-29,49,共10页
非线性地震反应分析已成为评价工程结构抗震性能的重要技术手段,随着结构规模的增大,非线性引发的大规模刚度矩阵迭代更新成为制约结构分析效率的关键因素。基于Woodbury公式的结构非线性地震反应分析法(Woodbury方法)是一类新型高效数... 非线性地震反应分析已成为评价工程结构抗震性能的重要技术手段,随着结构规模的增大,非线性引发的大规模刚度矩阵迭代更新成为制约结构分析效率的关键因素。基于Woodbury公式的结构非线性地震反应分析法(Woodbury方法)是一类新型高效数值分析方法,此类方法利用结构在地震作用下的局部非线性特征,能够在保证较高迭代收敛速率的同时有效避免结构刚度矩阵实时变化及由此导致的计算效率低下。然而,当前相关研究均基于串行计算模式,并未充分利用计算硬件的并行计算能力。引入OpenMP模式对Woodbury方法进行并行加速,提出了一种用于结构高效非线性地震反应分析的并行计算方法,该方法首先将每个迭代计算步划分为非线性相关系数矩阵计算更新、基于Woodbury公式的位移响应求解、单元状态确定3个主要计算部分,随后通过建立非线性相关系数矩阵的分块计算方法,将Woodbury公式的计算过程拆解为6个可并行的计算步,对各单元状态进行单独判定,分别建立了适用于三者的OpenMP并行加速策略,实现了算法的全过程并行优化。最后,通过对一个高层结构进行地震反应分析验证了该方法的准确性和高效性。 展开更多
关键词 地震反应分析 结构非线性 Woodbury公式 openmp并行计算
下载PDF
并行人工蜂群算法研究 被引量:3
8
作者 梅凯 火久元 常扣扣 《电子科技》 2018年第1期20-24,33,共6页
针对人工蜂群算法在处理高维度问题时收敛速度慢的问题,利用Open MP多线程技术和规约机制,并根据已改进的观察蜂来选择雇佣蜂的方式,提出了基于Open MP的并行人工蜂群算法(PCABC)。仿真实验分别在问题维度为100和200下进行来评估算法性... 针对人工蜂群算法在处理高维度问题时收敛速度慢的问题,利用Open MP多线程技术和规约机制,并根据已改进的观察蜂来选择雇佣蜂的方式,提出了基于Open MP的并行人工蜂群算法(PCABC)。仿真实验分别在问题维度为100和200下进行来评估算法性能,在4个逻辑处理器环境下,基于静态调度的并行人工蜂群算法的加速比最高可以达到3.95,效率可达98.65%。实验结果表明,PCABC并行人工蜂群算法在处理高维度复杂函数时,收敛速度和算法运行时间都有较大的提升。 展开更多
关键词 人工蜂群算法 人工蜂群算法改进 群体智能 并行化 openmp并行处理
下载PDF
缔合勒让德函数递推快速并行算法 被引量:2
9
作者 黄炎 王庆宾 +2 位作者 马越原 冯进凯 谭勖立 《海洋测绘》 CSCD 2019年第4期40-44,共5页
超高阶缔合勒让德函数的计算在地球重力场研究中是影响计算效率的关键因素之一,其计算耗时会随着截断阶数的增加而呈指数上涨。常用的缔合勒让德函数递推算法有标准前向列推法、标准前向行推法、Belikov递推法和跨阶次递推法。为有效提... 超高阶缔合勒让德函数的计算在地球重力场研究中是影响计算效率的关键因素之一,其计算耗时会随着截断阶数的增加而呈指数上涨。常用的缔合勒让德函数递推算法有标准前向列推法、标准前向行推法、Belikov递推法和跨阶次递推法。为有效提高缔合勒让德函数递推的计算效率,提出利用基于OpenMP的多核并行算法对上述方法进行并行加速,并通过提高数组维度的方法解决了递推运算并行化过程中的不适用问题。实验表明,所提并行算法在保持相同精度的前提下显著提高了缔合勒让德函数递推的计算效率,加速比在3倍以上,最高可达4.6倍。 展开更多
关键词 重力场位系数模型 缔合勒让德函数 递推算法 数组维度 变量私有化 openmp并行库
下载PDF
MPI+OpenMP算法在三维可压缩流场计算中的应用 被引量:1
10
作者 许啸 王学德 谭俊杰 《航空计算技术》 2011年第6期32-36,共5页
在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Sl... 在多核CPU集群并行体系结构下,采用MPI+OpenMP的混合并行算法,对可压缩流场进行数值模拟,并在计算时间上与MPI算法进行比较。流场计算的控制方程为Euler方程,空间离散采用Jameson中心差分格式,时间离散采用R-K法,并行模式采用Master/Slave模式。通过对M6机翼和某弹丸采用多种并行方法进行流场的数值模拟,得出MPI+OpenMP混合算法在一定条件下具有高效性的结论。 展开更多
关键词 有限体积法 并行计算 进程 线程 MPI+openmp混合算法
下载PDF
基于新离散公式和OpenMP优化的有限差分声波数值模拟 被引量:1
11
作者 郑如秋 王波涛 +1 位作者 冯永照 余卫江 《世界地质》 CAS 2020年第4期896-904,共9页
有限差分法算法是声波数值模拟算法中最广泛的数值计算方法。该方法具有计算速度快、占用内存相对较小、易于编程实现及模拟精度高等优点。规则网格下的有限差分算法相比于近年来提出的新的有限差分算法计算效率最高,消耗内存最少。然而... 有限差分法算法是声波数值模拟算法中最广泛的数值计算方法。该方法具有计算速度快、占用内存相对较小、易于编程实现及模拟精度高等优点。规则网格下的有限差分算法相比于近年来提出的新的有限差分算法计算效率最高,消耗内存最少。然而,引入PML边界,导致常规网格的有限差分离散公式复杂,计算过程需要对计算区域和边界区域进行判断,导致计算效率低。针对这个问题,笔者新推导的离散公式,形式简单,整个模拟区域计算代码一致,可以很好地解决这个问题。OpenMP并行算法,语言简洁和可移植性高,通过结合OpenMP并行算法,对模拟算法进一步优化,可以较大提高数值模拟的计算效率。 展开更多
关键词 有限差分 规则网格 离散公式 openmp并行算法 计算效率
下载PDF
一种利用Nystrom离散与FFT快速褶积的散射地震波并行计算方法
12
作者 徐杨杨 孙建国 商耀达 《地球物理学报》 SCIE EI CAS CSCD 北大核心 2021年第8期2877-2887,共11页
利用数值方法解Lippermann-Schwinger(L-S)方程的主要困难在于系数矩阵存储和线性方程组求解.这主要是因为L-S方程的积分部分是一个空间褶积,在离散后将导致一个满秩矩阵,进而形成一个大型或超大型代数方程组.因此,在利用L-S解决地震波... 利用数值方法解Lippermann-Schwinger(L-S)方程的主要困难在于系数矩阵存储和线性方程组求解.这主要是因为L-S方程的积分部分是一个空间褶积,在离散后将导致一个满秩矩阵,进而形成一个大型或超大型代数方程组.因此,在利用L-S解决地震波散射问题时,一般是利用散射级数法而非数值方法.然而,散射级数法的计算精度和收敛性强烈地依赖于速度扰动的强度,而克服这种依赖性的一个可能的途径就是对现有的数值方法进行改进或是建立新的数值求解方案.在这种思想指导下,首先对L-S方程进行改写,得到一个与原L-S方程等价的积分方程(等价L-S方程).然后,对等价L-S方程进行逐点归一化处理,并利用Nystrom法对经归一化处理的等价L-S方程(归一化等价L-S方程)进行离散,并用FFT计算空间褶积.之所以这样选择是由于归一化等价L-S方程经Nystrom法离散生成的系数阵为一个Toeplitz阵,可利用其Toeplitz性质降低存储空间;而FFT可以将矩矢空间褶积转化为乘积,且积分核部分只要计算一次即可.进一步,为节约正演计算时间,设计了进程级和线程级相结合的MPI+OpenMP并行模式.数值试验表明,与传统的积分方程数值算法相比,利用等价L-S方程、Nystrom离散和FFT快速褶积的计算方案可极大地降低存储需求,进而在保证精度的同时提高计算效率. 展开更多
关键词 L-S积分方程 快速傅里叶变换 Nystrom法 MPI+openmp并行
下载PDF
适用于任意网格的大规模并行CFD计算框架PHengLEI 被引量:27
13
作者 赵钟 张来平 +3 位作者 何磊 何先耀 郭永恒 徐庆新 《计算机学报》 EI CSCD 北大核心 2019年第11期2368-2383,共16页
针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器... 针对计算流体力学(Computational Fluid Dynamics,CFD)大规模并行计算的需要,我们设计了适用于任意网格类型的并行计算框架风雷(PHengLEI)软件,同时支持结构网格、非结构网格和重叠网格.为了实现并行通信与网格类型无关且与物理求解器开发者隔离,我们设计了通用的通信模式和一种基于网格块的“三合一”的数据交换模式,即将多块结构网格块、并行分区网格块和结构/非结构网格块间的交界面数据完全标准化为数据底层后,在数据底层统一进行交换,使得数据交换不依赖于网格类型和数据类型,从而实现任意网格类型并行通信模式的统一.作为气动数据生产的“数值风洞”,要求代码将并行隔离至底层,为此针对主流计算机系统的特点,设计了粗粒度MPI/OpenMP混合并行模式,领域专家只需关注求解器开发而无需关注并行通信,在提高可移植性、可扩展性的同时尽可能兼顾封装性.针对大规模并行计算的实际工程需求,设计了并行分区、大规模并行文件存储模式,以缩短前置处理和文件I/O时间.最后,分别基于结构网格、非结构网格和重叠网格,给出了工程应用领域的标模算例,以说明PHengLEI并行计算框架对不同网格类型的适应性.大规模网格测试结果表明,国产定制集群上16.38万核并行效率达83%以上,“天河二号”上近10万核并行效率达95%以上,展现了较好的可扩展性和并行计算效率. 展开更多
关键词 并行计算 MPI/openmp混合并行 CFD并行计算框架 PHengLEI 风雷软件 HyperFLOW
下载PDF
多核计算环境下快速排序并行算法的实现 被引量:3
14
作者 游佐勇 罗省贤 《电脑与电信》 2011年第1期60-62,共3页
研究了快速排序算法,并在其基础上提出了基于多核技术的OpenMP并行编程模型的快速排序算法。实验结果表明,该并行算法具有较高的并行加速比和并行效率。
关键词 多核处理器 openmp 并行算法 快速排序
下载PDF
基于多图形处理单元加速的各向异性弹性波正演模拟 被引量:3
15
作者 付小波 马中高 +2 位作者 余嘉顺 原健龙 韩超 《科学技术与工程》 北大核心 2018年第11期16-22,共7页
比较分析了在不同网格大小介质模型情况下,分别采用串行计算、CPU 16个线程并行计算和4块图形处理单元(GPU)并行计算进行各向异性弹性波动方程正演模拟的执行时间差异。发现在网格点为256~3的大模型上,用4块GPU的并行模拟计算相对16线... 比较分析了在不同网格大小介质模型情况下,分别采用串行计算、CPU 16个线程并行计算和4块图形处理单元(GPU)并行计算进行各向异性弹性波动方程正演模拟的执行时间差异。发现在网格点为256~3的大模型上,用4块GPU的并行模拟计算相对16线程并行计算与串行计算的加速分别为30倍与156倍。表明多GPU并行算法可以显著缩短数值模拟时间,而且模型网格越大,加速效果越显著。因此,在单机环境下进行大尺度模型的各向异性弹性波正演模拟,采用多GPU并行计算方式是一个合适的加速选择。 展开更多
关键词 各向异性弹性波 有限差分 正演模拟 openmp/GPU并行计算
下载PDF
大场景点云文件多核并行批量压缩方法研究 被引量:1
16
作者 樊星 段富 牛保宁 《太原理工大学学报》 北大核心 2017年第6期973-977,共5页
为了减少大场景点云文件无损压缩时间,避免数据处理过程中人工操作造成的时间浪费和输入失误,本文引入LASzip点云无损压缩算法和OpenMP并行编程技术,提出了在单机多核CPU系统环境下基于LASzip的大场景点云文件多核并行批量压缩算法。实... 为了减少大场景点云文件无损压缩时间,避免数据处理过程中人工操作造成的时间浪费和输入失误,本文引入LASzip点云无损压缩算法和OpenMP并行编程技术,提出了在单机多核CPU系统环境下基于LASzip的大场景点云文件多核并行批量压缩算法。实验结果显示,与串行算法相比,并行算法在压缩比不变的情况下压缩时间明显下降,取得了很好的加速比。当线程数为8时,压缩和解压缩加速比分别达到4.27和3.99,优化效果显著。 展开更多
关键词 点云文件 多核 openmp并行编程技术 LASzip无损压缩算法 并行批量压缩
下载PDF
多群粒子输运问题在多核集群系统上的混合并行计算
17
作者 迟利华 刘杰 +3 位作者 龚春叶 徐涵 蒋杰 胡庆丰 《计算机工程与科学》 CSCD 北大核心 2009年第11期94-97,共4页
本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个O... 本文分析了非结构网格多群粒子输运Sn方程求解的并行性,拟合多核机群系统的特点,设计了MPI/OpenMP混合程序,针对空间网格点采用区域分解划分,计算结点间基于消息传递MPI编程,每个MPI计算进程在计算过程中碰到关于能群的计算,就生成多个OpenMP线程,计算结点内针对能群进行多线程并行计算。数值测试结果表明,非结构网格上的粒子输运问题的混合并行计算能较好地匹配多核机群系统的硬件结构,具有良好的可扩展性,可以扩展到1024个CPU核。 展开更多
关键词 MPI/openmp混合并行计算 粒子输运 Sn方法 多核机群系统
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部