期刊文献+
共找到162篇文章
< 1 2 9 >
每页显示 20 50 100
间断Galerkin有限元隐式算法GPU并行化研究
1
作者 高缓钦 陈红全 +1 位作者 贾雪松 徐圣冠 《空气动力学学报》 CSCD 北大核心 2024年第2期21-33,I0001,共14页
为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题... 为了提高间断伽辽金(discontinuous Galerkin,DG)有限元方法的计算效率,围绕求解Euler方程,构建了基于图形处理器(graphics processing unit,GPU)并行加速的隐式DG算法。算法结合Roe格式进行空间离散,采用人工黏性法处理激波等间断问题,时间推进选用下上对称高斯-赛德尔(lower-upper symmetric Gauss-Seidel,LU-SGS)隐式格式。为了克服传统隐式格式固有的数据关联依赖问题,借助于本文提出的面向任意网格的单元着色分组技术,先给出了LUSGS隐式格式的并行化改造,使得隐式时间推进能按颜色组别依次并行,由于同一颜色组内算法已不存在数据关联,可以据此实现并行化。在此基础上,再结合DG算法局部紧致等特点,基于统一计算设备架构(compute unified device architecture,CUDA)编程模型,设计了依据单元的核函数,并构建了对应的线程与数据结构,给出了DG有限元隐式GPU并行算法。最后,发展的算法通过了多个二维和三维典型流动算例考核与性能测试,展示出隐式算法GPU加速的效果,且获得的计算结果能与现有的文献或实验数据接近。 展开更多
关键词 间断伽辽金方法 LU-SGS隐式格式 gpu并行化 单元着色分组 EULER方程
下载PDF
三维连续-非连续并行计算方法及其在岩爆过程模拟中的应用
2
作者 王学滨 杜轩 +3 位作者 薛承宇 陈双印 廖裴彬 余保健 《水资源与水工程学报》 CSCD 北大核心 2024年第1期177-185,共9页
随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方... 随着深部岩石工程的发展,岩爆变得越发严重。在岩爆的数值模拟方面,连续方法和非连续方法均具有一定的局限性。兼具二者优势的连续-非连续方法更具优势,且正在快速发展。基于CUDA对自主开发的三维拉格朗日元与离散元耦合连续-非连续方法进行了GPU并行加速。为了探索岩爆的机理和过程,模拟了不同静水压力、侧压系数和单元数目(最多达100×10^(4))条件下圆形洞室围岩V形坑的演化规律和单元弹射现象。考察了洞室围岩中裂纹的定量演化规律。研究表明:当静水压力较大时,基于芬纳公式的支护设计偏于不安全。由于V形坑的位置发生改变,V形坑的平均最大深度随着静水压力的增加先缓慢增加后快速增加。关于洞室围岩V形坑的模拟结果能与有关的实验结果、数值结果和现场观测结果吻合。上述研究很好地体现了岩爆并行计算较串行计算和商业软件计算的优势。 展开更多
关键词 岩爆 gpu并行计算 三维连续-非连续方法 V形坑 静水压力 侧压系数 洞室
下载PDF
应用球型差分模板的低秩有限差分法纯qP波逆时偏移
3
作者 杨礼胜 黄金强 +3 位作者 高国超 夏鹏 何云川 吴浩 《石油地球物理勘探》 EI CSCD 北大核心 2023年第5期1101-1114,共14页
各向异性介质拟声波方程正演模拟及逆时偏移存在伪横波干扰及数值不稳定现象,成像质量不佳;同时计算效率也是各向异性逆时偏移的重要影响因素。为此,提出一种兼具成像质量和计算效率的纯qP波逆时偏移成像方法。首先,从波动方程伪解析解... 各向异性介质拟声波方程正演模拟及逆时偏移存在伪横波干扰及数值不稳定现象,成像质量不佳;同时计算效率也是各向异性逆时偏移的重要影响因素。为此,提出一种兼具成像质量和计算效率的纯qP波逆时偏移成像方法。首先,从波动方程伪解析解和各向异性精确频散关系出发,分别构建了VTI和TTI介质纯qP波伪解析解波场延拓公式,避免了推导显式波动方程,无需对频散关系做平方处理,由此消除了波场模拟存在的伪横波干扰;然后,通过设计三维球型或二维圆形差分模板,并借助低秩有限差分法求解与模型相适应的差分系数,推导了基于低秩有限差分的纯qP波波场延拓公式,在时间方向延拓时,无需进行多次Fourier变换,降低了计算复杂度;最后,在此基础上,利用GPU并行计算正、反向地震波场,提高了逆时偏移的成像效率。典型二维和三维模型试算结果表明:该方法能够消除伪横波干扰,保证计算过程稳定,在二维和三维各向异性介质中都具有较强的适应性和较高的计算效率。 展开更多
关键词 各向异性介质 逆时偏移 纯qP 低秩有限差分 gpu 并行
下载PDF
CPU-GPU系统中基于剖分的全局性能优化方法 被引量:10
4
作者 张保 董小社 +3 位作者 白秀秀 曹海军 刘超 梅一多 《西安交通大学学报》 EI CAS CSCD 北大核心 2012年第2期17-23,共7页
针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优... 针对将应用移植到CPU-GPU异构并行系统上时优化策略各自分散、没有一个全局的指导思想的问题,提出了一种基于剖分的全局性能优化方法.该方法由优化策略库、剖分工具库和策略配置模块组成.优化策略库将应用移植到异构并行系统上的性能优化过程划分为访存级、内核加速级和数据划分级3级优化;针对3级优化剖分工具库提供了3级剖分机制,通过运行时的剖分技术获取剖分信息;策略配置模块根据所获取的信息指导用户在每级优化中选择合适的优化策略.实验证明,基于剖分的全局性能优化方法可以明确地指导将应用移植到CPU-GPU异构并行系统上的全局优化过程,利用该优化方法后,以矩阵相乘和傅里叶变换为例的应用性能提升明显,最终性能相对于访存级优化最高可提高30%左右. 展开更多
关键词 CPU-gpu异构并行系统 全局优化 3级优化 3级剖分
下载PDF
基于GPU的视频流人群实时计数 被引量:10
5
作者 姬丽娜 陈庆奎 +3 位作者 陈圆金 赵德玉 方玉玲 赵永涛 《计算机应用》 CSCD 北大核心 2017年第1期145-152,共8页
为了解决人群遮挡严重、光照突变等恶劣环境下人群计数准确率低的问题,提出基于混合高斯模型(GMM)和尺度不变特征变换(SIFT)特征的人群数量统计分析新方法。首先,基于GMM提取运动人群,并采用灰度共生矩阵(GLCM)和形态学方法去除背景中... 为了解决人群遮挡严重、光照突变等恶劣环境下人群计数准确率低的问题,提出基于混合高斯模型(GMM)和尺度不变特征变换(SIFT)特征的人群数量统计分析新方法。首先,基于GMM提取运动人群,并采用灰度共生矩阵(GLCM)和形态学方法去除背景中移动的小物体和较密集的噪声等非人群前景,针对GMM算法提出了一种效率较高的并行模型;接着,检测运动人群的SIFT特征点作为人群统计的基础,基于二值图像的特征提取大大减少了执行时间;最后,提出基于人群特征数和人群数量进行统计分析的新方法,选择不同等级的人群数量的数据集分别进行训练,统计得出平均单个特征点数,并对不同密度的行人进行计数实验。算法采用基于GPU多流处理器进行加速,并针对所提算法在统一计算设备架构(CUDA)流上任务的有效调度的方法进行分析。实验结果显示,相比单流提速31.5%,相比CPU提速71.8%。 展开更多
关键词 视频监控 gpu并行计算 人群计数 尺度不变特征变换 混合高斯模型 统一计算设备架构
下载PDF
CPU-GPU协同计算加速ASIFT算法 被引量:6
6
作者 何婷婷 芮建武 温腊 《计算机科学》 CSCD 北大核心 2014年第5期14-19,共6页
ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共... ASIFT(Affine-SIFT)是一种具有仿射不变性、尺度不变性的特征提取算法,其被用于图像匹配中,具有较好的匹配效果,但因计算复杂度高而难以运用到实时处理中。在分析ASIFT算法运行耗时分布的基础上,先对SIFT算法进行了GPU优化,通过使用共享内存、合并访存,提高了数据访问效率。之后对ASIFT计算中的其它部分进行GPU优化,形成GASIFT。整个GASIFT计算过程中使用显存池来减少对显存的申请和释放。最后分别在CPU/GPU协同工作的两种方式上进行了尝试。实验表明,CPU负责逻辑计算、GPU负责并行计算的模式最适合于GASIFT计算,在该模式下GASIFT有很好的加速效果,尤其针对大、中图片。对于2048*1536的大图片,GASIFT与标准ASIFT相比加速比可达16倍,与OpenMP优化过的ASIFT相比加速比可达7倍,极大地提高了ASIFT在实时计算中应用的可能性。 展开更多
关键词 特征提取 ASIFT SIFT CPU gpu协同工作
下载PDF
基于并行动态学习型免疫算法的永磁同步电机状态监测 被引量:7
7
作者 刘朝华 李小花 +1 位作者 张红强 周少武 《自动化学报》 EI CSCD 北大核心 2015年第7期1283-1294,共12页
为提高永磁同步电机(Permanent magnet synchronous machine,PMSM)系统参数辨识与状态监测效率,利用图形处理器(Graphics processing unit,GPU)并行计算与人工免疫技术相结合的研究方法,建立面向永磁同步电机系统基于GPU并行动态学习型... 为提高永磁同步电机(Permanent magnet synchronous machine,PMSM)系统参数辨识与状态监测效率,利用图形处理器(Graphics processing unit,GPU)并行计算与人工免疫技术相结合的研究方法,建立面向永磁同步电机系统基于GPU并行动态学习型免疫进化的参数估计与状态监测模型.为提高算法的动态跟踪性能,在抗体演化进程中,通过知识学习策略来引导算法进化过程,首先将抗体群划分为B细胞群、浆细胞群以及记忆细胞群,对处于不同进化群体中的抗体分别设计免疫综合学习策略、免疫反向学习策略和高斯学习策略,以增强抗体间的信息交互;接着,应用图形处理器并行计算技术进一步加速算法求解过程;最后,将所提算法应用于永磁同步电机系统参数辨识与状态监测中,实验表明,所提方法能同时准确地对电机的定子电阻、dq轴电感和永磁磁链等系统关键参数进行估计.依据参数变化实现对系统运行状态进行在线监测与预警.计算结果表明,GPU并行技术能大幅度提高计算效率. 展开更多
关键词 永磁同步电机 参数辨识 状态监测 人工免疫系统 动态学习 图形处理器并行计算
下载PDF
PHUI-GA: GPU-based efficiency evolutionary algorithm for mining high utility itemsets
8
作者 JIANG Haipeng WU Guoqing +3 位作者 SUN Mengdan LI Feng SUN Yunfei FANG Wei 《Journal of Systems Engineering and Electronics》 SCIE CSCD 2024年第4期965-975,共11页
Evolutionary algorithms(EAs)have been used in high utility itemset mining(HUIM)to address the problem of discover-ing high utility itemsets(HUIs)in the exponential search space.EAs have good running and mining perform... Evolutionary algorithms(EAs)have been used in high utility itemset mining(HUIM)to address the problem of discover-ing high utility itemsets(HUIs)in the exponential search space.EAs have good running and mining performance,but they still require huge computational resource and may miss many HUIs.Due to the good combination of EA and graphics processing unit(GPU),we propose a parallel genetic algorithm(GA)based on the platform of GPU for mining HUIM(PHUI-GA).The evolution steps with improvements are performed in central processing unit(CPU)and the CPU intensive steps are sent to GPU to eva-luate with multi-threaded processors.Experiments show that the mining performance of PHUI-GA outperforms the existing EAs.When mining 90%HUIs,the PHUI-GA is up to 188 times better than the existing EAs and up to 36 times better than the CPU parallel approach. 展开更多
关键词 high utility itemset mining(HUIM) graphics process-ing unit(gpu)parallel genetic algorithm(GA) mining perfor-mance
下载PDF
基于预处理共轭梯度迭代法的电力系统状态估计算法 被引量:6
9
作者 李建斌 王鹏程 +2 位作者 傅侃 方睿 董树锋 《电力系统自动化》 EI CSCD 北大核心 2021年第14期90-96,共7页
随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代... 随着中国电网省地一体化和输配一体化的不断发展,电力系统计算的维度越来越高。状态估计作为电力系统态势感知中的基础环节,需要保证其实时性,而加权最小二乘法是电力系统运用最广泛的状态估计方法。为此,针对加权最小二乘法在牛顿迭代过程中矩阵乘法和线性方程组求解耗时较长的特点,根据Krylov子空间方法中共轭梯度法的思想,设计了一种基于预处理共轭梯度迭代法的电力系统状态估计算法。该方法采用不完全LU分解法对原始线性方程组进行预处理,并采用图形处理器(GPU)并行加速技术对矩阵乘法、线性方程预处理和共轭梯度法迭代进行加速。算例分析表明了文中方法加速效果明显,内存和显存占用较低,经过不完全LU分解法预处理的线性方程组迭代次数少,能够满足大规模电力系统状态估计的实时性要求。 展开更多
关键词 状态估计 共轭梯度法 不完全LU分解 图形处理器并行加速
下载PDF
基于CUDA的并行雷达拼图算法研究
10
作者 韩丰 高嵩 +1 位作者 薛峰 李月安 《气象》 CSCD 北大核心 2023年第10期1246-1253,共8页
雷达组网拼图算法是强对流天气短时临近预报系统(Severe Weather Automatic Nowcasting,SWAN)的重要基础方法之一。提高拼图算法的效率,不仅可以提升现有SWAN临近算法序列的时效性,也能更好地应用高分辨率雷达数据,具有重要的实际意义... 雷达组网拼图算法是强对流天气短时临近预报系统(Severe Weather Automatic Nowcasting,SWAN)的重要基础方法之一。提高拼图算法的效率,不仅可以提升现有SWAN临近算法序列的时效性,也能更好地应用高分辨率雷达数据,具有重要的实际意义。采用中央处理器(central processing unit,CPU)和图形处理器(graphics processing unit,GPU)混合架构设计并行雷达拼图算法,其中CPU负责雷达数据的解析和调度GPU并行模块,GPU负责大规模数据的并行计算。通过分析计算统一设备架构(compute unified device architecture,CUDA)算法的并行开销和拼图算法的特点,提出并实现了GPU内存管理优化和数据交换流程优化方案,提高了组网拼图算法的效率。对比试验结果表明,基于CUDA的GPU并行拼图算法和SWAN中30线程并行的CPU算法相比,在全国1 km和500 m分辨率的拼图任务上,加速比分别达到3.52和6.82。综上,基于CUDA的并行拼图算法不仅可以提高SWAN短时临近算法序列的时效性,也为更高分辨率雷达资料的拼图提供了技术支持。 展开更多
关键词 组网拼图 gpu并行 计算统一设备架构(CUDA) 强对流天气短时临近预报系统(SWAN)
下载PDF
拉格朗日多项式逻辑回归分类算法并行计算优化 被引量:4
11
作者 谭雪敏 吴远峰 +1 位作者 袁正午 李军 《遥感信息》 CSCD 北大核心 2016年第1期96-101,共6页
针对拉格朗日多项式逻辑回归算法中逻辑回归参数计算复杂高、耗时长,直接制约其在大数据量遥感图像上应用的问题,提出了基于图形处理器GPU对算法进行数据级并行计算处理。算法首先利用已知的训练样本进行多元回归参数估算,然后利用得到... 针对拉格朗日多项式逻辑回归算法中逻辑回归参数计算复杂高、耗时长,直接制约其在大数据量遥感图像上应用的问题,提出了基于图形处理器GPU对算法进行数据级并行计算处理。算法首先利用已知的训练样本进行多元回归参数估算,然后利用得到的回归参数和光谱数据进行分类,能够获得较高的分类精度,其中算法步骤中的矩阵乘法、矩阵求逆、矩阵特征值计算采用CULA库函数并行实现。利用真实场景的高光谱图像对文中提出的并行计算优化方案实验验证,结果表明,该方法能够实现对多元回归参数计算加速200倍左右,对整个拉格朗日多项式逻辑回归分类算法计算加速60倍左右。 展开更多
关键词 拉格朗日多项式逻辑回归 遥感图像分类 gpu CULA 并行计算
下载PDF
GPU-ACCELERATED FEM SOLVER FOR THREE DIMENSIONAL ELECTROMAGNETIC ANALYSIS 被引量:2
12
作者 Tian Jin Gong Li +1 位作者 Shi Xiaowei Le Xu 《Journal of Electronics(China)》 2011年第4期615-622,共8页
A new Graphics Processing Unit(GPU) parallelization strategy is proposed to accelerate sparse finite element computation for three dimensional electromagnetic analysis.The parallelization strategy is employed based on... A new Graphics Processing Unit(GPU) parallelization strategy is proposed to accelerate sparse finite element computation for three dimensional electromagnetic analysis.The parallelization strategy is employed based on a new compression format called sliced ELL Four(sliced ELL-F).The sliced ELL-F format-based parallelization strategy is designed for hastening many addition,dot product,and Sparse Matrix Vector Product(SMVP) operations in the Conjugate Gradient Norm(CGN) calculation of finite element equations.The new implementation of SMVP on GPUs is evaluated.The proposed strategy executed on a GPU can efficiently solve sparse finite element equations,espe-cially when the equations are huge sparse(size of most rows in a coefficient matrix is less than 8).Numerical results show the sliced ELL-F format-based parallelization strategy can reach signi?cant speedups compared to Compressed Sparse Row(CSR) format. 展开更多
关键词 Finite Element Method(FEM) Graphics Processing Unit(gpu) parallelization strategy Conjugate Gradient Norm(CGN) Sliced ELL Four(sliced ELL-F)
下载PDF
The inversion of density structure by graphic processing unit(GPU) and identification of igneous rocks in Xisha area 被引量:1
13
作者 Lei Yu Jian Zhang +2 位作者 Wei Lin Rongqiang Wei Shiguo Wu 《Earthquake Science》 2014年第1期117-125,共9页
Organic reefs, the targets of deep-water petro- leum exploration, developed widely in Xisha area. However, there are concealed igneous rocks undersea, to which organic rocks have nearly equal wave impedance. So the ig... Organic reefs, the targets of deep-water petro- leum exploration, developed widely in Xisha area. However, there are concealed igneous rocks undersea, to which organic rocks have nearly equal wave impedance. So the igneous rocks have become interference for future explo- ration by having similar seismic reflection characteristics. Yet, the density and magnetism of organic reefs are very different from igneous rocks. It has obvious advantages to identify organic reefs and igneous rocks by gravity and magnetic data. At first, frequency decomposition was applied to the free-air gravity anomaly in Xisha area to obtain the 2D subdivision of the gravity anomaly and magnetic anomaly in the vertical direction. Thus, the dis- tribution of igneous rocks in the horizontal direction can be acquired according to high-frequency field, low-frequency field, and its physical properties. Then, 3D forward model- ing of gravitational field was carried out to establish the density model of this area by reference to physical properties of rocks based on former researches. Furthermore, 3D inversion of gravity anomaly by genetic algorithm method of the graphic processing unit (GPU) parallel processing in Xisha target area was applied, and 3D density structure of this area was obtained. By this way, we can confine the igneous rocks to the certain depth according to the density of the igneous rocks. The frequency decomposition and 3D inversion of gravity anomaly by genetic algorithm method of the GPU parallel processing proved to be a useful method for recognizing igneous rocks to its 3D geological position. So organic reefs and igneous rocks can be identified, which provide a prescient information for further exploration. 展开更多
关键词 Xisha area Organic reefs and igneous rocks -Frequency decomposition of potential field 3D inversionof the graphic processing unit gpu parallel processing
下载PDF
CUDA架构下的高清视频实时校正及显示系统 被引量:1
14
作者 姜柯 李艾华 +2 位作者 崔智高 冯国彦 苏延召 《光电子.激光》 EI CAS CSCD 北大核心 2013年第5期982-989,共8页
为了解决高清视频的畸变校正及显示的实时性问题,提出了一种CUDA架构下的并行加速方案。系统利用张正友标定方法获得摄像机的内部参数和畸变参数,并利用GPU的大规模并行计算能力加速校正过程。校正后,位于显存的图像数据直接利用OPENGL... 为了解决高清视频的畸变校正及显示的实时性问题,提出了一种CUDA架构下的并行加速方案。系统利用张正友标定方法获得摄像机的内部参数和畸变参数,并利用GPU的大规模并行计算能力加速校正过程。校正后,位于显存的图像数据直接利用OPENGL驱动进行显示。针对不同架构GPU片上资源限制不同,设计了一种并行划分参数自整定算法,保证了程序移植到不同GPU后能充分利用硬件资源,实现最佳性能。实验结果表明,本文设计的系统对传统串行处理系统的综合加速比最高可达39倍以上,对2 596×1 920分辨率视频下的处理帧率可达100F/s以上。 展开更多
关键词 畸变校正 高清视频 gpu加速 并行计算 参数自整定 OPENGL
原文传递
基于Cholesky分解的高光谱实时异常探测的GPU优化 被引量:2
15
作者 李萍 关桂霞 +2 位作者 吴太夏 彭波 黄晓 《传感器与微系统》 CSCD 2019年第3期7-10,共4页
高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表... 高光谱遥感图像具有超多波段、光谱分辨率高、信息量丰富等优点,但同时也给异常探测的实时处理带来了重大考验。基于Cholesky分解的高光谱实时异常探测算法很好地解决了实时性问题,而图形处理器(GPU)的并行优化设计则更高效。实验结果表明:提出的优化设计在保证探测精度的同时,进一步提升了计算效率,算法加速比最高达到3. 14倍,说明基于GPU的并行优化算法能够较好地满足高光谱遥感图像实时处理的应用需求。 展开更多
关键词 高光谱遥感图像 实时异常探测 CHOLESKY分解 图形处理器并行优化
下载PDF
基于CPU+GPU异构并行的QPSK开环解调方法研究
16
作者 顾祥龙 王元钦 +1 位作者 韩丙寅 张东 《遥测遥控》 2013年第4期53-57,共5页
以平方率前向定时算法和M&M频偏估计算法为基础,研究适用于CPU+GPU异构并行平台的QPSK开环解调方法,并对数据分块长度和异构并行效率进行分析和验证,通过理论推导和Matlab仿真,得出在频偏范围内最佳的数据分块长度,最终分别在只用CP... 以平方率前向定时算法和M&M频偏估计算法为基础,研究适用于CPU+GPU异构并行平台的QPSK开环解调方法,并对数据分块长度和异构并行效率进行分析和验证,通过理论推导和Matlab仿真,得出在频偏范围内最佳的数据分块长度,最终分别在只用CPU和采用CPU+GPU异构的两种架构下,对QPSK信号开环并行解调。实验结果证明,数据点数较多时,CPU+GPU异构并行解调效率明显提升。 展开更多
关键词 CPU+gpu异构并行 QPSK开环解调
下载PDF
并行计算技术在结构显式动力分析中的应用
17
作者 侯晓武 李志山 +2 位作者 乔保娟 刘春明 杨志勇 《土木建筑工程信息技术》 2015年第6期108-112,共5页
本文首先介绍了动力分析的求解方法,显式方法和隐式方法各自的优缺点。随后介绍了PKPM-SAUSAGE软件中对于梁、柱、剪力墙和楼板的模拟方法。由于时间步长和模型精细化处理后导致计算规模的增加,PKPM-SAUSAGE软件采用CPU+GPU并行计算技术... 本文首先介绍了动力分析的求解方法,显式方法和隐式方法各自的优缺点。随后介绍了PKPM-SAUSAGE软件中对于梁、柱、剪力墙和楼板的模拟方法。由于时间步长和模型精细化处理后导致计算规模的增加,PKPM-SAUSAGE软件采用CPU+GPU并行计算技术,同时优化模型网格质量,实现了动力弹塑性分析效率的提升。 展开更多
关键词 动力弹塑性分析 显式积分 CPU+gpu并行计算 SAUSAGE
下载PDF
基于深度学习的快速植物图像识别 被引量:30
18
作者 张雪芹 陈嘉豪 +1 位作者 诸葛晶晶 余丽君 《华东理工大学学报(自然科学版)》 CAS CSCD 北大核心 2018年第6期887-895,共9页
植物分类在形态、颜色和纹理上具有高度的相似性和密集的细节信息,传统的机器学习方法无法满足这些大样本的特征提取训练,识别种类与精度受到限制。深度学习可以有效地解决植物图像识别在种类数量、准确度和速度上的难点。本文提出了基... 植物分类在形态、颜色和纹理上具有高度的相似性和密集的细节信息,传统的机器学习方法无法满足这些大样本的特征提取训练,识别种类与精度受到限制。深度学习可以有效地解决植物图像识别在种类数量、准确度和速度上的难点。本文提出了基于优化的P-AlexNet模型的植物识别算法,基于卷积神经网络(CNN)中的AlexNet网络模型进行优化处理,提高模型的泛化能力、细节特征的表征能力以及识别精度。利用迁移学习热启动更新植物识别种类,利用GPU并行计算加速模型训练和图片识别速度。针对206类植物图片,训练得到验证集精度达到86.7%的模型。以此模型为基础,开发了一款智能植物图像识别平台,包含了Web网站以及Android和IOS的App应用。Web端实验测试结果表明,检测时间平均为1.282s,具有较高的准确性和泛化性以及快速的识别速度。 展开更多
关键词 植物识别 卷积神经网络 Alexnet模型 迁移学习 gpu并行计算
下载PDF
海冰与自升式海洋平台相互作用GPU离散元模拟 被引量:29
19
作者 狄少丞 季顺迎 《力学学报》 EI CSCD 北大核心 2014年第4期561-571,共11页
在海冰与自升式海洋平台结构的相互作用过程中,冰载荷是影响平台结构振动响应和疲劳寿命的重要因素.采用具有粘接--破碎效应的离散元模型,可对海冰与自升式海洋平台结构作用中的海冰破碎特征及相应冰载荷进行数值分析.针对自升式海洋平... 在海冰与自升式海洋平台结构的相互作用过程中,冰载荷是影响平台结构振动响应和疲劳寿命的重要因素.采用具有粘接--破碎效应的离散元模型,可对海冰与自升式海洋平台结构作用中的海冰破碎特征及相应冰载荷进行数值分析.针对自升式海洋平台的多桩腿结构特性及其冰载荷离散元分析的大规模计算需求,建立了基于GPU的并行算法并开发了相应的计算程序.为实现离散元分析的高效计算,采用网格排序方法创建单元邻居列表,以快速确定海冰单元间及其与平台结构间的接触模式和作用力.此外,还发展了球体单元与圆柱形结构在不同接触形式下的计算模型.为检验该离散元模型的有效性,对渤海锥体海洋平台结构的作用过程进行了计算,并与现场实测冰力数据进行了对比验证.在此基础上对多桩腿自升式平台结构的冰载荷进行了离散元分析,获得了海冰的破坏特性,确定了不同桩腿上的冰力时程.该模型可进一步应用于不同类型海洋结构的冰载荷分析,为冰区海洋平台的结构设计和现役平台结构的疲劳分析提供参考依据. 展开更多
关键词 海冰 自升式海洋平台 离散元模型 gpu并行计算
下载PDF
油气勘探地震资料处理GPU/CPU协同并行计算 被引量:21
20
作者 刘国峰 刘钦 +2 位作者 李博 佟小龙 刘洪 《地球物理学进展》 CSCD 北大核心 2009年第5期1671-1678,共8页
随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算... 随着图形处理器(Graphic Processing Unit:GPU)在通用计算领域的日趋成熟,使GPU/CPU协同并行计算应用到油气勘探地震资料处理中,对诸多大规模计算的关键性环节有重大提升.本文阐明协同并行计算机的思路、架构及编程环境,着重分析其计算效率得以大幅度提升的关健所在.文中以地震资料处理中的叠前时间偏移和Gazdag深度偏移为切入点,展示样机测试结果的图像显示.显而易见,生产实践中,时常面临对诸多算法进行算法精度和计算速度之间的折中选择.本文阐明GPU/CPU样机协同计算具有高并行度,进而可在算法精度与计算速度的优化配置协调上获得广阔空间.笔者认为,本文的台式协同并行机研制思路及架构,或可作为地球物理配置高性能计算机全新选择的一项依据. 展开更多
关键词 gpu/gpu协同并行计算 叠前时间偏移 Gazdag深度偏移
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部