期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
基于GPU的稀疏矩阵向量乘优化 被引量:14
1
作者 白洪涛 欧阳丹彤 +2 位作者 李熙铭 李亭 何丽莉 《计算机科学》 CSCD 北大核心 2010年第8期168-171,181,共5页
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法。这些优化方法包括:(1)利... 针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法。这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取。实验分析表明,提出的各种手段起到了优化的作用。与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上。 展开更多
关键词 稀疏矩阵 压缩存储 图形处理器 统一计算架构 优化策略
下载PDF
基于预处理共轭梯度的大地电磁快速正演 被引量:9
2
作者 张继锋 汤井田 +1 位作者 王烨 肖晓 《中南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第5期1877-1882,共6页
针对大地电磁法有限元模拟中计算量大的特点,采用按行压缩存储方式的不完全LDLT预处理共轭梯度法快速求解大型复系数方程组。引入不完全LDLT预处理,提出快速求解(LDLT)-1r的方法,以加快预处理共轭梯度法的收敛速度。研究结果表明:当网... 针对大地电磁法有限元模拟中计算量大的特点,采用按行压缩存储方式的不完全LDLT预处理共轭梯度法快速求解大型复系数方程组。引入不完全LDLT预处理,提出快速求解(LDLT)-1r的方法,以加快预处理共轭梯度法的收敛速度。研究结果表明:当网格节点自由度超过1万时,压缩率达到99.9%,求解方程组时间在1 s以内,为进一步快速反演奠定了基础。 展开更多
关键词 压缩存储 预处理 共轭梯度 大地电磁
下载PDF
大范围点质量模型快速构建方法研究 被引量:3
3
作者 黄佳喜 王庆宾 +1 位作者 张超 冯进凯 《大地测量与地球动力学》 CSCD 北大核心 2017年第1期11-15,共5页
针对大范围点质量模型构建中遇到的大型线性方程解算的难题,提出基于窗口控制的残差点质量模型构建方法。将点质量模型由原来的稠密线性方程转化为稀疏线性方程,并在普通计算机上完成112 896阶稀疏线性方程的求解。以空中扰动引力计算为... 针对大范围点质量模型构建中遇到的大型线性方程解算的难题,提出基于窗口控制的残差点质量模型构建方法。将点质量模型由原来的稠密线性方程转化为稀疏线性方程,并在普通计算机上完成112 896阶稀疏线性方程的求解。以空中扰动引力计算为例,与传统的点质量模型和位系数模型的计算结果进行比较。结果表明,该方法能够在保证计算精度的同时有效扩大解算范围,提高解算效率。 展开更多
关键词 点质量模型 窗口半径 稀疏矩阵 压缩存储 扰动引力
下载PDF
建立电力系统状态空间方程的并行方法 被引量:2
4
作者 王克文 冶梦雨 刘艳红 《郑州大学学报(工学版)》 CAS 北大核心 2021年第1期15-20,共6页
为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转... 为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转换为对角占优形式。采用双共轭梯度稳定法(BICGSTAB)对处理后的大型稀疏矩阵迭代求解;矩阵的存储方式为行压缩稀疏存储;利用ILUTP与BICGSTAB的算法特性,实现了基于Open MP技术的并行计算;利用两个分别包含23台发电机和98台发电机的算例,发电机均采用六阶发电机模型,励磁调节模块与原动机调速块均为系统的实际参数,对比传统方法与优化方法求解状态矩阵方法的所用时间。结果表明,该方法能够加快大型电力系统状态空间的形成过程,其并行加速比接近于3,验证了所提方法的可行性及有效性。 展开更多
关键词 状态矩阵 双共轭梯度稳定法 不完全LU分解 压缩存储 Open MP
下载PDF
无人机集群作战中连续时间Markov链模型的求解方法 被引量:2
5
作者 黄树彩 谢家豪 +1 位作者 韦道知 张曌宇 《国防科技大学学报》 EI CAS CSCD 北大核心 2022年第4期43-51,共9页
针对无人机集群目标作战解析建模时在状态转移过程中计算速率低的问题,提出了一种基于行压缩存储的四阶Runge-Kutta法。根据无人机集群作战样式将无人机集群作战过程划分为三个阶段,并分阶段对无人机集群作战的状态转移过程建立连续时间... 针对无人机集群目标作战解析建模时在状态转移过程中计算速率低的问题,提出了一种基于行压缩存储的四阶Runge-Kutta法。根据无人机集群作战样式将无人机集群作战过程划分为三个阶段,并分阶段对无人机集群作战的状态转移过程建立连续时间Markov链模型。以无人机集群完成作战任务的可靠性作为求解指标,运用四阶Runge-Kutta法对Markov模型进行求解。由于求解过程中速率转移矩阵具有稀疏特性,采用基于行压缩存储的算法优化求解速率。仿真实验表明,运用连续时间Markov理论建立的无人机集群作战过程模型的有效性和可行性优于其他模型。同时,与其他算法及模型相比,该算法计算速率更高、能更好地满足结果精度的可靠性需求,进一步说明了本算法的优越性。 展开更多
关键词 无人机集群作战 连续时间Markov链 分阶段建模 压缩存储 四阶Runge-Kutta法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部