期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
5
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于GPU的稀疏矩阵向量乘优化
被引量:
14
1
作者
白洪涛
欧阳丹彤
+2 位作者
李熙铭
李亭
何丽莉
《计算机科学》
CSCD
北大核心
2010年第8期168-171,181,共5页
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法。这些优化方法包括:(1)利...
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法。这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取。实验分析表明,提出的各种手段起到了优化的作用。与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上。
展开更多
关键词
稀疏矩阵
行
压缩
存储
图形处理器
统一计算架构
优化策略
下载PDF
职称材料
基于预处理共轭梯度的大地电磁快速正演
被引量:
9
2
作者
张继锋
汤井田
+1 位作者
王烨
肖晓
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第5期1877-1882,共6页
针对大地电磁法有限元模拟中计算量大的特点,采用按行压缩存储方式的不完全LDLT预处理共轭梯度法快速求解大型复系数方程组。引入不完全LDLT预处理,提出快速求解(LDLT)-1r的方法,以加快预处理共轭梯度法的收敛速度。研究结果表明:当网...
针对大地电磁法有限元模拟中计算量大的特点,采用按行压缩存储方式的不完全LDLT预处理共轭梯度法快速求解大型复系数方程组。引入不完全LDLT预处理,提出快速求解(LDLT)-1r的方法,以加快预处理共轭梯度法的收敛速度。研究结果表明:当网格节点自由度超过1万时,压缩率达到99.9%,求解方程组时间在1 s以内,为进一步快速反演奠定了基础。
展开更多
关键词
按
行
压缩
存储
预处理
共轭梯度
大地电磁
下载PDF
职称材料
大范围点质量模型快速构建方法研究
被引量:
3
3
作者
黄佳喜
王庆宾
+1 位作者
张超
冯进凯
《大地测量与地球动力学》
CSCD
北大核心
2017年第1期11-15,共5页
针对大范围点质量模型构建中遇到的大型线性方程解算的难题,提出基于窗口控制的残差点质量模型构建方法。将点质量模型由原来的稠密线性方程转化为稀疏线性方程,并在普通计算机上完成112 896阶稀疏线性方程的求解。以空中扰动引力计算为...
针对大范围点质量模型构建中遇到的大型线性方程解算的难题,提出基于窗口控制的残差点质量模型构建方法。将点质量模型由原来的稠密线性方程转化为稀疏线性方程,并在普通计算机上完成112 896阶稀疏线性方程的求解。以空中扰动引力计算为例,与传统的点质量模型和位系数模型的计算结果进行比较。结果表明,该方法能够在保证计算精度的同时有效扩大解算范围,提高解算效率。
展开更多
关键词
点质量模型
窗口半径
稀疏矩阵
行
压缩
存储
扰动引力
下载PDF
职称材料
建立电力系统状态空间方程的并行方法
被引量:
2
4
作者
王克文
冶梦雨
刘艳红
《郑州大学学报(工学版)》
CAS
北大核心
2021年第1期15-20,共6页
为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转...
为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转换为对角占优形式。采用双共轭梯度稳定法(BICGSTAB)对处理后的大型稀疏矩阵迭代求解;矩阵的存储方式为行压缩稀疏存储;利用ILUTP与BICGSTAB的算法特性,实现了基于Open MP技术的并行计算;利用两个分别包含23台发电机和98台发电机的算例,发电机均采用六阶发电机模型,励磁调节模块与原动机调速块均为系统的实际参数,对比传统方法与优化方法求解状态矩阵方法的所用时间。结果表明,该方法能够加快大型电力系统状态空间的形成过程,其并行加速比接近于3,验证了所提方法的可行性及有效性。
展开更多
关键词
状态矩阵
双共轭梯度稳定法
不完全LU分解
行
压缩
存储
Open
MP
下载PDF
职称材料
无人机集群作战中连续时间Markov链模型的求解方法
被引量:
2
5
作者
黄树彩
谢家豪
+1 位作者
韦道知
张曌宇
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022年第4期43-51,共9页
针对无人机集群目标作战解析建模时在状态转移过程中计算速率低的问题,提出了一种基于行压缩存储的四阶Runge-Kutta法。根据无人机集群作战样式将无人机集群作战过程划分为三个阶段,并分阶段对无人机集群作战的状态转移过程建立连续时间...
针对无人机集群目标作战解析建模时在状态转移过程中计算速率低的问题,提出了一种基于行压缩存储的四阶Runge-Kutta法。根据无人机集群作战样式将无人机集群作战过程划分为三个阶段,并分阶段对无人机集群作战的状态转移过程建立连续时间Markov链模型。以无人机集群完成作战任务的可靠性作为求解指标,运用四阶Runge-Kutta法对Markov模型进行求解。由于求解过程中速率转移矩阵具有稀疏特性,采用基于行压缩存储的算法优化求解速率。仿真实验表明,运用连续时间Markov理论建立的无人机集群作战过程模型的有效性和可行性优于其他模型。同时,与其他算法及模型相比,该算法计算速率更高、能更好地满足结果精度的可靠性需求,进一步说明了本算法的优越性。
展开更多
关键词
无人机集群作战
连续时间Markov链
分阶段建模
行
压缩
存储
四阶Runge-Kutta法
下载PDF
职称材料
题名
基于GPU的稀疏矩阵向量乘优化
被引量:
14
1
作者
白洪涛
欧阳丹彤
李熙铭
李亭
何丽莉
机构
吉林大学计算机科学与技术学院
吉林大学符号计算与知识工程教育部重点实验室
出处
《计算机科学》
CSCD
北大核心
2010年第8期168-171,181,共5页
基金
国家自然科学基金重大项目基金(60496320
60496321)
+5 种基金
国家自然科学基金(60973089
60773097
60873148)
吉林省科技发展计划项目基金(20060532
20080107)
欧盟合作项目(155776-EM-1-2009-1-IT-ERAMUNDUS-ECW-L12)资助
文摘
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系列并行计算优化方法,从而完成了一种行压缩存储表示下的稀疏矩阵向量乘并行算法。这些优化方法包括:(1)利用Warp内线程天然同步特性,Half-warp完成结果向量一个元素的计算;(2)取整读取数据,实现合并访问;(3)输入向量放入纹理存储器,数据复用;(4)申请分页锁定内存,加速数据传输;(5)使用共享存储器,加速数据存取。实验分析表明,提出的各种手段起到了优化的作用。与已有的CUDPP和SpMV library中的CSR-vector算法相比,本算法获得了更高的存储器带宽和浮点运算吞吐量;整体性能比CPU串行执行版本快了3倍以上。
关键词
稀疏矩阵
行
压缩
存储
图形处理器
统一计算架构
优化策略
Keywords
Sparse matrix,Compressed sparse row,Graphics processing unit,Compute unified device architecture,Optimizations
分类号
TP311 [自动化与计算机技术—计算机软件与理论]
下载PDF
职称材料
题名
基于预处理共轭梯度的大地电磁快速正演
被引量:
9
2
作者
张继锋
汤井田
王烨
肖晓
机构
长安大学地质工程与测绘学院
中南大学信息物理工程学院
出处
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第5期1877-1882,共6页
基金
国家高技术研究发展计划("863"计划)项目(2007AA06Z134
2006AA06Z105)
国家自然科学基金资助项目(40874072)
文摘
针对大地电磁法有限元模拟中计算量大的特点,采用按行压缩存储方式的不完全LDLT预处理共轭梯度法快速求解大型复系数方程组。引入不完全LDLT预处理,提出快速求解(LDLT)-1r的方法,以加快预处理共轭梯度法的收敛速度。研究结果表明:当网格节点自由度超过1万时,压缩率达到99.9%,求解方程组时间在1 s以内,为进一步快速反演奠定了基础。
关键词
按
行
压缩
存储
预处理
共轭梯度
大地电磁
Keywords
compressed row storage
preconditioning
conjugate gradient
magnetotellurics
分类号
P631.3 [天文地球—地质矿产勘探]
下载PDF
职称材料
题名
大范围点质量模型快速构建方法研究
被引量:
3
3
作者
黄佳喜
王庆宾
张超
冯进凯
机构
信息工程大学地理空间信息学院
出处
《大地测量与地球动力学》
CSCD
北大核心
2017年第1期11-15,共5页
基金
国家973计划(6132220202)
国家自然科学基金(41504018)~~
文摘
针对大范围点质量模型构建中遇到的大型线性方程解算的难题,提出基于窗口控制的残差点质量模型构建方法。将点质量模型由原来的稠密线性方程转化为稀疏线性方程,并在普通计算机上完成112 896阶稀疏线性方程的求解。以空中扰动引力计算为例,与传统的点质量模型和位系数模型的计算结果进行比较。结果表明,该方法能够在保证计算精度的同时有效扩大解算范围,提高解算效率。
关键词
点质量模型
窗口半径
稀疏矩阵
行
压缩
存储
扰动引力
Keywords
point mass model
window control
sparse matrix
compressed sparse row(CSR)
disturbing gravity
分类号
P223 [天文地球—大地测量学与测量工程]
下载PDF
职称材料
题名
建立电力系统状态空间方程的并行方法
被引量:
2
4
作者
王克文
冶梦雨
刘艳红
机构
郑州大学电气工程学院
出处
《郑州大学学报(工学版)》
CAS
北大核心
2021年第1期15-20,共6页
基金
国家自然科学基金资助项目(61473265)。
文摘
为了缩减大规模电力系统小干扰稳定性分析的计算时间,对电力系统状态空间矩阵的快速形成方法进行优化研究。针对插入式建模技术,分析状态矩阵的形成过程;采用含双重阈值的不完全LU分解法(ILUTP),调整相关矩阵中非零元素的位置,将矩阵转换为对角占优形式。采用双共轭梯度稳定法(BICGSTAB)对处理后的大型稀疏矩阵迭代求解;矩阵的存储方式为行压缩稀疏存储;利用ILUTP与BICGSTAB的算法特性,实现了基于Open MP技术的并行计算;利用两个分别包含23台发电机和98台发电机的算例,发电机均采用六阶发电机模型,励磁调节模块与原动机调速块均为系统的实际参数,对比传统方法与优化方法求解状态矩阵方法的所用时间。结果表明,该方法能够加快大型电力系统状态空间的形成过程,其并行加速比接近于3,验证了所提方法的可行性及有效性。
关键词
状态矩阵
双共轭梯度稳定法
不完全LU分解
行
压缩
存储
Open
MP
Keywords
state matrix
BICGSTAB
incomplete LU
compressed row storage
Open MP
分类号
TM712 [电气工程—电力系统及自动化]
下载PDF
职称材料
题名
无人机集群作战中连续时间Markov链模型的求解方法
被引量:
2
5
作者
黄树彩
谢家豪
韦道知
张曌宇
机构
空军工程大学防空反导学院
出处
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022年第4期43-51,共9页
基金
国家自然科学基金资助项目(61703424)。
文摘
针对无人机集群目标作战解析建模时在状态转移过程中计算速率低的问题,提出了一种基于行压缩存储的四阶Runge-Kutta法。根据无人机集群作战样式将无人机集群作战过程划分为三个阶段,并分阶段对无人机集群作战的状态转移过程建立连续时间Markov链模型。以无人机集群完成作战任务的可靠性作为求解指标,运用四阶Runge-Kutta法对Markov模型进行求解。由于求解过程中速率转移矩阵具有稀疏特性,采用基于行压缩存储的算法优化求解速率。仿真实验表明,运用连续时间Markov理论建立的无人机集群作战过程模型的有效性和可行性优于其他模型。同时,与其他算法及模型相比,该算法计算速率更高、能更好地满足结果精度的可靠性需求,进一步说明了本算法的优越性。
关键词
无人机集群作战
连续时间Markov链
分阶段建模
行
压缩
存储
四阶Runge-Kutta法
Keywords
unmanned aerial vehicle swarm operation
continuous time Markov chain
phased modeling
row compressed storage
fourth-order Runge-Kutta method
分类号
TP732 [自动化与计算机技术—检测技术与自动化装置]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于GPU的稀疏矩阵向量乘优化
白洪涛
欧阳丹彤
李熙铭
李亭
何丽莉
《计算机科学》
CSCD
北大核心
2010
14
下载PDF
职称材料
2
基于预处理共轭梯度的大地电磁快速正演
张继锋
汤井田
王烨
肖晓
《中南大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
9
下载PDF
职称材料
3
大范围点质量模型快速构建方法研究
黄佳喜
王庆宾
张超
冯进凯
《大地测量与地球动力学》
CSCD
北大核心
2017
3
下载PDF
职称材料
4
建立电力系统状态空间方程的并行方法
王克文
冶梦雨
刘艳红
《郑州大学学报(工学版)》
CAS
北大核心
2021
2
下载PDF
职称材料
5
无人机集群作战中连续时间Markov链模型的求解方法
黄树彩
谢家豪
韦道知
张曌宇
《国防科技大学学报》
EI
CAS
CSCD
北大核心
2022
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部