期刊导航
期刊开放获取
cqvip
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
被引量:
6
1
作者
刘书勇
吴艳霞
+2 位作者
张博为
张国印
戴葵
《电子学报》
EI
CAS
CSCD
北大核心
2015年第8期1642-1650,共9页
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩...
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.
展开更多
关键词
矩阵三角化分解
三角化过程
并行算法
LU分解
现场可编程门阵列
下载PDF
职称材料
题名
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
被引量:
6
1
作者
刘书勇
吴艳霞
张博为
张国印
戴葵
机构
哈尔滨工程大学计算机科学与技术学院
出处
《电子学报》
EI
CAS
CSCD
北大核心
2015年第8期1642-1650,共9页
基金
国家自然科学基金(No.61003036)
计算机体系结构国家重点实验室开放课题(No.CARCH201301)
+1 种基金
博士后科研启动基金(No.LBHQ12134)
中央高校基本科研业务经费专项基金(No.HEUCF100606)
文摘
可重构计算系统成为加速计算密集型应用的重要选择之一.在众多受到关注的计算密集型问题中,矩阵三角化分解作为典型的基础类应用始终处于研究的核心地位,在求解线性方程组、求矩阵特征值等科学与工程问题中有重要的研究价值.本文面向矩阵三角化分解中共有的三角化计算过程,通过分析该过程的线性计算规律,提出一种适于硬件并行实现的子矩阵更新同一化算法及矩阵三角化计算FPGA(Field Programmable Gate Array)并行结构.针对LU矩阵三角化分解在并行结构模板上的高性能实现及优化方法开展了研究.理论分析表明,该算法针对矩阵三角化计算过程具有更高的数据并行性与流水并行性;实验结果表明,与通用处理器的软件实现相比,根据该算法实现的矩阵三角化分解FPGA并行结果在关键计算性能上可以取得10倍以上的加速比.
关键词
矩阵三角化分解
三角化过程
并行算法
LU分解
现场可编程门阵列
Keywords
matrix triangularization decomposition
triangularization process
parallel algorithm
LU decomposition
field programmable gate array
分类号
TP102.1 [自动化与计算机技术—控制理论与控制工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于可重构计算系统的矩阵三角化分解硬件并行结构研究
刘书勇
吴艳霞
张博为
张国印
戴葵
《电子学报》
EI
CAS
CSCD
北大核心
2015
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部