期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
矢量多边形栅格化算法快速并行化方法研究 被引量:4
1
作者 陈振杰 周琛 +2 位作者 李飞雪 李满春 任沂斌 《遥感信息》 CSCD 2014年第5期3-8,12,共7页
本文在分析典型多边形栅格化算法的基础上,研究了串行算法并行化思路,提出一种多边形栅格化算法并行框架。该并行框架包括MPI与OpenMP的双层并行模式、顾及负载均衡的矢量多边形数据划分方法、多边形栅格化基本算子调用接口。利用本文... 本文在分析典型多边形栅格化算法的基础上,研究了串行算法并行化思路,提出一种多边形栅格化算法并行框架。该并行框架包括MPI与OpenMP的双层并行模式、顾及负载均衡的矢量多边形数据划分方法、多边形栅格化基本算子调用接口。利用本文形成的并行框架对扫描线算法、边界代数法进行了并行化,并利用大规模土地现状数据验证本文所提出的并行化方法的有效性。试验结果表明,该方法能够解决矢量多边形栅格化串行算法快速并行化的问题,并行化后的算法大大减少了矢量多边形转换时间,具有良好的并行效率。 展开更多
关键词 矢量栅格化 多边形 并行化 并行效率 地理信息系统
下载PDF
面向FT-M6678的对称矩阵特征值求解算法实现与优化
2
作者 于立 韩林 +1 位作者 罗有才 商建东 《计算机工程》 CAS CSCD 北大核心 2024年第2期51-58,共8页
目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计... 目前国产自主可控FT-M6678平台上没有对称矩阵特征值求解相关的实现,且平台上现有数学计算库不能很好地满足类似问题求解的需求。面向国产FT-M6678处理器,对对称矩阵特征值求解(SYEV)算法进行实现与优化,完善FT-M6678平台的线性代数计算库。通过对SYEV算法的实现过程以及运行热点的分析,基于FT-M6678平台进行编译优化、访存优化以及向量并行化优化,其中:编译优化是根据不同的编译选项指导编译器对程序优化以达到加速效果;访存优化包括缓存优化以及数据段与程序段的分配优化,用于提高矩阵数据的访存效率;向量并行化优化包括循环展开以及适配FT-M6678平台的单指令多数据流(SIMD)指令并行优化,用于提升程序的计算效率。在FT-M6678平台上对所实现并优化的算法进行正确性验证与优化性能分析,结果表明,算法能够正确通过LAPACK官方测试集测试,并且在FT-M6678平台上的加速效果可达到58.346倍,对比TMS320C6678平台速度可提升2.053倍。 展开更多
关键词 对称矩阵特征值 FT-M6678平台 热点分析 缓存优化 向量并行
下载PDF
循环自动并行化技术研究 被引量:1
3
作者 高雨辰 赵荣彩 +1 位作者 韩林 李雁冰 《信息工程大学学报》 2019年第1期82-89,共8页
伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越加复杂,程序员手工编写并行程序的难度也越来越大,自动并行化技术的研究显得愈发重要。首先通过现代体系结构支持的4种并行方式对循环自动并行化技术进... 伴随着并行体系结构和处理器芯片的发展,计算机系统提供的计算资源越来越多,结构越加复杂,程序员手工编写并行程序的难度也越来越大,自动并行化技术的研究显得愈发重要。首先通过现代体系结构支持的4种并行方式对循环自动并行化技术进行梳理,然后对自动并行化流程进行描述,提出4种循环并行方式并分别进行分析,最后对当前主流产品级编译器的自动并行化能力进行测试和分析,直观反映当前主流编译器的自动并行化能力。 展开更多
关键词 自动并行化 循环并行方式 向量并行
下载PDF
基于循环展开的子字并行指令自动生成
4
作者 王淼 王志英 +1 位作者 沈立 戴葵 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2008年第2期46-49,共4页
针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子字并行的循环进行优化,生成子字并行代码.首先识别出可并行的循环,然后通过循环展开、寄存器重命名、指... 针对向量编译的不足,提出一种基于循环展开的子字并行指令自动生成的方法.该方法利用传统的循环变换技术对多媒体应用中可以进行子字并行的循环进行优化,生成子字并行代码.首先识别出可并行的循环,然后通过循环展开、寄存器重命名、指令合并等技术来提升循环体基本块中的子字并行性.在TTA(trans-port triggered architecture)体系结构的编译框架下用该方法实现了子字并行指令的自动生成.实验表明该方法得到了较好的加速比. 展开更多
关键词 向量编译 子字并行 并行指令 循环展开 代码自动生成
下载PDF
基于Spark并行SVM参数寻优算法的研究 被引量:7
5
作者 何经纬 刘黎志 +1 位作者 彭贝 付星堡 《武汉工程大学学报》 CAS 2019年第3期283-289,共7页
针对传统支持向量机(SVM)参数寻优算法在处理大样本数据集时存在的寻优时间过长,内存消耗过大等问题,提出了一种基于Spark通用计算引擎的并行可调SVM参数寻优算法。该算法首先使用Spark集群将训练集以广播变量的形式广播给各个Executor... 针对传统支持向量机(SVM)参数寻优算法在处理大样本数据集时存在的寻优时间过长,内存消耗过大等问题,提出了一种基于Spark通用计算引擎的并行可调SVM参数寻优算法。该算法首先使用Spark集群将训练集以广播变量的形式广播给各个Executor,然后并行化SVM的参数寻优过程,并在在寻优过程中控制Task并行度,使各个Executor负载均衡,从而加快寻优速度。实验结果表明,本文提出的参数寻优算法,通过设置合理的Task并行度,可以在充分使用集群资源的同时提高最优参数的寻找速度,减少寻优时间。 展开更多
关键词 支持向量机 参数寻优 SPARK 并行度 负载均衡
下载PDF
基于相似度引导的流线种子点并行分布方法 被引量:2
6
作者 郭雨蒙 王文珂 李思昆 《系统仿真学报》 CAS CSCD 北大核心 2014年第9期2155-2159,共5页
流线是矢量场可视化的重要方法之一,现有的基于相似度引导的流线分布方法能较好体现矢量场特征,但运行速度缓慢。为解决此问题,提出了一种基于相似度引导流线种子点分布的并行优化方法,该方法生成备选种子点集,各线程并行获取种子点,并... 流线是矢量场可视化的重要方法之一,现有的基于相似度引导的流线分布方法能较好体现矢量场特征,但运行速度缓慢。为解决此问题,提出了一种基于相似度引导流线种子点分布的并行优化方法,该方法生成备选种子点集,各线程并行获取种子点,并积分生成流线。由于流线间相互影响,采用副本和缓存技术来避免线程间的读写冲突和等待问题,可得到满足相似距离约束的流线分布。实验结果表明,该方法能很好利用多核的并行计算优势,获得较高的并行加速比,有效提高流线的生成速度。 展开更多
关键词 矢量场可视化 流线分布 种子点并行 相似度度量
下载PDF
一种用于图形渲染的高性能SpMV专用加速器结构 被引量:1
7
作者 邓军勇 马青青 《小型微型计算机系统》 CSCD 北大核心 2021年第3期584-588,共5页
图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如何实现SpMV高性能计算成为了图形处理器设计中的关键性问题之一,然而,当前的SpMV运算存在并行度较差,资... 图形渲染中涉及的几何变换、投影变换、视口变换等需要大量稀疏矩阵向量乘法(Sparse Matrix-Vector Multiplication,SpM V)运算,如何实现SpMV高性能计算成为了图形处理器设计中的关键性问题之一,然而,当前的SpMV运算存在并行度较差,资源占用较多等问题.为提升硬件运算的性能,本文基于矩阵列向量的线性组合,充分利用数据的并行性,设计了一种专用加速器结构.实验表明,在XC6VLX550T开发板上与其他两种结构相比,速度分别能够提高28%、37%,资源占用率分别减少约48%、18%,应用于图形渲染中的变换操作后,速度分别能够提高28%、30%,资源占用率分别最高减少约48%、60%. 展开更多
关键词 图形渲染 稀疏矩阵向量乘法 并行度 矩阵列向量的线性组合
下载PDF
依赖距离主导的向量化方法研究
8
作者 丁丽丽 韩林 +3 位作者 王冬 张素平 王鹏翔 于海宁 《计算机应用研究》 CSCD 北大核心 2017年第5期1311-1315,共5页
向量寄存器的非满载使用方式为大量迭代次数不足的循环提供了向量化的机会,但也导致向量化的并行宽度不固定,传统的向量因子主导的依赖测试方法不再适用。提出了一种依赖距离主导的依赖测试方法,通过分析依赖图中所有依赖环的破环关键... 向量寄存器的非满载使用方式为大量迭代次数不足的循环提供了向量化的机会,但也导致向量化的并行宽度不固定,传统的向量因子主导的依赖测试方法不再适用。提出了一种依赖距离主导的依赖测试方法,通过分析依赖图中所有依赖环的破环关键边所携带的依赖距离,选择其中最小的依赖距离来决定并行宽度,破除依赖环,实现基于向量寄存器非满载使用方式的向量化。实验结果表明,该方法能够有效增加循环向量化的机会和提高向量寄存器的使用率,测试用例的向量化加速比平均提高14.6%。 展开更多
关键词 依赖测试 依赖距离 向量因子 并行宽度 向量化 向量寄存器
下载PDF
一种新颖的向量基-8布斯乘加器的设计
9
作者 张喆 张盛兵 黄小平 《微电子学与计算机》 CSCD 北大核心 2010年第11期20-24,共5页
提出一种新颖的部分冗余向量基-8布斯编码乘加器,快速地处理了部分积中的正负三倍被乘数项,并以亚字并行的方式支持单指令多数据流操作,可以完成16*16的有符号乘法运算以及两个8*8的有符号乘法运算.使用了4∶2压缩器进行部分积的压缩,... 提出一种新颖的部分冗余向量基-8布斯编码乘加器,快速地处理了部分积中的正负三倍被乘数项,并以亚字并行的方式支持单指令多数据流操作,可以完成16*16的有符号乘法运算以及两个8*8的有符号乘法运算.使用了4∶2压缩器进行部分积的压缩,并使用进位控制逻辑来控制短向量间的进位. 展开更多
关键词 向量基-8布斯 亚字并行 单指令多数据流 4∶2压缩器
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部