期刊文献+
共找到120篇文章
< 1 2 6 >
每页显示 20 50 100
一种适应GPU的混合OLAP查询处理模型 被引量:9
1
作者 张宇 张延松 +1 位作者 陈红 王珊 《软件学报》 EI CSCD 北大核心 2016年第5期1246-1265,共20页
通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上... 通用GPU因其强大的并行计算能力成为新兴的高性能计算平台,并逐渐成为近年来学术界在高性能数据库实现技术领域的研究热点.但当前GPU数据库领域的研究沿袭的是ROLAP(relational OLAP)多维分析模型,研究主要集中在关系操作符在GPU平台上的算法实现和性能优化技术,以哈希连接的GPU并行算法研究为中心.GPU拥有数千个并行计算单元,但其逻辑控制单元较少,相对于CPU具有更强的并行计算能力,但逻辑控制和复杂内存管理能力较弱,因此并不适合需要复杂数据结构和复杂内存管理机制的内存数据库查询处理算法直接移植到GPU平台.提出了面向GPU向量计算特性的混合OLAP多维分析模型semi-MOLAP,将MOLAP(multidimensional OLAP)模型的直接数组访问和计算特性与ROLAP模型的存储效率结合在一起,实现了一个基于完全数组结构的GPU semi-MOLAP多维分析模型,简化了GPU数据管理,降低了GPU semi-MOLAP算法复杂度,提高了GPU semiMOLAP算法的代码执行率.同时,基于GPU和CPU计算的特点,将semi-MOLAP操作符拆分为CPU和GPU平台的协同计算,提高了CPU和GPU的利用率以及OLAP的查询整体性能. 展开更多
关键词 GPU 联机分析处理 内存数据库 协同计算 数组计算
下载PDF
基于忆阻器交叉阵列的卷积神经网络电路设计 被引量:6
2
作者 胡飞 尤志强 +1 位作者 刘鹏 邝继顺 《计算机研究与发展》 EI CSCD 北大核心 2018年第5期1097-1107,共11页
由于在神经形态计算方面具有优良的性能,忆阻器交叉阵列引起了研究者的广泛关注.利用忆阻器与传统器件提出了1个改进的忆阻器交叉阵列电路,可以准确地存储权重与偏置,结合相应的编码方案后可以运算点积操作,并将其用于卷积神经网络中的... 由于在神经形态计算方面具有优良的性能,忆阻器交叉阵列引起了研究者的广泛关注.利用忆阻器与传统器件提出了1个改进的忆阻器交叉阵列电路,可以准确地存储权重与偏置,结合相应的编码方案后可以运算点积操作,并将其用于卷积神经网络中的卷积核、池化与分类器部分.利用改进的忆阻器交叉阵列和基于卷积神经网络本身拥有的高容错性,还设计了1个忆阻卷积神经网络结构,可以完成1个基本卷积神经网络算法.在卷积操作后直接存储模拟形式的计算结果,使得卷积操作与池化操作之间避免了1次模数-数模转换过程.实验结果表明:设计的面积为0.852 5cm^2芯片上的运算性能是1台计算机速度的1 770倍,在面积基本相当的前提下,性能比前人设计的电路提高了7.7倍.设计存在可以接受的微小识别误差开销,与软件运行结果相比,此电路在每个忆阻器存储6b或8b信息的情况下平均识别误差分别只增加了0.039%与0.012%. 展开更多
关键词 神经形态计算 卷积神经网络 忆阻器 忆阻器交叉阵列 硬件加速
下载PDF
A small microring array that performs large complex-valued matrix-vector multiplication 被引量:5
3
作者 Junwei Cheng Yuhe Zhao +7 位作者 Wenkai Zhang Hailong Zhou Dongmei Huang Qing Zhu Yuhao Guo Bo Xu Jianji Dong Xinliang Zhang 《Frontiers of Optoelectronics》 EI CSCD 2022年第2期1-15,共15页
As an important computing operation,photonic matrix-vector multiplication is widely used in photonic neutral networks and signal processing.However,conventional incoherent matrix-vector multiplication focuses on real-... As an important computing operation,photonic matrix-vector multiplication is widely used in photonic neutral networks and signal processing.However,conventional incoherent matrix-vector multiplication focuses on real-valued operations,which cannot work well in complex-valued neural networks and discrete Fourier transform.In this paper,we propose a systematic solution to extend the matrix computation of microring arrays from the real-valued field to the complex-valued field,and from small-scale(i.e.,4×4)to large-scale matrix computation(i.e.,16×16).Combining matrix decomposition and matrix partition,our photonic complex matrix-vector multiplier chip can support arbitrary large-scale and complex-valued matrix computation.We further demonstrate Walsh-Hardmard transform,discrete cosine transform,discrete Fourier transform,and image convolutional processing.Our scheme provides a path towards breaking the limits of complex-valued computing accelerator in conventional incoherent optical architecture.More importantly,our results reveal that an integrated photonic platform is of huge potential for large-scale,complex-valued,artificial intelligence computing and signal processing. 展开更多
关键词 Photonic matrix-vector multiplication Complex-valued computing Microring array Signal/image processing
原文传递
基于神威平台的Floyd并行算法的实现和优化 被引量:5
4
作者 何亚茹 庞建民 +2 位作者 徐金龙 朱雨 陶小涵 《计算机科学》 CSCD 北大核心 2021年第6期34-40,共7页
求解全源最短路径的Floyd算法是许多实际应用基础上的关键构建块,由于其时间复杂度较高,串行Floyd算法不适用于大规模输入图计算,针对不同平台的并行Floyd算法设计可为解决现实问题提供有效帮助。针对Floyd算法与国产自主研发处理器匹... 求解全源最短路径的Floyd算法是许多实际应用基础上的关键构建块,由于其时间复杂度较高,串行Floyd算法不适用于大规模输入图计算,针对不同平台的并行Floyd算法设计可为解决现实问题提供有效帮助。针对Floyd算法与国产自主研发处理器匹配滞后的问题,首次提出基于神威平台的Floyd并行算法的实现和优化。根据SW26010处理器主-从核架构的特点,采用主从加速编程模型进行并行实现,并分析了影响该算法性能的关键因素,通过算法优化、数组划分和双缓冲技术进行优化,逐步提升算法性能。测试结果表明,与主核上串行算法相比,基于神威平台的Floyd并行算法在单个SW26010处理器上可以获得106倍的最高加速。 展开更多
关键词 SW26010 FLOYD算法 并行计算 数组划分
下载PDF
p-HPF并行编译系统核外计算的实现及优化策略 被引量:4
5
作者 丁文魁 汪剑平 +2 位作者 向华 李晓明 许卓群 《计算机学报》 EI CSCD 北大核心 1999年第10期1042-1049,共8页
文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优... 文中阐述了p-HPF编译系统中对核外计算的支持以及采取的优化策略.通过对编程模型的扩充和并行I/O模型的构造,p-HPF编译系统已能对核外数组进行有效的处理.通过采用数据筛选、行列优先、预取、文件与数组的一一映射等优化策略,使并行程序执行核外计算的效率得到了大幅度地提高.文中叙述了核外计算模型及其优化的设计思想与实现。 展开更多
关键词 核外计算 核外数组 数据筛选 并行编译系统
下载PDF
Numerical study of point spread function of a fast neutron radiography system based on scintillating-fiber array 被引量:2
6
作者 ZHANG FaQiang LI ZhengHong +5 位作者 YANG JianLun YE Fan WANG Zhen XIA GuangXin YING ChunTong LIU GuangJun 《Science China(Physics,Mechanics & Astronomy)》 SCIE EI CAS 2007年第6期698-706,共9页
For a scintillating-fiber array fast-neutron radiography system,a point-spread-function computing model was introduced,and the simulation code was developed. The results of calculation show that fast-neutron radiograp... For a scintillating-fiber array fast-neutron radiography system,a point-spread-function computing model was introduced,and the simulation code was developed. The results of calculation show that fast-neutron radiographs vary with the size of fast neutron sources,the size of fiber cross-section and the imaging geometry. The results suggest that the following qualifications are helpful for a good point spread function: The cross-section of scintillating fibers not greater than 200 μm×200 μm,the size of neutron source as small as a few millimeters,the distance between the source and the scintillating fiber array greater than 1 m,and inspected samples placed as close as possible to the array. The results give suggestions not only to experiment considerations but also to the estimation of spatial resolution for a specific system. 展开更多
关键词 fast neutron radiography scintillating-fiber array point spread function Monte Carlo simulation
原文传递
嵌入式GPU中可重构视口变换单元的设计与实现 被引量:4
7
作者 田汝佳 蒋林 +1 位作者 邓军勇 张雪婷 《小型微型计算机系统》 CSCD 北大核心 2018年第5期1074-1078,共5页
针对嵌入式设备图形处理器(GPU)在实现高性能、高质量图形效果时存在自身资源的限制,为了提高硬件资源复用及提高嵌入式GPU的灵活性,提出一种可重构视口变换单元的并行化设计方案.该方案采用16个轻核处理元(Processing Element)构成的... 针对嵌入式设备图形处理器(GPU)在实现高性能、高质量图形效果时存在自身资源的限制,为了提高硬件资源复用及提高嵌入式GPU的灵活性,提出一种可重构视口变换单元的并行化设计方案.该方案采用16个轻核处理元(Processing Element)构成的可重构阵列结构,通过重新配置PE的功能,可根据实际需求动态获取图形算法,以较低运算成本灵活地实现视口变换算法.基于Xilinx XC6VLX760 FPGA(现场可编程门阵列)完成了原型系统设计,电路工作频率可达110.09MHz,可重构方法与专用硬件相比,性能相当且更具灵活性. 展开更多
关键词 视口变换 可重构计算 阵列处理器 并行化
下载PDF
基于微尺度光学偶极阱的一维单原子阵列的实验制备
8
作者 刘岩鑫 王志辉 +4 位作者 管世军 王勤霞 张鹏飞 李刚 张天才 《物理学报》 SCIE EI CAS CSCD 北大核心 2024年第10期136-142,共7页
光学偶极阱俘获的中性原子阵列是多体物理、量子计算、量子模拟等领域的重要实验平台.本文详细介绍了制备包含40个铯原子的一维均匀单原子阵列的实验过程,包括偶极阱阵列的产生装置、原子阵列荧光成像以及偶极阱阵列均匀性优化.偶极阱... 光学偶极阱俘获的中性原子阵列是多体物理、量子计算、量子模拟等领域的重要实验平台.本文详细介绍了制备包含40个铯原子的一维均匀单原子阵列的实验过程,包括偶极阱阵列的产生装置、原子阵列荧光成像以及偶极阱阵列均匀性优化.偶极阱阵列的非均匀性主要是由声光偏转器(AOD)衍射效率的非线性和多频率射频信号在功率放大过程中的互调效应引起.测量偶极阱光强和受俘获原子光频移的起伏并反馈优化施加于AOD多频率射频信号的相位和振幅,将偶极阱阵列的强度均匀性优化为2%.另外,实验测量了偶极阱阵列内原子的振荡频率、装载率和寿命的均匀性.结果显示,振荡频率均匀性为2%;单原子平均装载率为58%,阱中原子的光谱一致性为3%;单原子暗阱平均寿命约为6(1) s,不同原子寿命的起伏为8%. 展开更多
关键词 量子计算 原子阵列 声光偏转器 互调
下载PDF
基于FPGA的可配置神经网络硬件设计 被引量:3
9
作者 訾晶 张旭欣 +1 位作者 王钰 金婕 《传感器与微系统》 CSCD 2020年第12期92-95,共4页
利用现场可编程门阵列(FPGA)器件可配置的优势,在FPGA上实现卷积神经网络,将训练后的网络参数按层、分块存放在FPGA的片上内存中,针对每层网络配置独立的计算阵列。利用高层次综合工具以及C++作为设计语言,调整优化硬件结构的设计,最后... 利用现场可编程门阵列(FPGA)器件可配置的优势,在FPGA上实现卷积神经网络,将训练后的网络参数按层、分块存放在FPGA的片上内存中,针对每层网络配置独立的计算阵列。利用高层次综合工具以及C++作为设计语言,调整优化硬件结构的设计,最后以CIFAR10数据集验证新结构的设计,将原有结构的图像分类效率提高了31%,同时降低了硬件资源占用。 展开更多
关键词 现场可编程门阵列 卷积神经网络 计算阵列 片上内存 高层次综合
下载PDF
一维Walsh变换的阵列协处理器的设计 被引量:3
10
作者 周六丁 程代杰 《计算机学报》 EI CSCD 北大核心 1993年第1期59-64,共6页
本文给出了一种用短序列Walsh变换芯片构成长序列Walsh变换阵列协处理器的方法.按此法,易用2~t片2~t长芯片构成2^(2t)长的Walsh变换的阵列协处理器,并且易用2^(t+1)片2~t长芯片及2^(2t)个蝶形运算器构成2^(2t+1)长的Walsh变换的阵列协... 本文给出了一种用短序列Walsh变换芯片构成长序列Walsh变换阵列协处理器的方法.按此法,易用2~t片2~t长芯片构成2^(2t)长的Walsh变换的阵列协处理器,并且易用2^(t+1)片2~t长芯片及2^(2t)个蝶形运算器构成2^(2t+1)长的Walsh变换的阵列协处理器. 展开更多
关键词 并行计算 阵列协处理器 WALSH变换
下载PDF
稀疏矩阵向量乘的FPGA设计与实现 被引量:3
11
作者 宋庆增 顾军华 《计算机工程》 CAS CSCD 北大核心 2011年第23期214-216,共3页
针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式... 针对传统的通用处理器(GPP)平台上执行稀疏矩阵向量乘计算效率低的问题,提出一种基于可重构计算平台的SpMXV协处理器设计。方案采用二叉树结构高度流水的数据流、IEEE-754的32 bit浮点数数据格式和对角存储格式。数据通路以流水线方式进行组织,能够优化计算性能。仿真结果表明,与GPP平台上的软件实现相比,通过硬件实现的设计能达到最高2.69倍的性能加速。 展开更多
关键词 可重构计算 协处理器 稀疏线性方程组 稀疏矩阵向量乘 归约阵列
下载PDF
基于人工蜂群算法的二维最小误差阈值分割 被引量:2
12
作者 张新明 冯文惠 +1 位作者 何文涛 王鲜芳 《广西大学学报(自然科学版)》 CAS 北大核心 2013年第5期1126-1133,共8页
鉴于人工蜂群算法(Artificial Bee Colony algorithm,ABC)常用于连续域,具有控制参数少、操作简单和易于实现等优点和二维最小误差阈值分割法复杂度高的问题,提出一种基于人工蜂群算法的二维最小误差阈值分割方法(Two-dimensional Minim... 鉴于人工蜂群算法(Artificial Bee Colony algorithm,ABC)常用于连续域,具有控制参数少、操作简单和易于实现等优点和二维最小误差阈值分割法复杂度高的问题,提出一种基于人工蜂群算法的二维最小误差阈值分割方法(Two-dimensional Minimum Error Thresholding based on Artificial Bee Colony algorithm,TMET-ABC)。针对离散域的二维最小误差阈值分割方法,对标准的ABC算法进行修改,构建离散域的人工蜂群算法;依据最小误差公式中变量的三种不同计算方式,提出了3种TMET-ABC方法:直接计算TMET-ABC、数组计算TMET-ABC和递推计算TMET-ABC。仿真结果表明,提出的3种方法能够在达到现有的二维最小误差阈值分割法的分割效果同时,大大加快运行速度,并且3种方法可应用于不同的分割场合。 展开更多
关键词 图像分割 二维阈值分割法 人工蜂群算法 最小误差 递推计算 数组计算
下载PDF
Design of a reconfigurable transcendental function generator
13
作者 Jiang Lin Lü Qing +2 位作者 Xie Xiaoyan Shan Rui Deng Junyong 《The Journal of China Universities of Posts and Telecommunications》 EI CSCD 2017年第1期96-102,共7页
In order to take into account the computing efficiency and flexibility of calculating transcendental functions, this paper proposes one kind of reconfigurable transcendental function generator. The generator is of a r... In order to take into account the computing efficiency and flexibility of calculating transcendental functions, this paper proposes one kind of reconfigurable transcendental function generator. The generator is of a reconfigurable array structure composed of 30 processing elements (PEs). The coordinate rotational digital computer (CORDIC) algorithm is implemented on this structure. Different functions, such as sine, cosine, inverse tangent, logarithmic, etc., can be calculated based on the structure by reconfiguring the functions of PEs. The functional simulation and field programmable gate array (FPGA) verification show that the proposed method obtains great flexibility with acceptable performance. 展开更多
关键词 reconfigurable computing reconfigurable transcendental function generator CORDIC array processor
原文传递
In-memory computing to break the memory wall 被引量:1
14
作者 Xiaohe Huang Chunsen Liu +1 位作者 Yu-Gang Jiang Peng Zhou 《Chinese Physics B》 SCIE EI CAS CSCD 2020年第7期28-48,共21页
Facing the computing demands of Internet of things(IoT)and artificial intelligence(AI),the cost induced by moving the data between the central processing unit(CPU)and memory is the key problem and a chip featured with... Facing the computing demands of Internet of things(IoT)and artificial intelligence(AI),the cost induced by moving the data between the central processing unit(CPU)and memory is the key problem and a chip featured with flexible structural unit,ultra-low power consumption,and huge parallelism will be needed.In-memory computing,a non-von Neumann architecture fusing memory units and computing units,can eliminate the data transfer time and energy consumption while performing massive parallel computations.Prototype in-memory computing schemes modified from different memory technologies have shown orders of magnitude improvement in computing efficiency,making it be regarded as the ultimate computing paradigm.Here we review the state-of-the-art memory device technologies potential for in-memory computing,summarize their versatile applications in neural network,stochastic generation,and hybrid precision digital computing,with promising solutions for unprecedented computing tasks,and also discuss the challenges of stability and integration for general in-memory computing. 展开更多
关键词 in-memory computing non-volatile memory device technologies crossbar array
下载PDF
基于扩展寄存器与片上网络的运算阵列设计 被引量:1
15
作者 张家杰 欧鹏 +2 位作者 俞政 于学球 虞志益 《计算机工程》 CAS CSCD 2013年第7期7-10,15,共5页
为提高多核处理器性能,在传统硬件加速部件的基础上,提出一种新型的运算阵列设计方案。将运算阵列与多核处理器的通信端口映射在扩展寄存器地址空间上,实现阵列与多核处理器的紧密耦合。通过片上网络连接各个运算单元,实现运算阵列的灵... 为提高多核处理器性能,在传统硬件加速部件的基础上,提出一种新型的运算阵列设计方案。将运算阵列与多核处理器的通信端口映射在扩展寄存器地址空间上,实现阵列与多核处理器的紧密耦合。通过片上网络连接各个运算单元,实现运算阵列的灵活配置和高度共享。在实验系统上实现1 024点快速傅里叶变换和H.264解码器,结果表明,与纯软件实现相比,该方案能使处理器性能和功耗都有所改善。 展开更多
关键词 多核处理器 运算阵列 扩展寄存器 片上网络 快速傅里叶变换 H 264解码器
下载PDF
Design and implementation of near-memory computing array architecture based on shared buffer 被引量:1
16
作者 SHAN Rui GAO Xu +3 位作者 FENG Yani HUI Chao CUI Xinyue CHAI Miaomiao 《High Technology Letters》 EI CAS 2022年第4期345-353,共9页
Deep learning algorithms have been widely used in computer vision,natural language processing and other fields.However,due to the ever-increasing scale of the deep learning model,the requirements for storage and compu... Deep learning algorithms have been widely used in computer vision,natural language processing and other fields.However,due to the ever-increasing scale of the deep learning model,the requirements for storage and computing performance are getting higher and higher,and the processors based on the von Neumann architecture have gradually exposed significant shortcomings such as consumption and long latency.In order to alleviate this problem,large-scale processing systems are shifting from a traditional computing-centric model to a data-centric model.A near-memory computing array architecture based on the shared buffer is proposed in this paper to improve system performance,which supports instructions with the characteristics of store-calculation integration,reducing the data movement between the processor and main memory.Through data reuse,the processing speed of the algorithm is further improved.The proposed architecture is verified and tested through the parallel realization of the convolutional neural network(CNN)algorithm.The experimental results show that at the frequency of 110 MHz,the calculation speed of a single convolution operation is increased by 66.64%on average compared with the CNN architecture that performs parallel calculations on field programmable gate array(FPGA).The processing speed of the whole convolution layer is improved by 8.81%compared with the reconfigurable array processor that does not support near-memory computing. 展开更多
关键词 near-memory computing shared buffer reconfigurable array processor convolutional neural network(CNN)
下载PDF
现代计算环境下的电磁模拟教学浅议
17
作者 刘瑜 廖同庆 《安庆师范学院学报(自然科学版)》 2011年第3期106-108,共3页
信息技术的发展,使得模拟计算成为解决大规模复杂电磁问题的一个重要手段,通过在电磁模拟教学中融入现代计算技术,如超长数组实现方法、算法并行化等,可以有效解决学生算法学习与实际应用之间的脱节状况,增加算法实践的机会,提高学生在... 信息技术的发展,使得模拟计算成为解决大规模复杂电磁问题的一个重要手段,通过在电磁模拟教学中融入现代计算技术,如超长数组实现方法、算法并行化等,可以有效解决学生算法学习与实际应用之间的脱节状况,增加算法实践的机会,提高学生在解决实际问题时对基本算法进行扩展和应用的能力。 展开更多
关键词 计算环境 电磁模拟教学 超长数组 并行计算
下载PDF
求解量子逻辑电路酉矩阵的快速方法
18
作者 李志强 胡佳佳 +4 位作者 张威 潘苏含 戴娟 杨冬晗 吴希 《量子电子学报》 CAS CSCD 北大核心 2020年第2期222-228,共7页
提出了一种生成量子逻辑电路酉矩阵的高效方法。首先利用量子电路的量子门运算规则生成真值表,再根据真值表与酉矩阵的映射关系构造量子电路的酉矩阵。而传统方法是利用量子门的拓扑变换规则生成其酉矩阵,再用量子电路中级联量子门的酉... 提出了一种生成量子逻辑电路酉矩阵的高效方法。首先利用量子电路的量子门运算规则生成真值表,再根据真值表与酉矩阵的映射关系构造量子电路的酉矩阵。而传统方法是利用量子门的拓扑变换规则生成其酉矩阵,再用量子电路中级联量子门的酉矩阵相乘构建量子电路酉矩阵,当量子电路规模较大时,传统方法涉及大量大矩阵的生成与乘积,产生巨大的时间开销。提出的新方法巧妙实现降维,从而大幅度提高算法效率。以GT电路和NCV电路为例,当量子线数高达8、门数为643时,较之前提出的方法速度提高数十万倍。 展开更多
关键词 量子计算 生成酉矩阵 数组 GT电路 NCV电路
下载PDF
基于可重构计算的纯方位目标要素解算方法
19
作者 宋奂寰 王树宗 《鱼雷技术》 2012年第3期236-240,共5页
目标运动要素解算所使用的数据处理技术的性能直接关系到潜艇作战系统的反应时间。目前,对目标运动要素解算问题的研究多集中在改进或使用性能更优越的估计算法。本文在现有算法基础上,利用可重构计算技术作为目标运动要素解算模块的加... 目标运动要素解算所使用的数据处理技术的性能直接关系到潜艇作战系统的反应时间。目前,对目标运动要素解算问题的研究多集中在改进或使用性能更优越的估计算法。本文在现有算法基础上,利用可重构计算技术作为目标运动要素解算模块的加速器,分析纯方位平差算法的输入数据流,通过脉动阵列简化标量运算,充分利用并行流水线机制,最终实现了纯方位平差法的可重构计算。试验结果证明了使用可重构计算能够提高算法的解算速度。 展开更多
关键词 纯方位目标 运动要素解算 可重构计算 流水线 脉动阵列
下载PDF
一种基于PVFS的并行核外计算方法
20
作者 唐剑琪 方滨兴 张宏莉 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2006年第5期682-684,共3页
针对传统的并行核外编程复杂、虚存系统性能不理想的问题,提出一种基于PVFS的并行核外计算方法,描述了其软件层次结构、数据访问策略及实现,为工作站机群用户提供了方便的编程接口以及核外数据的全局视图.实验结果表明,该方法扩展了可... 针对传统的并行核外编程复杂、虚存系统性能不理想的问题,提出一种基于PVFS的并行核外计算方法,描述了其软件层次结构、数据访问策略及实现,为工作站机群用户提供了方便的编程接口以及核外数据的全局视图.实验结果表明,该方法扩展了可有效解决的核外问题规模,大数据量时的计算性能优于虚存系统. 展开更多
关键词 核外计算 并行文件系统 核外数组 工作站机群
下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部