检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到8篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

基于NEON并行计算架构的矩阵乘法加速技术: 1; 作者祁俊雄程岳 +3 位作者刘作龙韩伟潘妍李晨卉《航空计算技术》 2024年第3期48-52,共5页; 当今计算机的信号处理需求与日俱增。随着ARM体系结构的迅速发展,基于ARM架构的国产处理器迅速崛起,研究针对ARM平台的通用信号处理加速技术具有重要意义。通过分析ARMv8架构以及NEON并行计算技术,以FT-2000/4(ARMv8架构)为实验平台,研... 展开更多; 关键词通用信号处理 ARMv8 FT-2000/4 NEON 矩阵乘法; 下载PDF 职称材料

面向飞腾处理器平台的快速卷积算法优化: 2; 作者赵亚飞杨耀功 +1 位作者王永刚魏继增《上海理工大学学报》 CAS CSCD 北大核心 2024年第6期610-619,共10页; 为解决卷积神经网络难以在计算资源受限设备上部署的问题,面向国产FT-2000/4多核处理器提出一种高性能的快速卷积算法FastInfer。采用分块策略优化通用矩阵乘法,将处理器访问频率高的数据存入更靠近处理器的缓存中,从而提高计算过程中... 展开更多; 关键词深度学习快速卷积算法并行计算通用矩阵乘法; 下载PDF 职称材料

基于“承影”GPGPU的张量处理器设计: 3; 作者师雨洁杨轲翔 +1 位作者刘旭东何虎《微电子学与计算机》 2024年第5期109-116,共8页; 针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于... 展开更多; 关键词通用图形处理器张量处理器卷积通用矩阵乘指数运算; 下载PDF 职称材料

基于RISC-V的神经网络加速器硬件实现被引量：1: 4; 作者鞠虎高营 +1 位作者田青周颖《电子与封装》 2023年第2期68-73,共6页; 针对第五代开放精简指令集(RISC-V)的人工智能(AI)处理器较少、先进的精简指令微处理器(ARM)架构供应链不稳定、自主可控性弱的问题,设计了以RISC-V处理器为核心的神经网络推理加速器系统级芯片(SoC)架构。采用开源项目搭建So C架构;基... 展开更多; 关键词 RISC-V 神经网络可变张量加速器通用矩阵乘深度学习编译器; 下载PDF 职称材料

GOTOBLAS一般矩阵乘法高效实现机制的研究被引量：8: 5; 作者蒋孟奇张云泉 +1 位作者宋刚李玉成《计算机工程》 CAS CSCD 北大核心 2008年第7期84-86,103,共4页; 对GOTOBLAS库(GOTO)的实现机制,尤其是其中的一般矩阵乘法部分的实现进行了分析。结合近年来的一些研究成果,讨论了如何高效地实现矩阵相乘操作,把存储层次对程序性能的影响提高到计算模型的高度。对比实验表明,GOTO库的性能远远高于没... 展开更多; 关键词 GOTOBLAS库一般矩阵乘法存储层次分块算法计算模型; 下载PDF 职称材料

高性能行任务散列法GPU一般稀疏矩阵-矩阵乘法被引量：4: 6; 作者汤洋赵达非 +1 位作者黄智濒戴志涛《北京邮电大学学报》 EI CAS CSCD 北大核心 2019年第3期106-113,共8页; 针对一般稀疏矩阵-矩阵乘法(SpGEMM)的性能问题,提出了一种基于任务分类和低延迟散列表的图形处理器上的加速SpGEMM算法RBSparse.该算法由一种低成本子任务复杂度预分析方法和一种低延迟共享内存上的散列表的方法组成,可达到最大效率.... 展开更多; 关键词稀疏矩阵-矩阵乘法图形处理器性能优化散列表共享内存; 原文传递

面向GPU计算平台的神经网络卷积性能优化被引量：4: 7; 作者李茂文曲国远 +1 位作者魏大洲贾海鹏《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1181-1191,共11页; 图像检测、识别任务已经被应用在越来越多的生产生活场景中,基于卷积神经网络的方法凭借着精度高的特点被广泛应用.但是卷积神经网络存在着权重参数多、对算力要求高的问题,算力有限且型号多样的边缘计算设备使得这些应用在使用中受限.... 展开更多; 关键词通用矩阵乘 Winograd算法卷积神经网络性能优化 GPU; 下载PDF 职称材料

面向GPU的通用矩阵乘法计算的容错研究: 8; 作者包冲张善从《微电子学与计算机》 2021年第1期22-26,32,共6页; 矩阵计算是GPU最擅长的工作之一,NVIDIA公司在CUDA中提供了线性代数库cuBLAS,用于矩阵和向量相关的计算.但是GPU容易受到电磁或者宇宙射线影响,而发生"位"反转问题,从而发生静默数据损坏错误.针对这个问题,利用基于算法的容... 展开更多; 关键词通用矩阵乘法基于算法的容错静默数据损坏浮点运算校验和检错与纠错; 下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

上一页 1 下一页到第页

使用帮助返回顶部