检索结果-维普期刊中文期刊服务平台

期刊文献⁺

任意字段

题名或关键词

题名

关键词

文摘

作者

第一作者

机构

刊名

分类号

参考文献

作者简介

基金资助

栏目信息

共找到3篇文章

< 1 >

每页显示 20 50 100

已选择0条

导出题录引用分析

统计分析

显示方式：

文摘详细列表

相关度排序被引量排序时效性排序

Optimizing Memory Access Efficiency in CUDA Kernel via Data Layout Technique: 1; 作者 Neda Seifi Abdullah Al-Mamun 《Journal of Computer and Communications》 2024年第5期124-139,共16页; Over the past decade, Graphics Processing Units (GPUs) have revolutionized high-performance computing, playing pivotal roles in advancing fields like IoT, autonomous vehicles, and exascale computing. Despite these adv... 展开更多; 关键词 Data Layout optimization CUDA performance optimization gpu Memory optimization Dynamic Programming Matrix Multiplication Memory Access Pattern optimization in CUDA; 下载PDF 职称材料

面向GPU计算平台的神经网络卷积性能优化被引量：3: 2; 作者李茂文曲国远 +1 位作者魏大洲贾海鹏《计算机研究与发展》 EI CSCD 北大核心 2022年第6期1181-1191,共11页; 图像检测、识别任务已经被应用在越来越多的生产生活场景中,基于卷积神经网络的方法凭借着精度高的特点被广泛应用.但是卷积神经网络存在着权重参数多、对算力要求高的问题,算力有限且型号多样的边缘计算设备使得这些应用在使用中受限.... 展开更多; 关键词通用矩阵乘 Winograd算法卷积神经网络性能优化 gpu; 下载PDF 职称材料

基于CUBLAS和CUDA的MNF并行算法设计与优化被引量：3: 3; 作者周海芳高畅方民权《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心 2017年第4期147-156,共10页; 为实现高光谱影像数据快速降维,基于nVidia的图像处理单元(graphic processing unit,GPU)研究最大噪声分数变换(Maximum Noise Fraction Rotation,MNF Rotation)降维算法的并行设计与优化,通过对加速热点并行优化,择优整合,设计并实现基... 展开更多; 关键词图像处理单元 gpu性能优化高光谱影像降维最大噪声分数变换协方差矩阵计算; 下载PDF 职称材料

	题名	作者	出处	发文年	被引量	操作
1	Optimizing Memory Access Efficiency in CUDA Kernel via Data Layout Technique	Neda Seifi Abdullah Al-Mamun	《Journal of Computer and Communications》	2024	0	下载PDF 职称材料
2	面向GPU计算平台的神经网络卷积性能优化	李茂文曲国远魏大洲贾海鹏	《计算机研究与发展》 EI CSCD 北大核心	2022	3	下载PDF 职称材料
3	基于CUBLAS和CUDA的MNF并行算法设计与优化	周海芳高畅方民权	《湖南大学学报（自然科学版）》 EI CAS CSCD 北大核心	2017	3	下载PDF 职称材料

已选择0条

导出题录引用分析

统计分析

使用帮助返回顶部