-
题名基于“承影”GPGPU的张量处理器设计
- 1
-
-
作者
师雨洁
杨轲翔
刘旭东
何虎
-
机构
清华大学集成电路学院
-
出处
《微电子学与计算机》
2024年第5期109-116,共8页
-
文摘
针对神经网络对算力和通用性的需求进一步扩大,基于开源项目“承影”GPGPU,设计了张量处理器,可以对卷积、通用矩阵乘进行加速。首先,分析现有张量处理器设计方案及其对应算法,与直接进行卷积计算进行对比,分析性能差异。然后,提出基于三维乘法树结构的张量处理器设计,将其部署在Xilinx VCU128开发板上。在VCU128开发板上,张量处理器的工作频率为222 MHz。同时,开发了指数运算单元,辅助完成神经网络运算。在VCU128开发板上的工作频率为159 MHz。最后,利用编写汇编程序的方法,验证张量处理器的功能正确性。引入张量处理器后,预期运行时间明显减少。
-
关键词
通用图形处理器
张量处理器
卷积
通用矩阵乘
指数运算
-
Keywords
GPGPU
tensor core
convolution
general matrix multiplication
exponential operation
-
分类号
TN47
[电子电信—微电子学与固体电子学]
-