期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于FPGA的卷积神经网络硬件加速器设计 被引量:3
1
作者 黄沛昱 赵强 李煜龙 《计算机应用与软件》 北大核心 2023年第3期38-44,共7页
为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口... 为了提高中小规模设备卷积神经网络的推理速度,提出一种基于FPGA的卷积神经网络硬件加速器设计方案。针对模型中的卷积运算单元,该硬件加速器采用输入、输出二维循环展开和循环分块的方法,设计128个并行乘法器单元。模型的输入输出接口采用双缓存设计,通过乒乓操作,降低数据传输带来的时间延迟。同时,采用16位定点量化模型中权重参数,偏置参数和输入输出特征图的像素值。实验结果表明,与通用CPU酷睿i5-4440处理器相比,在COCO数据集上准确率几乎不变的情况下,计算性能提高5.77倍。在系统时钟频率为150 MHz时,硬件加速器的计算性能达到28.88 GOPS。 展开更多
关键词 卷积神经网络 FPGA 循环展开 循环分块 并行乘法器单元 双缓存设计
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部