一种基于FPGA的高性能卷积神经网络加速器的设计与实现被引量：3

Design and Implementation of a High Performance CNN Accelerator Based on FPGA

下载PDF

导出

摘要近年来,随着人工智能技术的发展,卷积神经网络(CNN)作为深度学习技术中的常用算法,在计算机视觉、语音识别及自然语言处理等诸多领域得到了广泛的应用。可编程门阵列(FPGA)因其高并行度和高灵活性等优势常被用于CNN的加速。基于此,本文对高性能CNN加速器的设计进行研究。文中采用DSP的级联、卷积核数据的“乒-乓”结构,以及多通道并行、特征图及卷积核数据的复用等方法,以期在资源受限的FPGA平台中为CNN的计算提供高性能加速。实验结果显示,本文的设计方法使用了较少的LUT资源,在Virtex7 VX690T上的峰值运算性能达到1.6TOPs,对VGG16网络加速时吞吐量达到1.334TOPs,具有较高的计算性能和较少的资源消耗。 Recently,with the development of the technology of artificial intelligence,convolution neural network,as a common algorithm in deep learning technology,has been widely used in some domains,such as computer vision,speech recognition and nature language processing. And field programmable gate array(FPGA) is often used in CNN accelerator,due to its high degree of parallelism and high flexibility and other advantages. Based on this, this paper studied the design of the high performance CNN accelerator based on FPGA. This paper used DSP cascading,convolution kernel ping-pong,multichannel parallel computing,feature map and convolution kernel multiplexing,and other technologies,in order to provide high performance acceleration for CNN computing in resource constrained FPGA platform.The test results showed that the design method in this paper reduced the number of LUT used. On the Virtex7 VX690T FPGA platform,the CNN accelerator can achieve a peak performance of 1.6TOPs,and a throughput of 1.334TOPs for VGG16 networks. It has better computing performance and less resource consumption.

作者曹学成廖湘萍李盈盈丁永林李炜 CAO Xuecheng;LIAO Xiangping;LI Yingying;DING Yonglin;LI Wei(China Electronics Technology Group Corporation 52nd Research Institute,Hangzhou 311100,China)

机构地区中国电子科技集团公司第五十二研究所

出处《智能物联技术》 2021年第5期11-17,共7页 Technology of Io T& AI

关键词卷积神经网络 FPGA DSP级联 CNN加速器 convolutional neural network FPGA DSP cascading CNN accelerator

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1781
2吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：61

二级参考文献8

1余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：614
2刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：71
3金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：37
4Yi ZHENG,QiLIU,Enhong CHEN,Yong GE,J. Leon ZHAO.Exploiting multi-channels deep convolutional neural networks for multivariate time series classification[J].Frontiers of Computer Science,2016,10(1):96-112. 被引量：22
5高君宇,杨小汕,张天柱,徐常胜.基于深度学习的鲁棒性视觉跟踪方法[J].计算机学报,2016,39(7):1419-1434. 被引量：30
6李红,刘芳,杨淑媛,张凯.基于深度支撑值学习网络的遥感图像融合[J].计算机学报,2016,39(8):1583-1596. 被引量：40
7常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：428
8周飞燕,金林鹏,董军.基于集成学习的室性早博识别方法[J].电子学报,2017,45(2):501-507. 被引量：8

共引文献1837

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：13
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：3
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10孙守强,李青青,肖舒玥,曾子明.基于情景感知的叙事型壁画场景式移动视觉搜索模型研究[J].数据分析与知识发现,2024,8(8):52-62.

同被引文献41

1李依肖,张方.基于牛顿迭代法的时域动载荷识别SISO修正算法[J].国外电子测量技术,2022,41(3):52-55. 被引量：1
2吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：61
3朱祥.基于隐马尔可夫模型和聚类的英语语音识别混合算法[J].计算机测量与控制,2020,28(5):175-179. 被引量：15
4张慧明.基于多核的卷积神经网络加速方法与系统实现[J].集成电路应用,2020,37(5):10-13. 被引量：2
5梅志伟,王维东.基于FPGA的卷积神经网络加速模块设计[J].南京大学学报（自然科学版）,2020,56(4):581-590. 被引量：3
6王恺,严迎建,郭朋飞,朱春生,蔡爵嵩.基于改进残差网络和数据增强技术的能量分析攻击研究[J].密码学报,2020,7(4):551-564. 被引量：8
7邹德芳,胡秦斌.基于树到串模型强化的神经机器翻译模型构建[J].计算机仿真,2021,38(2):344-347. 被引量：3
8贾承勋,赖华,余正涛,文永华,于志强.基于枢轴语言的汉越神经机器翻译伪平行语料生成[J].计算机工程与科学,2021,43(3):542-550. 被引量：6
9头旦才让,仁青东主,尼玛扎西,于永斌,邓权芯.基于改进字节对编码的汉藏机器翻译研究[J].电子科技大学学报,2021,50(2):249-255. 被引量：13
10杜朋,卢益清,韩长风.基于Transformer模型的商品评论情感分析[J].中文信息学报,2021,35(2):125-132. 被引量：8

引证文献3

1杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：4
2张立博,李昌伟,齐伟,王刚,戚鲁凤.神经网络训练处理器的浮点运算优化架构[J].计算机测量与控制,2023,31(6):176-182.
3邱臻博.一种基于FPGA的CNN硬件加速器实现[J].电子技术应用,2023,49(12):20-25.

二级引证文献4

1乔万俊,赵庆.基于端到端的英语翻译器语音自动纠正系统研究[J].自动化与仪器仪表,2023(3):240-244.
2黄弋石.沪语语音识别合成数学建模[J].数字技术与应用,2023,41(5):58-60.
3王志,张琪.基于Python的方言翻译系统设计[J].无线互联科技,2023,20(12):9-12.
4郭小娥.基于马尔科夫树时态标注算法的自动机器翻译系统研究[J].自动化与仪器仪表,2024(8):233-237.

1廖于翔,帅骁睿,李可维,孔祥伟,张正卿.一种基于迭代计算逻辑的正弦信号分析算法[J].船电技术,2022,42(3):48-51. 被引量：1
2党亚南,田照星,郭利强.车载激光雷达点云数据处理关键技术[J].计算机测量与控制,2022,30(1):234-238. 被引量：12
3马思远,黄大志,徐慧丽,付晓月.水面无人艇路径规划算法综述[J].自动化博览,2021,38(11):68-71. 被引量：3
4王骞,陶青川.基于AI神经网络加速芯片的模型量化算法[J].现代计算机,2021,27(36):28-33. 被引量：2
5林楷智,宗艳艳,孙珑玲.AI服务器PCIe拓扑应用研究[J].计算机工程与科学,2022,44(3):390-395. 被引量：3
6杨健健,马小琴.关联规则应用于护理领域的研究现状[J].护理管理杂志,2022,22(1):49-52. 被引量：7
7孟维成.计算机数据挖掘技术的开发及其应用分析[J].电子世界,2022(1):76-77. 被引量：8
8陈颖,刘洋,张成伟.星地空分复用高通量数据传输技术[J].无线电通信技术,2022,48(2):223-230.
9张登科,王兴伟,贾杰,李婕.智能网卡研究新进展[J].小型微型计算机系统,2022,43(2):399-405. 被引量：2
10王鹏,武俊鹏,高迪.基于FPGA的Streamlined NTRU Prime抗量子加密技术研究[J].无线电工程,2022,52(3):391-398. 被引量：2

智能物联技术

2021年第5期

浏览历史

内容加载中请稍等...

一种基于FPGA的高性能卷积神经网络加速器的设计与实现被引量：3

参考文献2

二级参考文献8

共引文献1837

同被引文献41

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于FPGA的高性能卷积神经网络加速器的设计与实现 被引量：3

参考文献2

二级参考文献8

共引文献1837

同被引文献41

引证文献3

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

一种基于FPGA的高性能卷积神经网络加速器的设计与实现被引量：3