基于FPGA的卷积神经网络并行加速设计被引量：7

Convolutional neural network parallel acceleration design based on FPGA

下载PDF

导出

摘要为提升在资源、功耗受限的嵌入式平台上运行的深度卷积网络算法的速度和能效,提出一种基于现场可编程门阵列(FPGA)的卷积并行加速方案。利用卷积层与批归一化(batch normalization,BN)层融合减少计算复杂度;利用数据分片减少片上存储消耗;利用数据复用、并行计算提升运算速度,减少系统硬件开销;利用设计空间探索找到最符合硬件资源约束的计算并行度。实验结果表明,在100 MHz的工作频率下,加速器的峰值计算性能可以达到52.56 GFLOPS,性能是CPU的4.1倍,能耗仅为GPU的9.9%,与其它FPGA方案相比综合性能有一定的提升。 To improve the speed and energy efficiency of deep convolutional network algorithms running on embedded platforms with limited resources and power consumption,a convolutional parallel acceleration scheme based on field programmable gate array(FPGA)was proposed.Convolutional layer and batch normalization(BN)layer fusion was used to reduce computational complexity.Data fragmentation was used to reduce on-chip storage consumption.Data multiplexing and parallel calculation were utilized to increase the operation speed and to reduce the system hardware overhead.Design space exploration was used to find the computational parallelism that best met the hardware resource constraints.Experimental results show that at the working frequency of 100 MHz,the peak computing performance of the accelerator can reach 52.56 GFLOPS,which is 4.1 times better than the performance of the CPU and consumes only 9.9%of the GPU.Compared with other FPGA solutions,the overall performance has certain improvement.

作者龚豪杰周海冯水春 GONG Hao-jie;ZHOU Hai;FENG Shui-chun(Key Laboratory of Electronic Information Technology for Complex Aerospace Systems,National Space Science Center,Chinese Academy of Sciences,Beijing 101499,China;School of Computer Science and Technology,University of Chinese Academy of Sciences,Beijing 101408,China)

机构地区中国科学院国家空间科学中心复杂航天系统电子信息技术重点实验室中国科学院大学计算机科学与技术学院

出处《计算机工程与设计》北大核心 2022年第7期1872-1878,共7页 Computer Engineering and Design

基金中国科学院青年创新促进会基金项目(E0293401)。

关键词卷积神经网络现场可编程门阵列批归一化并行计算数据复用 convolution neural network FPGA batch normalization parallel computing data reuse

分类号 TP332 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1王彬,李海岩,王玉林.未来空天领域中的人工智能技术展望[J].指挥与控制学报,2020,6(4):349-355. 被引量：12
2吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：61
3张榜,来金梅.一种基于FPGA的卷积神经网络加速器的设计与实现[J].复旦学报（自然科学版）,2018,57(2):236-242. 被引量：15
4李小燕,张欣,闫小兵,任德亮,李彦青,傅长娟.基于FPGA的卷积神经网络加速系统[J].河北大学学报（自然科学版）,2019,39(1):99-105. 被引量：5
5赵烁,范军,何虎.基于FPGA的CNN加速SoC系统设计[J].计算机工程与设计,2020,41(4):939-944. 被引量：9

二级参考文献20

1郝雅楠,祝彬,朱华桥,王阳阳.美军导弹智能化发展态势研究[J].战术导弹技术,2020(1):15-21. 被引量：19
2马洪忠,彭建平,吴维,崔秀敏,张山.智能变形飞行器的研究与发展[J].飞航导弹,2006(5):8-11. 被引量：15
3席政.人工智能在航天飞行任务规划中的应用研究[J].航空学报,2007,28(4):791-795. 被引量：16
4钟义信.信息转换原理:信息、知识、智能的一体化理论[J].科学通报,2013,58(14):1300-1306. 被引量：29
5张博明,郭艳丽.基于光纤传感网络的航空航天复合材料结构健康监测技术研究现状[J].上海大学学报（自然科学版）,2014,20(1):33-42. 被引量：27
6谭铁牛.人工智能的历史、现状和未来[J].求是,2019,0(4):39-46. 被引量：57
7黄宜华.大数据机器学习系统研究进展[J].大数据,2015,1(1):28-47. 被引量：51
8王琼,贾阳,陶灼,吉龙,王昊予,赵蕾.火星移动智能体技术探讨[J].航天器工程,2015,24(4):27-32. 被引量：11
9钱卓昊.人工智能技术在电气自动化控制中的应用探究[J].中国高新技术企业,2016(16):51-52. 被引量：39
10陶九阳,吴琳,胡晓峰.AlphaGo技术原理分析及人工智能军事应用展望[J].指挥与控制学报,2016,2(2):114-120. 被引量：74

共引文献95

1李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：2
2杜忠文,李庚霖,蒋菡,褚江恒,伍俊.基于次级缓存的SDRAM调度策略的研究[J].电子测量技术,2023,46(14):37-42. 被引量：1
3张舰.父亲(外一首)[J].岁月,2000(7):60-60.
4任卫欣.基于FPGA的硬件加速系统[J].电子制作,2018,26(23):73-76. 被引量：1
5王昆,周骅.基于深度学习的实时识别硬件系统框架设计[J].电子技术应用,2018,44(10):11-14. 被引量：3
6陈辰,柴志雷,夏珺.基于Zynq7000 FPGA异构平台的YOLOv2加速器设计与实现[J].计算机科学与探索,2019,13(10):1677-1693. 被引量：20
7李雷孝,刘燕凤,高静.Smith-Waterman算法优化改进与Spark并行化研究[J].内蒙古农业大学学报（自然科学版）,2019,40(5):76-85. 被引量：2
8丁立德,胡怀湘.基于FPGA的CNN应用加速技术[J].信息技术,2019,43(12):110-115. 被引量：6
9林志文,林志贤,郭太良,林珊玲.基于FPGA加速的卷积神经网络识别系统[J].电子技术应用,2020,46(2):24-27. 被引量：4
10李炳剑,秦国轩,朱少杰,裴智慧.面向卷积神经网络的FPGA加速器架构设计[J].计算机科学与探索,2020,14(3):437-448. 被引量：6

同被引文献74

1徐志钮,律方成.多神经网络方法在变压器油色谱故障诊断中的应用[J].高压电器,2005,41(3):206-208. 被引量：8
2胡青,孙才新,杜林,李剑.核主成分分析与随机森林相结合的变压器故障诊断方法[J].高电压技术,2010,36(7):1725-1729. 被引量：46
3张琨,沈海波,张宏,蒋黎明,衷宜.基于灰色关联分析的复杂网络节点重要性综合评价方法[J].南京理工大学学报,2012,36(4):579-586. 被引量：26
4耿响,桂家祥,要磊,周丽萍.近红外光谱快速检测技术在纺织领域的应用[J].上海纺织科技,2013,41(4):25-27. 被引量：15
5石鑫,朱永利.深度学习神经网络在电力变压器故障诊断中的应用[J].电力建设,2015,36(12):116-122. 被引量：52
6刘航,王有元,梁玄鸿,白德盟,秦佳峰.基于多因素的变压器油中溶解气体体积分数预测方法[J].高电压技术,2018,44(4):1114-1121. 被引量：30
7李恒,张氢,秦仙蓉,孙远韬.基于短时傅里叶变换和卷积神经网络的轴承故障诊断方法[J].振动与冲击,2018,37(19):124-131. 被引量：290
8孙克强,王京力,廖佳,赵珍玉.近红外光谱技术在纺织产品检测中的应用[J].轻纺工业与技术,2019,48(8):189-191. 被引量：16
9马丽.面向数字图书馆用户隐私保护的匿名发布方法[J].信息技术,2019,43(9):88-91. 被引量：4
10吴艳霞,梁楷,刘颖,崔慧敏.深度学习FPGA加速器的进展与趋势[J].计算机学报,2019,42(11):2461-2480. 被引量：61

引证文献7

1马向南,杨涛,王云龙,袁虎强,刘志坚,何蔚.基于轻量化神经网络及模型压缩的变压器油色谱故障诊断方法[J].供用电,2023,40(5):84-91. 被引量：9
2韦苏伦,陶青川.基于HLS的MobileNet加速器实现[J].现代计算机,2023,29(8):91-97. 被引量：1
3周扬维,尹震宇,王军,张飞青,徐光远,徐福龙.基于ZYNQ平台的图像分类加速器设计与实现[J].小型微型计算机系统,2024,45(1):224-229.
4张恒瑞,姚丞韬,刘向.基于近红外光谱法和FPGA的纺织物成分检测系统[J].电子器件,2024,47(1):255-264.
5刘谦,王林林,周文勃.基于FPGA的YOLOv5s网络高效卷积加速器设计[J].电讯技术,2024,64(3):366-375.
6万强,王乾春,张春,李凌林.基于网络有向关系的节点重要性排序方法[J].信息技术,2024,48(8):151-157.
7叶亚峰,张宁,寇金桥,王昕.基于FPGA的VPX型智能加速模块的设计与实现[J].计算机技术与发展,2024,34(10):8-15.

二级引证文献10

1周超.变压器油介电强度测试装置的量值溯源方法的研究[J].中国仪器仪表,2023(12):73-76.
2唐智健,邱志斌,廖才波,周银彪,蔡木良,郝钰.外置式散热模块对配电变压器热点温升的影响[J].高压电器,2024,60(3):135-143. 被引量：2
3李旭,王文森,郭丽,王雪.基于多传感器融合的电力变压器内部放电定位与辨识技术[J].电网与清洁能源,2024,40(3):22-31. 被引量：2
4程林,周盟,郭家旭,罗传仙,张静,黄勤清,闫晨光.特高压换流变压器压力释放阀布置方式[J].电网与清洁能源,2024,40(4):44-53. 被引量：1
5张帝,宋兴荣,唐海国,李泽文,孙健,彭维馨.基于自适应VMD和WVD的配电网故障行波检测方法[J].电力科学与技术学报,2024,39(2):80-90.
6毛业栋,张春辉,陈杰.融合特征分析及机器学习的可演进变压器故障诊断模型[J].计算机工程,2024,50(8):379-388. 被引量：2
7曹正江,付文龙,文斌,花雅文.基于TVFEMD和多模型融合的变压器油中溶解气体体积分数预测方法[J].高压电器,2024,60(8):156-166.
8张兆闯,汪金刚,夏建华,文玉川,翁利听,马作甫,杨贺凯,窦金瑶.基于Bayes-CNN的变压器故障分类方法研究[J].电工电能新技术,2024,43(8):18-26.
9赖李洋,郑锫骏,梁海成,李华伟.路径规划算法的高层综合设计研究[J].电子与信息学报,2024,46(11):4132-4140.
10肖礼荣,肖齐,黄鑫.基于深度学习SSD的变电站设备故障视频识别[J].电子设计工程,2024,32(24):77-80.

1李济伟,商晴庆,孙建刚,董耀众,李伟良.基于区块链的联邦学习应用研究[J].电子测试,2022,36(12):138-140. 被引量：2
2闫晓明,朱立忠.改进YOLOv4的工控线路板缺陷检测方法[J].信息记录材料,2022,23(5):122-125.
3马亚运,洪蒙纳,李继庚,何正磊,满奕.基于弹性网络算法的多缸干燥部关键参数预测模型[J].造纸科学与技术,2022,41(2):1-6. 被引量：1
4伏志刚.关于地质工作中地质实验测试技术的思考[J].乡镇企业导报,2021(3):156-157.
5尹路珈,张一鸣,李东升,李慧霸,孟祥飞,宋振龙,李佳鑫,无.虚拟数据存储与计算[J].中国科技成果,2022,23(11).
6包为民,汪小卫.地月空间探索与开发的思考[J].宇航学报,2022,43(6):705-712. 被引量：21
7韩亮,张维静,胡娱欧,张晶,郭鸿业,陈启鑫.考虑虚拟电厂的电力系统灵活性提升方案研究[J].电力需求侧管理,2022,24(4):14-20. 被引量：5
8Stephen Ndubuisi NNAMCHI,Onyinyechi Adanma NNAMCHI,Janice Desire BUSINGYE,Maxwell Azubuike IJOMAH,Philip Ikechi OBASI.Modeling, simulation, and prediction of global energy indices: a differential approach[J].Frontiers in Energy,2022,16(2):375-392.
9曹晶晶,潘吉荣,张东圆,陈博睿,张玲,孟爱民,秦川.白细胞介素6基因敲除对阿尔茨海默病5×FAD模型小鼠β淀粉样蛋白沉积和认知的影响[J].中国医学科学院学报,2022,44(3):357-365. 被引量：5
10吴宗卓.基于深度强化学习的物联网动态聚类方案[J].微型电脑应用,2022,38(6):31-33. 被引量：2

计算机工程与设计

2022年第7期

浏览历史

内容加载中请稍等...

基于FPGA的卷积神经网络并行加速设计被引量：7

参考文献5

二级参考文献20

共引文献95

同被引文献74

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络并行加速设计 被引量：7

参考文献5

二级参考文献20

共引文献95

同被引文献74

引证文献7

二级引证文献10

相关作者

相关机构

相关主题

浏览历史

基于FPGA的卷积神经网络并行加速设计被引量：7