基于FPGA的量化推理CNN加速系统研究与设计被引量：1

Research and Design of CNN Acceleration System for Quantitative Reasoning Based on FPGA

下载PDF

导出

摘要基于FPGA的量化推理设计了CNN加速系统;通过对主流的深度神经网络结构的运算特性分析,使用(Density-Based Spatial Clustering of Applications with Noise)DBSCAN聚类算法截取阈值的INT8量化推理方法,融合深度神经网络全连接,减少数据运算位宽和压缩网络大小,在准确率损失很小的情况下有效压缩了网络结构;基于LeNet-5、VGG-16与ResNet-50的CNN网络结构,设计出量化CNN加速系统并进行校验;实验结果表明,网络参数和输入特征数据量化精度为8-bits时,网络压缩率在25%的情况下,网络准确率的损失低于1%;在Xilinx XC7K325平台上量化推理CNN加速系统的运行频率为450 MHz,与其他相似类型的加速器比较,其GOPS性能提升2倍。 Based on the quantitative reasoning of FPGA,the Convolutional Neural Network(CNN)acceleration system is designed.Through the analysis of the operation characteristics of the mainstream deep neural network structure,the INT8 quantitative reasoning method of intercepting the threshold using the density based spatial clustering of applications with noise(DBSCAN)clustering algorithm is used to integrate the full connection of the deep neural network,reduces the data operation bit width and compresses the network size,and effectively compresses the network structure with little loss of accuracy.Based on the CNN network structure of LeNet-5,VGG-16 and ResNet-50,a quantitative CNN acceleration system is designed and verified.The experimental results show that,when the quantization accuracy of network parameters and input characteristic data is 8-bits,the loss of network accuracy is less than 1%as the network compression rate is 25%.On Xilinx xc7k325 platform,the running frequency of CNN acceleration system is 450 MHz.Compared with other similar accelerators,the GOPs performance is improved by 2 times.

作者何家俊苏成悦罗荣芳施振华陈堆钰罗俊丰 HE Jiajun;SU Chenyue;LUO Rongfang;SHI Zhenhua;CHEN Duiyu;LUO Junfeng(School of Physics and Optoelectronic Engineering,Guangdong University of Technology,Guangzhou 510006,China)

机构地区广东工业大学物理与光电工程学院

出处《计算机测量与控制》 2022年第9期162-169,共8页 Computer Measurement &Control

关键词卷积神经网络量化推理硬件加速 FPGA DBSCAN convolutional neural network(CNN) quantization hardware acceleration FPGA DBSCAN

分类号 TP331.2 [自动化与计算机技术—计算机系统结构] TN47 [自动化与计算机技术—计算机科学与技术]

引文网络
相关文献

参考文献5

1许思琦.基于Linux的FPGA+ARM高速数据采集系统设计[J].计算机测量与控制,2017,25(4):172-175. 被引量：3
2王海,阙沛文.超声信号采集模块的设计[J].计算机测量与控制,2007,15(6):816-819. 被引量：2
3巩杰,赵烁,何虎,邓宁.基于FPGA的量化CNN加速系统设计[J].计算机工程,2022,48(3):170-174. 被引量：2
4满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9
5马晓光,蒋占军.卷积神经网络图像识别算法的FPGA加速优化研究[J].兰州交通大学学报,2021,40(5):51-57. 被引量：3

二级参考文献18

1许永和.EZ-USB FX系列单片机..USB外围设备设计与应用.北京航空航天大学出版社,2002.. 被引量：1
2Cypress Semiconductor Corporation.EZ-USB FX2 Technical Reference Manual v2.1[Z].2001. 被引量：1
3Altera Corporation.Cyclone Device Handbook,Volume 1[Z].2005. 被引量：1
4付莹,黄晓晴,缪永生.通用测试软件开发平台的设计方法及应用[J].计算机测量与控制,2014,22(12):4190-4193. 被引量：10
5单越.有关应用项目管理软件的开发与设计探究[J].决策与信息,2015(15):194-194. 被引量：2
6马宇栋.大型软件项目管理的流程设计及分析[J].电子技术与软件工程,2015(22):64-64. 被引量：3
7余子健,马德,严晓浪,沈君成.基于FPGA的卷积神经网络加速器[J].计算机工程,2017,43(1):109-114. 被引量：36
8刘慧.软件开发项目管理信息系统研究[J].电子制作,2014,22(23):104-105. 被引量：5
9蔡瑞初,钟椿荣,余洋,陈炳丰,卢冶,陈瑶.面向“边缘”应用的卷积神经网络量化与压缩方法[J].计算机应用,2018,38(9):2449-2454. 被引量：18
10李小燕,张欣,闫小兵,任德亮,李彦青,傅长娟.基于FPGA的卷积神经网络加速系统[J].河北大学学报（自然科学版）,2019,39(1):99-105. 被引量：5

共引文献14

1魏威,张平川.基于ATmega128的汽车轮胎漏气检测系统设计与实现[J].计算机测量与控制,2010,18(8):1724-1726.
2郑晓庆,王永刚,徐涛,王延年.基于串口波特率的ARM通信机发送缓存的动态管理[J].电测与仪表,2019,56(5):105-110. 被引量：5
3张育敬,陶青川.基于改进BiSeNet的轻量级水利语义分割算法[J].现代计算机,2022,28(7):53-58. 被引量：2
4吴宇航,何军.基于FPGA加速的行为识别算法研究[J].电子测量技术,2022,45(13):25-32. 被引量：4
5贾子龙,潘士杰,郭子昊,唐进,姚燕.基于FPGA的声纹识别系统设计[J].电子器件,2022,45(4):997-1003. 被引量：2
6谭会生,徐界铭,张驾祥.BP神经网络FPGA实现结构的优化设计[J].计算机工程与应用,2022,58(21):264-271. 被引量：4
7徐义忠,曾艳丽,孙超,苏鑫,宋云鹏.基于Linux+ARM和FPGA的高速数据采集存储系统设计及实现[J].电子设计工程,2023,31(18):21-27.
8谢文鑫,史纪广,李宙童,黄启俊.心电信号监测轻量化残差神经网络硬件IP设计[J].电子设计工程,2023,31(19):15-19.
9孙琪茗,曹姗.面向FPGA的卷积神经网络压缩平台[J].工业控制计算机,2023,36(10):119-121.
10崔劼.基于FPGA的卷积神经网络图像识别算法研究[J].无线互联科技,2023,20(18):159-161.

同被引文献1

1满涛,郭子豪,曲志坚.卷积神经网络的FPGA并行加速设计与实现[J].电讯技术,2021,61(11):1438-1445. 被引量：9

引证文献1

1孙琪茗,曹姗.面向FPGA的卷积神经网络压缩平台[J].工业控制计算机,2023,36(10):119-121.

1何文康,陈冰瑜,蔡贤资.应急管理巡护轨迹的优化方法及实验仿真[J].实验技术与管理,2022,39(9):250-255. 被引量：1
2沈向前,余洋,吴伟.基于公交车载数据的站点停靠精度分析[J].城市勘测,2022(4):1-5.
3刘福民,张盛桂,高诚.一种复材自动铺放过程的铺层表面缺陷在线检测方法[J].航空精密制造技术,2022,58(4):31-33.
4柏文超,刘颖明,王晓东,高兴,张书源.基于数据驱动的风电机组最优桨距角辨识方法[J].电力科学与工程,2022,38(9):38-44. 被引量：1
5刘光宇,曾志勇,曹禹,赵恩铭,邢传玺.基于密度聚类与灰度变换的NSST域声呐图像去噪[J].湖南大学学报（自然科学版）,2022,49(8):186-195. 被引量：6
6王惠琼,马礼,王慧丽,何得平.基于SWOT分析的临夏州田园综合体发展策略探究[J].现代园艺,2022,45(18):18-20. 被引量：2
7杨家轩,刘元.基于DBTCAN算法的船舶轨迹聚类与航路识别[J].上海海事大学学报,2022,43(3):7-12. 被引量：4
8YANG Juhua,LI Xutong,XING Dongfeng,CHEN Guangwu.Turnout fault diagnosis based on DBSCAN/PSO-SOM[J].Journal of Measurement Science and Instrumentation,2022,13(3):371-378. 被引量：3
9王天文,龚哲,杨光.综合物探技术在砖石类古遗迹病害探测中的应用与探讨[J].福建建设科技,2022(5):27-29. 被引量：2
10FENG Hao,WU Jianzhong,ZHANG Lu,LIAO Mingsheng.Unsupervised change detection of man-made objects using coherent and incoherent features of multi-temporal SAR images[J].Journal of Systems Engineering and Electronics,2022,33(4):896-906.

计算机测量与控制

2022年第9期

浏览历史

内容加载中请稍等...

基于FPGA的量化推理CNN加速系统研究与设计被引量：1

参考文献5

二级参考文献18

共引文献14

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于FPGA的量化推理CNN加速系统研究与设计 被引量：1

参考文献5

二级参考文献18

共引文献14

同被引文献1

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于FPGA的量化推理CNN加速系统研究与设计被引量：1