CNN加速器中卷积计算单元的硬件设计被引量：2

Hardware Design of Convolutional Computing Unit in CNN Accelerator

下载PDF

导出

摘要卷积神经网络(CNN)所有子层中卷积层的计算是整个网络计算中最耗费计算资源的问题,本文提出了一种对卷积神经网络的卷积层并行化实现方案。首先对系统的整体处理结构进行分析,然后对计算核的结构进行详细讨论,最后将卷积层中卷积运算并行映射到阵列处理器上。实验结果表明,在250Mhz的工作频率下,该结构可使FPGA(Field Programmable Gate Array,FPGA)提高峰值运算速度。 The calculation of the convolutional layer in all sublayers of convolutional neural networks(CNN) is the most computational resource in the whole network computing. A convolutional layer parallelization implementation scheme for convolutional neural networks is proposed. Firstly,the overall processing structure of the system is analyzed. Then the structure of the computing core is discussed in detail. Finally, the convolutional layer are mapped to the array processor in parallel. The experimental results show that at 250 Mhz operating frequency, the structure can improve the peak operation speed FPGA.

作者杨博文杨海涛高浩浩 YANG Bo-wen;YANG Hai-tao;GAO Hao-hao(Xi'an University of Posts,Xi'an Shaanxi 710121)

机构地区西安邮电大学

出处《数字技术与应用》 2019年第10期136-137,共2页 Digital Technology & Application

关键词卷积神经网络现场可编程门阵列卷积层 CNN FPGA convolutional layer

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
2王磊,赵英海,杨国顺,王若琪.面向嵌入式应用的深度神经网络模型压缩技术综述[J].北京交通大学学报,2017,41(6):34-41. 被引量：4
3蹇强,张培勇,王雪洁.一种可配置的CNN协加速器的FPGA实现方法[J].电子学报,2019,47(7):1525-1531. 被引量：20
4赵彤,乔庐峰,陈庆华.一种基于FPGA的CNN加速器设计[J].通信技术,2019,52(5):1242-1248. 被引量：6
5周飞燕,金林鹏,董军.卷积神经网络研究综述[J].计算机学报,2017,40(6):1229-1251. 被引量：1685

二级参考文献12

1张敏,戈文航.基于概率计算的重叠双聚类算法[J].计算机工程与设计,2012,33(9):3579-3583. 被引量：3
2余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：604
3刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：71
4何志芬,杨明,刘会东.多标记分类和标记相关性的联合学习[J].软件学报,2014,25(9):1967-1981. 被引量：21
5金林鹏,董军.面向临床心电图分析的深层学习算法[J].中国科学：信息科学,2015,45(3):398-416. 被引量：36
6Yi ZHENG,QiLIU,Enhong CHEN,Yong GE,J. Leon ZHAO.Exploiting multi-channels deep convolutional neural networks for multivariate time series classification[J].Frontiers of Computer Science,2016,10(1):96-112. 被引量：21
7高君宇,杨小汕,张天柱,徐常胜.基于深度学习的鲁棒性视觉跟踪方法[J].计算机学报,2016,39(7):1419-1434. 被引量：30
8李红,刘芳,杨淑媛,张凯.基于深度支撑值学习网络的遥感图像融合[J].计算机学报,2016,39(8):1583-1596. 被引量：38
9常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：423
10周飞燕,金林鹏,董军.基于集成学习的室性早博识别方法[J].电子学报,2017,45(2):501-507. 被引量：8

共引文献1749

1陆文超,崔海朋.一种基于融合自编码与神经网络的协同过滤算法[J].中国水运（下半月）,2022,22(3):18-20.
2杜佳峰,王景松,杨宝军,薛勇新,郑春华.基于卷积神经网络的船舶水尺字符识别方法研究[J].中国水运（下半月）,2020(3):1-3. 被引量：1
3陆天和,刘莉,贺云涛,杨盾.多无人机航迹规划算法及关键技术[J].战术导弹技术,2020(1):85-90. 被引量：7
4林桢哲,王桂棠,陈建强,符秦沈.基于残差网络深度学习的肺部CT图像结节良恶性分类模型[J].仪器仪表学报,2020,41(3):248-256. 被引量：22
5陈仁祥,张勇,杨黎霞,陈才,徐向阳.基于整周期数据和卷积神经网络的谐波减速器健康状态评估[J].仪器仪表学报,2020,41(2):245-252. 被引量：20
6鲍光海,林善银,徐林森.基于改进型卷积网络的汽车高度调节器缺陷检测方法[J].仪器仪表学报,2020,41(2):157-165. 被引量：12
7谭宇辰,蔡晶晶,倪辰.基于深度学习的Web攻击检测技术研究[J].信息网络安全,2020(S02):122-126.
8任杰,李钢,赵燕姣,姚琼辛,田培辰.基于改进Faster RCNN的城市道路货车检测[J].计算机系统应用,2022,31(12):316-321. 被引量：2
9胡伟,文武,魏敏.改进U-Net的高分辨率遥感图像轻量化分割[J].计算机系统应用,2022,31(12):135-146. 被引量：2
10李莉,陈心宇,高文斌.一种基于FPGA的卷积神经网络加速器实现方案[J].北京电子科技学院学报,2022,30(4):96-104. 被引量：1

同被引文献29

1龙伟军,贲德,Asim D Bakhshi,张弓.三维机会阵雷达波束综合优化[J].电波科学学报,2010,25(1):93-98. 被引量：6
2田翔,周凡,陈耀武,刘莉,陈耀.基于FPGA的实时双精度浮点矩阵乘法器设计[J].浙江大学学报（工学版）,2008,42(9):1611-1615. 被引量：21
3袁兴生,段红,姚新宇,冯晓梅.脉冲多普勒雷达信号处理仿真系统研究[J].计算机应用,2009,29(B12):294-296. 被引量：2
4向聪,冯大政,和洁.机载雷达三维空时两级降维自适应处理[J].电子与信息学报,2010,32(8):1869-1873. 被引量：3
5龙伟军,贲德,BAKHSHI ASIM D,张弓.Pattern synthesis optimization of 3-D ODAR based on improved GA using LSFE method[J].Journal of Harbin Institute of Technology(New Series),2011,18(1):96-100. 被引量：4
6刘沛华,鲁华祥,龚国良,刘文鹏.基于FPGA的全流水双精度浮点矩阵乘法器设计[J].智能系统学报,2012,7(4):302-306. 被引量：8
7邬江兴.拟态计算与拟态安全防御的原意和愿景[J].电信科学,2014,30(7):1-7. 被引量：99
8顾福飞,张群,杨秋,霍文俊,王敏.基于NCS算子的大斜视SAR压缩感知成像方法[J].雷达学报（中英文）,2016,5(1):16-24. 被引量：6
9于东,李丽,韩峰,王堃,丰帆,潘红兵.一种高精度的大点数二维FFT处理器设计[J].现代雷达,2016,38(5):16-21. 被引量：3
10李震宇,陈溅来,梁毅,邢孟道,保铮.带有多普勒中心空变校正的大斜视SAR成像方法[J].西安电子科技大学学报,2016,43(3):19-24. 被引量：6

引证文献2

1高彦钊,王建明,雷志勇,张宇,陶常勇.分布式机会阵雷达拟态信号处理方法[J].现代雷达,2021,43(11):1-8. 被引量：2
2高彦钊,陶常勇.信号处理与深度学习硬件加速的一致性计算结构[J].国防科技大学学报,2023,45(2):112-120. 被引量：2

二级引证文献4

1高彦钊,邬江兴,刘勤让,沈剑良,宋克,张帆.计算体系架构研究综述与思考[J].中国科学：信息科学,2022,52(3):377-398. 被引量：3
2张安民,崔连虎,徐光耀,檀雷,王鑫,杨帅,柳立志.雷达武器装备联合试验技术研究进展综述[J].现代雷达,2022,44(3):10-17. 被引量：3
3荣宏伟.基于信号补偿算法的数据采集装置研制[J].自动化与仪表,2023,38(12):50-54.
4孙宇朝,李守豪,夏秀波,杨玮,李民赞,张焕春.利用改进YOLOv5s模型检测番茄果实成熟度及外观品质[J].园艺学报,2024,51(2):396-410.

1翟社平,邱程,杨媛媛,李婧,江婷婷.基于FPGA的卷积神经网络加速器设计与实现[J].微电子学与计算机,2019,36(8):83-86. 被引量：9
2本刊记者.2016年6月20日：“神威”初显神威的那一刻[J].百科知识,2019,0(17):6-7.
3王德奎.一种利用资源协商的FPGA布局方法[J].西安电子科技大学学报,2019,46(6):17-22. 被引量：2
4杨会伟,周先飞,马书香.基于FPGA多接口协议间转换系统研究[J].佳木斯大学学报（自然科学版）,2019,37(6):971-974. 被引量：5
5李磊,任文杰.基于FPGA的六轴机械手驱动控制系统设计与测试[J].电气传动,2019,49(12):52-57. 被引量：6
6周传伟,方方,卜凡,姜蓉.基于FPGA图像边缘检测的设计与实现[J].信息周刊,2019,0(50):0059-0059.
7杨阳.基于以太网收发器速率连续可变的地震仪数据传输方案[J].物探装备,2019,29(4):248-251. 被引量：1
8胡震.云计算安全问题分析及解决方案探讨[J].科技传播,2019,11(23):103-104.
9高嘉浩,李伟,陈韬.基于密码逻辑阵列的分组密码高能效映射方法[J].电子技术应用,2019,45(11):21-26. 被引量：2
10安玫,张珍珍,陈钊,黄蓉,丁坤,董海鹰.含光热-光伏联合发电的电力系统随机生产模拟研究[J].可再生能源,2019,37(11):1603-1610. 被引量：5

数字技术与应用

2019年第10期

浏览历史

内容加载中请稍等...

CNN加速器中卷积计算单元的硬件设计被引量：2

参考文献5

二级参考文献12

共引文献1749

同被引文献29

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

CNN加速器中卷积计算单元的硬件设计 被引量：2

参考文献5

二级参考文献12

共引文献1749

同被引文献29

引证文献2

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

CNN加速器中卷积计算单元的硬件设计被引量：2