基于RISC-V的卷积神经网络专用指令集处理器被引量：4

Special Instruction Set Processor for Convolutional Neural Network Based on RISC-V

下载PDF

导出

摘要针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效。在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络。FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理Squeeze Net网络,耗时约40.89 ms,功耗为1.966 W,较手机处理器单核计算速度更快,与AMD Ryzen7 3700X、NVIDIA RTX2070 Super和Qualcomm Snapdragon 835平台相比,其消耗资源少、功耗低,在性能功耗比上也具有优势。 The x86-based and ARM-based CPU are limited by the patent authorization,which increases their customization cost and reduces the flexibility.To address the problem,this paper chooses the open-source instruction set architecture,RISC-V,to build an special instruction set processor for Convolutional Neural Network(CNN)used in the Internet of Things(IoT).The processor uses the custom extended instructions to call the accelerator to speed up the convolution and pooling operations of lightweight CNN,improving the power efficiency of terminal devices.In this process,the information of each layer of CNN is configured to control the accelerator to perform grouping operations,so as to adapt to the input data of different sizes.At the same time,the data path of the accelerator is adjusted,and the timeconsuming operations are operated separately or in combination to adapt to different lightweight networks.The verification results on the FPGA platform show that this processor delivers a power consumption of 1.966 W when inferring SqueezeNet at 100 MHz.The inference takes about 40.89 ms,which is less than the single-core mobile phone processors take.Also,it reduces the consumption of resources and power,demonstrating an obvious advantage in performance power ratio compared with AMD Ryzen73700X,NVIDIA RTX2070 Super and Qualcomm Snapdragon 835.

作者廖汉松吴朝晖李斌 LIAO Hansong;WU Zhaohui;LI Bin(School of Microelectronics,South China University of Technology,Guangzhou 510641,China;Guangdong Artificial Intelligence and Digital Economy Laboratory(Guangzhou),Guangzhou 510330,China)

机构地区华南理工大学微电子学院人工智能与数字经济广东省实验室(广州)

出处《计算机工程》 CAS CSCD 北大核心 2021年第7期196-204,共9页 Computer Engineering

基金广东省重点领域研发计划项目(2018B010142001)。

关键词 RISC-V指令集卷积神经网络领域专用架构专用指令集处理器硬件加速 RISC-V instruction set Convolutional Neural Network(CNN) Domain Specific Architecture(DSA) special instruction set processor hardware acceleration

分类号 TP332 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献1

1雷思磊.RISC-V架构的开源处理器及SoC研究综述[J].单片机与嵌入式系统应用,2017,17(2):56-60. 被引量：33

共引文献32

1何志敏,王佳,程利甫,何俊,李欣欣.一种星载信息系统微系统电路设计[J].航天标准化,2020(2):32-35. 被引量：2
2杨德亨,徐学政,王涛,黄安文,李琼.面向RISC-V内存一致性测试的自动化分析方法[J].智能安全,2023,2(3):58-67.
3李东泽,曹凯宁,曲明,王富昕.五级流水线RISC-V处理器软硬件协同仿真验证[J].吉林大学学报（信息科学版）,2017,35(6):612-616. 被引量：9
4张迅珍,梁青,李涛.RV32I控制单元设计与实现[J].微电子学与计算机,2018,35(3):74-78. 被引量：6
5吕倩茹,王彦鹏,曹壮,文梅.面向网络报文转发的RISC-V压缩指令定制[J].计算机工程与科学,2018,40(3):381-387. 被引量：1
6贠晨阳,苗瑞霞.基于PicoRV32开源处理器的SOC平台搭建[J].现代电子技术,2019,42(21):90-93. 被引量：4
7傅思扬,陈华,郁发新.基于RISC-V的卷积神经网络处理器设计与实现[J].微电子学与计算机,2020,37(4):49-54. 被引量：5
8李韶光,刘雷,郎金鹏,王建国.CPU发展概述及国产化之路[J].网络空间安全,2020,11(4):114-117. 被引量：12
9陶常勇,高彦钊,王元磊,张兴明.基于RISC-V的近数据计算系统设计方法[J].火控雷达技术,2020,49(3):92-100.
10黄平,袁佳,朱静,羊日飞.RISC-V处理器远程监测系统终端设计[J].物联网技术,2020,10(10):12-14. 被引量：4

同被引文献28

1余传本,刘增力.一种改进的贝叶斯小波阈值图像去噪算法[J].电视技术,2021,45(10):106-111. 被引量：5
2洪一帆,宋坤坡,夏顺仁,丛卫华.三维成像声纳图像后处理与可视化[J].计算机工程,2011,37(22):196-197. 被引量：3
3雷思磊.RISC-V架构的开源处理器及SoC研究综述[J].单片机与嵌入式系统应用,2017,17(2):56-60. 被引量：33
4赵可可,柴志雷,吴东.一种基于Zynq的ROS软硬件协同计算架构设计与实现[J].微电子学与计算机,2017,34(9):87-91. 被引量：4
5李东泽,曹凯宁,曲明,王富昕.五级流水线RISC-V处理器软硬件协同仿真验证[J].吉林大学学报（信息科学版）,2017,35(6):612-616. 被引量：9
6杨维科,贺光辉,景乃锋.基于Rocket-Chip开源处理器的CNN加速模块的设计及实现[J].微电子学与计算机,2018,35(4):17-21. 被引量：6
7邓天传,胡振波.一种超低功耗的RISC-V处理器流水线结构[J].电子技术应用,2019,45(6):50-53. 被引量：9
8折如义,李炳辉,姜佩贺.三级流水线RISC-V处理器设计与验证[J].电子技术应用,2020,46(5):44-49. 被引量：10
9程源文,刘宏伟,徐渊.单点相位式TOF深度探测器研究与设计[J].激光杂志,2021,42(1):65-70. 被引量：1
10魏加立,曲慧东,王永宪,朱俊青,关英俊.基于飞行时间法的3D相机研究综述[J].红外技术,2021,43(1):60-67. 被引量：16

引证文献4

1邵一民,周俊,秦工.基于FPGA的RISC-V CPU矩阵乘法定制指令实现[J].软件,2022,43(1):161-164. 被引量：2
2应三丛,彭铃.基于多视图并行的可配置卷积神经网络加速器设计[J].工程科学与技术,2022,54(2):188-195. 被引量：1
3黄正伟,刘宏伟,徐渊.用于IToF传感器的极低功耗RISC-V专用处理器设计[J].计算机工程,2022,48(9):146-154. 被引量：4
4王前莉,李颖.嵌入式处理器自定义指令迭代识别方法仿真[J].计算机仿真,2024,41(8):276-280.

二级引证文献6

1张桢,梁军,贾海鹏,张云泉,李青.基于RISC-V的FFmpeg多媒体算法库优化策略[J].计算机工程,2023,49(4):159-165. 被引量：3
2王健,付志博,明哲.可信执行环境的RISC-V架构处理器安全分区方法[J].单片机与嵌入式系统应用,2023,23(9):16-19.
3莫尚丰,周振芬,胡勇华,徐敏敏,毛春献,袁钰迪.基于FT-M7002的复数域行向量矩阵乘法移植与优化[J].计算机科学,2023,50(S02):827-832. 被引量：1
4乔建华,吴言,栗亚宁,雷光政.面向微控制器的卷积神经网络加速器设计[J].电子器件,2024,47(1):48-54.
5张国明.基于图卷积神经网络的大规模软件定义网络流量预测模型[J].微电子学与计算机,2024,41(4):96-103.
6张学镇,汪西虎,董嗣万,张一泓.五级流水线RISC-V微处理器的研究与设计[J].计算机工程,2024,50(8):345-352.

1宋莹.旗袍个性定制和展示系统的交互设计[J].纺织学报,2021,42(4):144-148. 被引量：5
2从“S1”到“888” 高通骁龙800系列移动平台回顾[J].电脑爱好者,2021(2):4-11.
3张千城.Surface Pro X旗舰新品发布[J].计算机与网络,2020,46(20):29-29.
4企业资讯[J].传感器世界,2020,26(3):39-41.
5张平(文/图).让声音更美妙高通Snapdragon Sound技术解读[J].微型计算机,2021(10):90-93.
6张红军,袁艳林,石博文.基于物联网的智能警报系统优化算法研究[J].唐山师范学院学报,2021,43(3):64-67.
7Ken Chen,Wenfei Yu,Chuanxin Wen.Rotor Optimization for Synchronous Reluctance Motors[J].CES Transactions on Electrical Machines and Systems,2019,3(3):279-284.
8技术持续演进,应用持续深化 2021高通技术与合作峰会集聚产业力量[J].新潮电子,2021(6):92-95.
9徐斌.沿海港口煤炭贸易市场与物流环境探究[J].大众投资指南,2020(17):27-28.
10陈黎,陈超然,周志军,雷江涛.黄土地区旋扩灌注桩附加应力分布及沉降计算[J].科学技术与工程,2021,21(16):6848-6856. 被引量：2

计算机工程

2021年第7期

浏览历史

内容加载中请稍等...

基于RISC-V的卷积神经网络专用指令集处理器被引量：4

参考文献1

共引文献32

同被引文献28

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于RISC-V的卷积神经网络专用指令集处理器 被引量：4

参考文献1

共引文献32

同被引文献28

引证文献4

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

基于RISC-V的卷积神经网络专用指令集处理器被引量：4