期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于RISC-V的卷积神经网络专用指令集处理器 被引量:3
1
作者 廖汉松 吴朝晖 李斌 《计算机工程》 CAS CSCD 北大核心 2021年第7期196-204,共9页
针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,... 针对x86和ARM商用架构CPU因专利、授权导致定制成本过高和灵活性不够的问题,面向物联网领域提出一种基于RISC-V开源指令集的卷积神经网络(CNN)专用指令集处理器。通过自定义拓展指令调用加速器对轻量化CNN中的卷积和池化操作进行加速,提高终端设备能效。在此过程中,配置CNN各层信息控制加速器进行分组运算,以适应不同大小的输入数据,同时调整加速器的数据通路,对耗时操作进行单独或结合运算,以适应不同的轻量化网络。FPGA平台验证结果表明,该处理器在100 MHz工作频率下推理Squeeze Net网络,耗时约40.89 ms,功耗为1.966 W,较手机处理器单核计算速度更快,与AMD Ryzen7 3700X、NVIDIA RTX2070 Super和Qualcomm Snapdragon 835平台相比,其消耗资源少、功耗低,在性能功耗比上也具有优势。 展开更多
关键词 RISC-V指令集 卷积神经网络 领域专用架构 专用指令集处理器 硬件加速
下载PDF
面向多发射架构ASIP的定制功能单元的自动生成
2
作者 谭洪贺 何虎 孙义和 《清华大学学报(自然科学版)》 EI CAS CSCD 北大核心 2011年第3期334-339,共6页
现有定制功能单元生成算法既没有考虑发射架构的配置情况,也没有考虑关键路径的改变,因此在面对多发射架构处理器时,其性能提高效果有限。该文基于有向无环图,通过分析对比特定配置下备选节点对应用的多方面影响,使用逐点生长的方法,提... 现有定制功能单元生成算法既没有考虑发射架构的配置情况,也没有考虑关键路径的改变,因此在面对多发射架构处理器时,其性能提高效果有限。该文基于有向无环图,通过分析对比特定配置下备选节点对应用的多方面影响,使用逐点生长的方法,提出了一种新的面向多发射架构特定应用指令集处理器(ASIP)的定制功能单元自动生成算法。结合3种不同架构配置的实验结果显示,该算法获得的最优加速比分别达到2.3、4.5和6.9,较不考虑多发射架构的传统算法大大提高了处理器的运算性能。 展开更多
关键词 特定应用指令集处理器(ASIP) 多发射架构 定制功能单元(CFU) 指令集扩展(ISE)
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部