期刊文献+
共找到7篇文章
< 1 >
每页显示 20 50 100
深度神经网络模型量化方法综述 被引量:2
1
作者 杨春 张睿尧 +6 位作者 黄泷 遆书童 林金辉 董志伟 陈松路 刘艳 殷绪成 《工程科学学报》 EI CSCD 北大核心 2023年第10期1613-1629,共17页
近年来,利用大型预训练模型来提高深度神经网络在计算机视觉以及自然语言处理等具体任务下的泛化能力和性能,逐渐成为基于深度学习的人工智能技术与应用的发展趋势.虽然这些深度神经网络模型表现优异,但是由于模型的结构复杂、参数量庞... 近年来,利用大型预训练模型来提高深度神经网络在计算机视觉以及自然语言处理等具体任务下的泛化能力和性能,逐渐成为基于深度学习的人工智能技术与应用的发展趋势.虽然这些深度神经网络模型表现优异,但是由于模型的结构复杂、参数量庞大与计算成本极高,使得它们仍然难以被部署在如家电或智能手机等资源受限的边缘及端侧硬件平台上,这很大程度上阻碍了人工智能技术的应用.因此,模型压缩与加速技术一直都是深度神经网络模型大规模商业化应用推广的关键问题之一.当前在多种模型压缩与加速方案中,模型量化是其中主要的有效方法之一.模型量化技术可以通过减少深度神经网络模型参数的位宽和中间过程特征图的位宽,从而达到压缩加速深度神经网络的目的,使量化后的网络能够部署在资源有限的边缘设备上,然而,由于量化会导致信息的大量丢失,如何在保证模型任务精度条件下实现模型量化已经成为热点问题.另外,因硬件设备以及应用场景的不同,模型量化技术已经发展成为一个多分支的研究问题.通过全面地调研不同角度下模型量化相关技术现状,并且深入地总结归纳不同方法的优缺点,可以发现量化技术目前仍然存在的问题,并为未来可能的发展指明方向. 展开更多
关键词 深度神经网络 模型压缩与加速 模型量化 量化感知训练 后训练量化 混合精度量化
下载PDF
SAR目标识别网络的高效混合精度量化方法
2
作者 董祥 郭山红 +1 位作者 韩阳 张亚坤 《空天预警研究学报》 CSCD 2023年第5期344-348,354,共6页
为改善SAR图像目标识别方法低精度量化导致识别率下降严重的问题,提出采用Hessian矩阵特征分解确定量化精度分配的高效混合精度量化方法.首先采用幂迭代算法替代直接计算法来求取Hessian矩阵的主特征值,减少了运算量,提高了算法效率;然... 为改善SAR图像目标识别方法低精度量化导致识别率下降严重的问题,提出采用Hessian矩阵特征分解确定量化精度分配的高效混合精度量化方法.首先采用幂迭代算法替代直接计算法来求取Hessian矩阵的主特征值,减少了运算量,提高了算法效率;然后根据卷积神经网络(CNN)不同层对权重位宽的敏感度来设置位宽,使神经网络在总体量化精度较低的情况下发挥效果;最后使用MSTAR数据集和OpenSARShip数据集对本文方法进行了验证测试.测试结果表明,在保持较高识别率下,使用高效混合精度量化方法量化后的网络与原网络相比硬件资源消耗大幅压缩. 展开更多
关键词 SAR图像 目标识别 卷积神经网络 HESSIAN矩阵 混合精度量化
下载PDF
卷积神经网络混合截断量化 被引量:4
3
作者 黄钲喆 杜慧敏 常立博 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2021年第4期553-559,共7页
量化是压缩卷积神经网络、加速卷积神经网络推理的主要方法.现有的量化方法大多将所有层量化至相同的位宽,混合精度量化则可以在相同的压缩比下获得更高的准确率,但寻找混合精度量化策略是很困难的.为解决这种问题,提出了一种基于强化... 量化是压缩卷积神经网络、加速卷积神经网络推理的主要方法.现有的量化方法大多将所有层量化至相同的位宽,混合精度量化则可以在相同的压缩比下获得更高的准确率,但寻找混合精度量化策略是很困难的.为解决这种问题,提出了一种基于强化学习的卷积神经网络混合截断量化方法,使用强化学习的方法搜索混合精度量化策略,并根据搜索得到的量化策略混合截断权重数据后再进行量化,进一步提高了量化后网络的准确率.在ImageNet数据集上测试了ResNet18/50以及MobileNet-V2使用此方法量化前后的Top-1准确率,在COCO数据集上测试了YOLOV3网络量化前后的mAP.与HAQ, ZeroQ相比, MobileNet-V2网络量化至4位的Top-1准确率分别提高了2.7%和0.3%;与分层量化相比, YOLOV3网络量化至6位的mAP提高了2.6%. 展开更多
关键词 卷积神经网络 混合精度量化 强化学习 混合截断
下载PDF
面向混合量化CNNs的可重构处理器设计 被引量:1
4
作者 常立博 张盛兵 《西北工业大学学报》 EI CAS CSCD 北大核心 2022年第2期344-351,共8页
为了解决已有卷积神经网络(convolution neural networks,CNNs)加速器,因无法适应混合量化CNN模型的计算模式和访存特性而引起加速器效率低的问题,设计了可适应混合量化模型的可重构计算单元、弹性片上缓存单元和宏数据流指令集。其中,... 为了解决已有卷积神经网络(convolution neural networks,CNNs)加速器,因无法适应混合量化CNN模型的计算模式和访存特性而引起加速器效率低的问题,设计了可适应混合量化模型的可重构计算单元、弹性片上缓存单元和宏数据流指令集。其中,采用了可根据CNN模型结构的重构多核结构以提高计算资源利用率,采用弹性存储结构以及基于Tile的动态缓存划分策略以提高片上数据复用率,采用可有效表达混合精度CNN模型计算和可重构处理器特性的宏数据流指令集以降低映射策略的复杂度。在Ultra96-V2平台上实现VGG-16和ResNet-50的计算性能达到216.6和214 GOPS,计算效率达到0.63和0.64 GOPS/DSP。同时,在ZCU102平台上实现ResNet-50的计算性能可达931.8 GOPS,计算效率可达0.40 GOPS/DSP,相较于其他类似CNN加速器,计算性能和计算效率分别提高了55.4%和100%。 展开更多
关键词 混合精度量化 卷积神经网络加速器 可重构计算
下载PDF
面向深度强化学习自动驾驶决策算法的硬件加速器
5
作者 冉敬楠 倪伟 陈世宇 《合肥工业大学学报(自然科学版)》 CAS 北大核心 2024年第9期1159-1169,共11页
有效算力达到18.3 GOPS,是CPU的10.7倍,GPU的3.3倍;能效比达到2.197 GOPS/W,是CPU的104倍,GPU的28倍。同时提出一种高位数据编码(most significant bit data coding,MSB-DC)方法实现层内混合精度特征图计算,实验结果表明,该方法能以较... 有效算力达到18.3 GOPS,是CPU的10.7倍,GPU的3.3倍;能效比达到2.197 GOPS/W,是CPU的104倍,GPU的28倍。同时提出一种高位数据编码(most significant bit data coding,MSB-DC)方法实现层内混合精度特征图计算,实验结果表明,该方法能以较少的延迟成本有效降低量化所带来的误差。 展开更多
关键词 深度强化学习 自动驾驶 混合精度 神经网络量化 硬件加速
下载PDF
基于损失变化的CNN混合精度量化方法
6
作者 何益智 李钊 +2 位作者 李鉴柏 张少爽 刘文龙 《计算机工程与设计》 北大核心 2024年第2期571-577,共7页
针对卷积神经网络(convolutional neural network,CNN)在存储和计算资源有限的边缘设备中难以部署应用的问题,提出一种基于损失变化的混合精度量化方法,以低位宽定点数代替全精度浮点数进行运算,降低网络所需资源。根据每个量化层的一... 针对卷积神经网络(convolutional neural network,CNN)在存储和计算资源有限的边缘设备中难以部署应用的问题,提出一种基于损失变化的混合精度量化方法,以低位宽定点数代替全精度浮点数进行运算,降低网络所需资源。根据每个量化层的一阶和二阶信息指导位宽分配,采用K-means方法将量化层聚类成块,降低位宽策略搜索空间。提出一种自适应搜索方式,根据历史策略训练结果自行调整搜索状态。重新整合量化训练过程,减少传统量化训练中计算量。实验结果表明,采用所提方法可在CNN模型推理损失精度较小的前提下,有效压缩模型。 展开更多
关键词 卷积神经网络 混合精度量化 损失变化 K-MEANS聚类 敏感度分析 自适应搜索 模型压缩
下载PDF
基于误差限制的神经网络混合精度量化方法(特邀)
7
作者 李奕铎 郭子博 +1 位作者 刘凯 孙逍遥 《红外与激光工程》 EI CSCD 北大核心 2022年第4期134-141,共8页
基于卷积神经网络的深度学习算法展现出卓越性能的同时也带来了冗杂的数据量和计算量,大量的存储与计算开销也成了该类算法在硬件平台部署过程中的最大阻碍。而神经网络模型量化使用低精度定点数代替原始模型中的高精度浮点数,在损失较... 基于卷积神经网络的深度学习算法展现出卓越性能的同时也带来了冗杂的数据量和计算量,大量的存储与计算开销也成了该类算法在硬件平台部署过程中的最大阻碍。而神经网络模型量化使用低精度定点数代替原始模型中的高精度浮点数,在损失较小精度的前提下可有效压缩模型大小,减少硬件资源开销,提高模型推理速度。现有的量化方法大多将模型各层数据量化至相同精度,混合精度量化则根据不同层的数据分布设置不同的量化精度,旨在相同压缩比下达到更高的模型准确率,但寻找合适的混合精度量化策略仍十分困难。因此,提出一种基于误差限制的混合精度量化策略,通过对神经网络卷积层中的放缩因子进行统一等比限制,确定各层的量化精度,并使用截断方法线性量化权重和激活至低精度定点数,在相同压缩比下,相比统一精度量化方法有更高的准确率。其次,将卷积神经网络的经典目标检测算法YOLOV5s作为基准模型,测试了方法的效果。在COCO数据集和VOC数据集上,该方法与统一精度量化相比,压缩到5位的模型平均精度均值(mean Average Precision,mAP)分别提高了6%和24.9%。 展开更多
关键词 深度学习 混合精度 截断量化 YOLOV5
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部