期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
权重量化的深度神经网络模型压缩算法 被引量:9
1
作者 陈昀 蔡晓东 +1 位作者 梁晓曦 王萌 《西安电子科技大学学报》 EI CAS CSCD 北大核心 2019年第2期132-138,共7页
深度神经网络模型通常存在大量的权重参数,为了减少其对存储空间的占用,提出权重量化的深度神经网络模型压缩算法。在前向传播过程中,使用一个四值滤波器将全精度权重量化为2、1、-1和-2四种状态,以进行高效的权重编码。最小化全精度权... 深度神经网络模型通常存在大量的权重参数,为了减少其对存储空间的占用,提出权重量化的深度神经网络模型压缩算法。在前向传播过程中,使用一个四值滤波器将全精度权重量化为2、1、-1和-2四种状态,以进行高效的权重编码。最小化全精度权重与缩放后四值权重的L2距离,以获得精确的四值权重模型。使用一个32位二进制数对16个四值权重进行编码压缩,以大幅度压缩模型。在MNIST、CIFAR-10和CIFAR-100数据集上的实验表明,该算法分别获得了6.74%、6.88%和6.62%的模型压缩率,与三值权重网络的相同,但准确率分别提升了0.06%、0.82%和1.51%。结果表明,该算法可提供高效、精确的深度神经网络模型压缩。 展开更多
关键词 权重量化 压缩 四值滤波器 存储空间 全精度
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部