摘要
结合大数据的获取,深度神经网络关键技术广泛应用于图像分类、物体检测、语音识别和自然语言处理等领域.随着深度神经网络模型性能不断提升,模型体积和计算需求提高,以致其依赖高功耗的计算平台.为解决在实时嵌入式系统中的存储资源和内存访问带宽的限制,以及计算资源相对不足的问题,开展嵌入式应用的深度神经网络模型压缩技术研究,以便缩减模型体积和对存储空间的需求,优化模型计算过程.对模型压缩技术进行分类概述,包括模型裁剪、精细化模型设计、模型张量分解和近似计算和模型量化等,并对发展状况进行总结.为深度神经网络模型压缩技术的研究提供参考.
.
作者
王磊
赵英海
杨国顺
王若琪
WANG Lei;ZHAO Yinghai;YANG Guoshun;WANG Ruoqi(The 35th Research Institute of China Aerospace Science and Industry Corp., Beijing 100013, China)
出处
《北京交通大学学报》
CAS
CSCD
北大核心
2017年第6期34-41,共8页
JOURNAL OF BEIJING JIAOTONG UNIVERSITY
基金
国家自然科学基金(61572065)~~
关键词
深度神经网络
模型压缩
模型裁剪
张量分解
嵌入式系统
deep neural network
model compression
model pruning
tensor decomposition
embedded system