-
题名一种面向计算图的及时内存重用算法
- 1
-
-
作者
曹博钧
钱入意
徐远超
-
机构
首都师范大学信息工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2024年第9期1539-1546,共8页
-
基金
北京市自然科学基金(4212017)。
-
文摘
有限的设备内存容量制约了深度神经网络模型的进一步发展,内存重用是少有的在不引入额外开销的前提下节省内存使用的方法之一。计算图中的中间张量占据着主要的内存空间,是内存重用算法的主要优化对象。现有的典型内存重用算法,包括大张量优先算法和短生命周期优先算法,仅从单一特征出发,只考虑张量之间的生命周期是否重叠,忽略了邻近张量之间的生命周期相对位置关系,计算图越复杂,对内存重用的挖掘越不够充分。针对该问题,提出一种新的内存重用算法——UMR,通过深入分析图中邻近张量的生命周期相对位置关系,并及时进行重用,从而获得了更多的内存重用机会。基于MLPerf中的真实推理模型对算法进行评估,结果显示UMR算法的内存重用率不低于现有的主流算法,且能达到该模型内存重用的理论最优。基于相对复杂的计算图对算法进行的评估表明,与大张量优先与短生命周期优先2种算法相比,UMR算法最高节省了21.6%和18.7%的内存占用,平均分别节省了6.5%与13.2%的内存占用。
-
关键词
计算图
内存优化
内存重用
内存利用率
-
Keywords
computational graph
memory optimization
memory reuse
memory usage rate
-
分类号
TP393.02
[自动化与计算机技术—计算机应用技术]
-