-
题名面向深度学习训练的内存交换机制综述
被引量:1
- 1
-
-
作者
高赫然
吴恒
许源佳
李修和
王焘
张文博
-
机构
中国科学院大学
中国科学院软件研究所软件工程技术研究开发中心
计算机科学国家重点实验室(中国科学院软件研究所)
国防科技大学电子对抗学院
中国科学院大学南京学院
中科南京软件技术研究院
-
出处
《软件学报》
EI
CSCD
北大核心
2023年第12期5862-5886,共25页
-
基金
国家重点研发计划(2018YFB1402803)
国家自然科学基金(61872344,61972386)
山东省重大研发计划(2021CXGC010101)。
-
文摘
随着深度学习技术的快速发展和深入应用,深度学习训练规模持续增大,内存不足已成为影响深度学习可用性的主要瓶颈之一.内存交换机制是应对深度学习训练内存问题的关键技术,该机制利用深度学习训练内存需求的“时变”特征,在专用计算加速设备内存与外部存储之间按需移动数据,通过瞬时内存需求替代累积内存需求,保障深度学习训练任务的运行.对面向深度学习训练的内存交换机制进行综述,以深度学习训练内存需求的时变特征为研究视角,分别针对基于算子运行特征的内存换出机制、基于数据依赖关系的内存换入机制以及效能驱动的联合换出与换入决策等重要研究工作进行了总结分析,并针对该技术领域的发展方向进行了展望.
-
关键词
深度学习训练
内存交换
内存需求特征
-
Keywords
deep learning(DL)training
memory swapping
memory requirement characteristic
-
分类号
TP303
[自动化与计算机技术—计算机系统结构]
-
-
题名基于迁移学习的商品图像检测方法
被引量:2
- 2
-
-
作者
胡正委
朱明
-
机构
中国科学技术大学信息科学技术学院
-
出处
《计算机系统应用》
2018年第10期226-231,共6页
-
基金
中科院先导专项课题(XDA06011203)~~
-
文摘
近年来,对象识别方法被应用到多个领域.如人脸检测,车辆检测.然而模型训练所需要的边框标定需要很大的工作量.本文通过基于迁移学习的方法,将物体检测任务迁移到商品检测,且不需要边框标定.本文在分类层和边框回归层之间建立关系层,来学习两种任务之间的关联.本文建立了一个商品数据集,并提出了一种深度学习训练方法,解决了可旋转物体的检测问题.基于Faster RCNN框架,本文提出一种候选选择方法,可以在无边框标定情况下训练商品分类.本文提出的商品检测方法不需要边框标定,而且很容易训练并应用到其它数据集.
-
关键词
物体检测
迁移学习
关系层
深度学习训练方法
边框标定
-
Keywords
object detection
transfer learning
relationship layer
training method
bounding-box label
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
TP181
[自动化与计算机技术—计算机科学与技术]
-
-
题名基于国产软硬件的深度学习平台设计与验证
- 3
-
-
作者
吕昊
郭江宇
郝志超
庄成
刘健
-
机构
北方自动控制技术研究所
-
出处
《火力与指挥控制》
CSCD
北大核心
2023年第7期134-139,共6页
-
文摘
随着国内外政治经济形势的日益变化,实现核心技术的自主可控显得尤为重要。深度学习被应用到生活以及军事领域中,实现深度学习模型训练及推理的国产化具有重要意义。设计了一种基于全国产软硬件的深度学习平台,实现目标识别领域模型的训练,并搭建目标跟踪系统,对深度学习训练平台的实用性进行验证。
-
关键词
国产软硬件
深度学习训练平台
PP-YOLO
目标跟踪
-
Keywords
national software and hardware
deep learning training platform
PP-YOLO
targettracking
-
分类号
TP389.1
[自动化与计算机技术—计算机系统结构]
-
-
题名基于深度学习训练平台的缓存联合部署策略研究
- 4
-
-
作者
鲍裕麟
郑烇
-
机构
中国科学技术大学自动化系未来网络实验室
中国科学技术大学先进技术研究院
-
出处
《电子技术(上海)》
2021年第7期61-67,共7页
-
文摘
阐述各类Internet服务与智能手机应用程序,每分钟都会产生大量数据,这大大刺激了包括深度学习在内的数据收集、存储、分析需求。但是,探讨如何优化深度学习训练平台的I/O表现,目前的研究成果还比较少。从"类脑智能开放平台"真实数据出发,分析了深度学习训练平台I/O特性,并基于以上,兼顾缓存命中率与节点负载均衡,提出了缓存联合部署策略。仿真结果表明,相比于常用的LRU策略,提出的策略具有更高的缓存命中率,且各计算节点之间的负载较为均衡,从而较好地优化了深度学习应用的I/O表现。
-
关键词
深度学习训练平台
I/O特性
缓存策略
部署策略
-
Keywords
deep learning training platform
I/O characteristics
caching strategy
deployment strategy
-
分类号
TP333
[自动化与计算机技术—计算机系统结构]
TP18
[自动化与计算机技术—计算机科学与技术]
-