基于多GPU的深度神经网络训练算法被引量：8

Algorithm of Depth Neural Network Training Based on Multi-GPU

下载PDF

导出

摘要深度学习由于出色的识别效果在模式识别及机器学习领域受到越来越多的关注.作为深度神经网络算法的重要组成部分,误差反向传播算法的执行效率已经成为制约深度学习领域发展的瓶颈.提出一种基于Tesla K10 GPU的误差反向传播算法,该算法具有负载均衡,可扩展性高的特点.本算法充分利用PCI-E3.0传输特性,并结合peer-to-peer以及异步传输的特性以降低计算任务在划分和合并过程中带来的额外开销.除此之外,文章通过对算法流程的重构,实现算法数据相关性的解耦合,从而使得有更多的计算任务可用来掩盖传输过程.实验证明,该算法拥有双卡超过1.87的并行加速比,且算法执行过程中不会引入计算误差,可有效保证训练过程中的收敛效率,拥有理想的并行加速效果. In recent years, deep learning has received more and more attention. It greatly improves the recognition rate of speech and images. As an important part of Depth Neural Network, the efficiency of back-propagation training has been the major roadblock. This paper present an improved parallel algorithm of back-propagation training based on Tesla K10 GPU. The improved algorithm has the characteristics of load balancing and high scalability. It full advantages the features of PCI-E 3. 0, uses the asynchronous transfer mode and peer-to-peer to improve the performance of data transmission. Apart from this, this paper reduced the data related by reconstructing the algorithm processes of back-propagation training. In this way, the new algorithm has more computation which can be used to conceal the data transmission. Experiments show that the improved algorithm can achieve a 1.87 end-to-end speed-up. And no errors will be introduced by this algorithm. It is better than the most parallel algorithm of back-propagation based on GPGPU computing platform.

作者顾乃杰赵增吕亚飞张致江

机构地区中国科学与技术大学计算机科学与技术学院网络计算与高校算法实验室中国科学技术大学中科院沈阳计算所网络与通信联合实验室科大讯飞

出处《小型微型计算机系统》 CSCD 北大核心 2015年第5期1042-1046,共5页 Journal of Chinese Computer Systems

基金核高基重大专项项目(2009ZX01028-002-003-005)资助

关键词深度学习神经网络 GPGPU 并行算法 deep learning neural networks GPGPU parallel algorithms

分类号 TP18 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1李旗堂,李娜,宋国杰.一个面向大规模BP神经网络并行算法[J].河南广播电视大学学报,2004,17(1):77-80. 被引量：2
2张弦..基于数据并行的BP神经网络训练算法[D].华中科技大学,2008:

共引文献1

1宋智,何嘉.面向复杂问题的BP神经网络并行算法[J].西南师范大学学报（自然科学版）,2009,34(3):103-106. 被引量：3

同被引文献44

1陈尹刚.基于数学形态学图像处理算法研究[J].信息通信,2019,0(12):67-68. 被引量：12
2黄小红,姜卫东.空间目标RCS序列周期性判定与提取[J].航天电子对抗,2005,21(2):29-30. 被引量：20
3沈绪榜,张发存,冯国臣,车得亮,王光.计算机体系结构的分类模型[J].计算机学报,2005,28(11):1759-1766. 被引量：10
4许小剑,黄培康.防空雷达中的目标识别技术[J].系统工程与电子技术,1996,18(5):48-62. 被引量：20
5林刚,许家栋.目标RCS动态数据的分布特征研究[J].现代雷达,2006,28(2):18-20. 被引量：10
6葛永斌,田振夫,马红磊.三维泊松方程的高精度多重网格解法[J].应用数学,2006,19(2):313-318. 被引量：18
7金胜,高梅国,王洋.基于RCS的空间目标识别技术[J].现代雷达,2010,32(6):59-62. 被引量：22
8白广周,张洪祥.基于雷达RCS测量的空间翻滚目标识别研究[J].飞行器测控学报,1999,18(1):50-58. 被引量：4
9周海,吴丽珍,刘鹏辉.一种基于双线性配对的移动通信认证组密钥协商方案[J].计算机应用与软件,2012,29(4):151-155. 被引量：2
10曹军威,万宇鑫,涂国煜,张树卿,夏艾瑄,刘小非,陈震,陆超.智能电网信息系统体系结构研究[J].计算机学报,2013,36(1):143-167. 被引量：249

引证文献8

1赵伟峰,杨秋松,李梅,张鸿骏.交互感知应用微云服务框架[J].计算机系统应用,2016,25(10):180-185. 被引量：4
2张明,顾乃杰,陈露.多CPU+多GPU协同计算的三维泊松方程求解[J].小型微型计算机系统,2017,38(4):901-905.
3詹武平,郑永煌,王金霞.基于深度神经网络模型的雷达目标识别[J].现代雷达,2018,40(1):16-19. 被引量：12
4王一超,韦建文.基于高性能计算平台的TensorFlow应用探索与实践[J].实验室研究与探索,2017,36(12):125-128. 被引量：18
5李相桥,李晨,田丽华,张玉龙.卷积神经网络并行训练的优化研究[J].计算机技术与发展,2018,28(8):12-16.
6孙帆,李晓光,张勇,许广虎,谢海疆.基于MapReduce的智能电网云计算并行优化研究[J].计算机与数字工程,2018,46(4):705-710. 被引量：5
7李彦峰.深度学习在GPU上的计算优化[J].信息与电脑,2018,30(13):16-18. 被引量：5
8周斌,周雨.联机手写汉字笔迹识别系统设计研究[J].科学与信息化,2022(3):113-115.

二级引证文献44

1陈晓武,刘国华,雷尚平.机器视觉平台在钢铁制造业的实现与应用[J].冶金自动化,2020,44(S01):197-201. 被引量：4
2冯博迪,杨海涛,王晋宇,李高源,张长弓.基于数据融合的SAR图像目标识别算法[J].计算机系统应用,2022,31(12):342-349. 被引量：1
3田宇,王党,贾晓强.可穿戴导盲装置的研究与实现[J].中国科技纵横,2019,0(14):28-29. 被引量：1
4雷春,冯生荣,张奇,张保民.Ⅰ类热像仪故障诊断[J].红外技术,2000,22(3):12-15.
5姚畅.腾讯微云在学校预防接种查验证中的应用[J].中国卫生产业,2017,14(24):66-67.
6孙梓超,谭喜成,洪泽华,董华萍,沙宗尧,周松涛,杨宗亮.基于深度卷积神经网络的遥感影像目标检测[J].上海航天,2018,35(5):18-24. 被引量：4
7邢艳芳,卓文鑫,段红秀.基于MobileNet的敏感图像识别系统设计[J].电视技术,2018,42(7):53-56. 被引量：6
8王志诚,徐卉,梁小溪,王珺,周起华,朱骏.基于卷积神经网络技术的直升机旋翼谱识别方法[J].上海航天,2018,35(6):103-111.
9王东升,曾钰琳.风电场设备的智能远程运维研究[J].东方汽轮机,2018(4):49-50. 被引量：1
10邢艳芳,段红秀,何光威.TensorFlow在图像识别系统中的应用[J].计算机技术与发展,2019,29(5):192-196. 被引量：31

1李永光.声音的异步传输会很快实现吗[J].现代科技译丛（哈尔滨）,1998(2):12-13.
2李喆.掩盖电子邮件的痕迹[J].个人电脑,2001(1):43-44.
3丁宁.Windows XP所掩盖的CPU缺陷[J].市场与电脑（PC任我行）,2003(12):61-61.
4桑炳巨.传感器传输特性曲线拟合[J].航空兵器靶场试验,1989(2):24-31.
5王春元.计算机通信接口标准的传输特性[J].微型电脑应用,1992(3):1-9.
6刘淑娴,李晓华.基于Peer-to-Peer的搜索引擎的发展[J].喀什师范学院学报,2005,26(6):62-64.
7李秀湾.计算机网络信息安全及防护策略研究[J].移动信息,2016(1):8-8.
8何智文,邓伦丹.关于计算机数据库的安全防范技术探析[J].现代职业教育,2016,0(36):13-13.
9何智文,邓伦丹.关于计算机数据库的安全防范技术探析[J].通讯世界（下半月）,2016(11):75-75.
10王理燕,贺利军,陈建华.基于VC的UDP的实现[J].信息通信,2008,21(1):20-23. 被引量：3

小型微型计算机系统

2015年第5期

浏览历史

内容加载中请稍等...

基于多GPU的深度神经网络训练算法被引量：8

参考文献2

共引文献1

同被引文献44

引证文献8

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于多GPU的深度神经网络训练算法 被引量：8

参考文献2

共引文献1

同被引文献44

引证文献8

二级引证文献44

相关作者

相关机构

相关主题

浏览历史

基于多GPU的深度神经网络训练算法被引量：8