用于图像分类的卷积神经网络中激活函数的设计被引量：57

Design of activation function in CNN for image classification

下载PDF

导出

摘要为了提高图像分类效果,针对卷积神经网络中常用激活函数relu在x负半轴的导数恒为零,导致训练过程中容易造成神经元"坏死"以及现有组合激活函数relu-softplus在模型收敛情况下学习率过小导致收敛速度慢的问题,提出新的组合激活函数relu-softsign.分析激活函数在训练过程中的作用,给出激活函数在设计时需要考虑的要点;根据这些要点,将relu和softsign函数于x轴正、负半轴进行分段组合,使其x负半轴导数不再恒为零;分别在MNIST、PI100、CIFAR-100和Caltech256数据集上,与单一的激活函数和relu-softplus组合激活函数进行对比实验.实验结果表明,使用relu-softsign组合激活函数提高了模型分类准确率,简单有效地缓解了神经元不可逆"坏死"现象;加快了模型的收敛速度,在复杂数据集上该组合函数的收敛性能更好. A new combinatorial activation function called relu-softsign was proposed aiming at the problem that the derivative of the commonly used activation function relu in the convolutional neural network is constant to zero at the x negative axis,which makes it easy to cause neuron necrosis during training,and the existing combinatorial activation function relu-softplus can only use the small learning rate in the case of model convergence,which leads to slow convergence.The image classification effect was improved.The role of the activation function during training was analyzed,and the key points that need to be considered in the design of the activation function were given.The relu and softsign functions were combined piecewise in the positive and negative semi axis of the x axis according to these points,so that the derivative of x negative semi axis was no longer constant to zero.Then comparision with the single activation function and relu-softplus combination activation function was conducted on the MNIST,PI100,CIFAR-100 and Caltech256 datasets.The experimental results show that the combinatorial activation function relu-softsign improves the model classification accuracy,simply and effectively mitigates the irreversible "necrosis" phenomenon of neurons.The convergence speed of the model is accelerated,especially on complex data sets.

作者王红霞周家奇辜承昊林泓 WANG Hong-xia;ZHOU Jia-qi;GU Cheng-hao;LIN Hong(School of Computer Science and Technology,Wuhan University of Technology,Wuhan 430063,China)

机构地区武汉理工大学计算机科学与技术学院

出处《浙江大学学报（工学版）》 EI CAS CSCD 北大核心 2019年第7期1363-1373,共11页 Journal of Zhejiang University：Engineering Science

关键词图像分类卷积神经网络激活函数 relu 神经元坏死组合激活函数 image classification convolutional neural network activation function relu neurons necrosis combinatorial activation function

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240. 被引量：193
2常亮,邓小明,周明全,武仲科,袁野,杨硕,王宏安.图像理解中的卷积神经网络[J].自动化学报,2016,42(9):1300-1312. 被引量：423
3吴正文..卷积神经网络在图像分类中的应用研究[D].电子科技大学,2015:
4石琪..基于卷积神经网络图像分类优化算法的研究与验证[D].北京交通大学,2017:
5李明威..图像分类中的卷积神经网络方法研究[D].南京邮电大学,2016:
6贾世杰..基于内容的商品图像分类方法研究[D].大连理工大学,2013:

二级参考文献68

1Marr D.Vision:A Computational Investigation Into the Human Representation and Processing of Visual Information.Cambridge:The MIT Press,2010. 被引量：1
2LeCun Y,Bottou L,Bengio Y,Haffner P.Gradient-based learning applied to document recognition.Proceedings of the IEEE,1998,86(11):2278-2324. 被引量：1
3Ferrari V,Jurie F,Schmid C.From images to shape models for object detection.International Journal of Computer Vision,2009,87(3):284-303. 被引量：1
4Latecki L J,Lakamper R,Eckhardt U.Shape descriptors for non rigid shapes with a single closed contour//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Hilton Head,USA,2000,1:424-429. 被引量：1
5Krizhevsky A.Learning Multiple Layers of Features from Tiny Images[M.S.dissertation].University of Toronto,2009. 被引量：1
6Torralba A,Fergus R,Freeman W T.80 million tiny images:A large dataset for non-parametric object and scene recognition.IEEE Transactions on Pattern Analysis and Machine Intelligence,2008,30(11):1958-1970. 被引量：1
7Li FebFei,Fergus R,Perona P.Learning generative visual models from few training examples:An incremental Bayesian approach tested on 101 object categories//Proceedings of the Computer Vision and Pattern Recognition (CVPR),Workshop on Generative-Model Based Vision.Washington,USA,2004:178. 被引量：1
8Griffin G,Holub A D,Perona P.The Caltech 256.Caltech Technical Report CNS-TR-2007-001. 被引量：1
9Lazebnik S,Schmid C,Ponce J.Beyond bags of features:Spatial pyramid matching for recognizing natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).New York,USA,2006:2169-2178. 被引量：1
10Li Fei-Fei,Perona P.A Bayesian hierarchical model for learning natural scene categories//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR).Washington,USA,2005:524-531. 被引量：1

共引文献608

1陈梦,王晓青.全卷积神经网络在建筑物震害遥感提取中的应用研究[J].震灾防御技术,2019,14(4):810-820. 被引量：6
2陈妮亚,阮佳阳,黄金苗,杨伟.结合深度学习与生物特征识别在冷链拣选中的算法研究[J].智能科学与技术学报,2019,0(1):88-95. 被引量：1
3王雷,闫红蕾,张自力.收益率曲面预测及其在信用债投资组合管理中的应用[J].统计研究,2021(4):145-160. 被引量：3
4王维波,徐西龙,盛立,高明.卷积神经网络微地震事件检测[J].石油地球物理勘探,2020(5):939-949. 被引量：12
5毛自新,王添.TensorFlow人脸识别技术在采煤工作面的应用研究[J].工矿自动化,2024,50(S01):78-81.
6高璇,毕晓君.基于改进Faster R-CNN的低剂量CT图像肺结节检测[J].计算机应用研究,2020,37(S02):404-406. 被引量：2
7赵毅力,李禹成,陈皓.云南野生鸟类图像自动识别系统[J].计算机应用研究,2020,37(S01):423-425. 被引量：4
8华夏,王新晴,马昭烨,王东,邵发明.基于递归神经网络的视频多目标检测技术[J].计算机应用研究,2020,37(2):615-620. 被引量：8
9蒋梦莹,林小竹,柯岩,魏战红.基于权值分布的多模型分类算法研究[J].计算机应用研究,2020,37(1):313-316. 被引量：3
10赵译文,刘云鹏.基于子空间流形的图像集识别方法[J].计算机应用,2023,43(S01):207-211.

同被引文献530

1秦天牧,尤默,张瑾哲,杨婷婷.基于自适应智能前馈的SCR脱硝系统优化控制[J].中国电机工程学报,2019,39(S01):186-192. 被引量：17
2冯喆,李卫豪,崔笛.基于高光谱成像和深度学习的山核桃内源性异物检测[J].农业机械学报,2021,52(S01):466-471. 被引量：8
3傅隆生,宋珍珍,Zhang Xin,李瑞,王东,崔永杰.深度学习方法在农业信息中的研究进展与应用现状[J].中国农业大学学报,2020,25(2):105-120. 被引量：51
4刘中涛,胡凡,王淦,李钊,王磊,葛平高,王建娟.基于特征融合的深度学习场景识别与应用[J].计算机应用研究,2020,37(S01):418-420. 被引量：1
5Jiangquan ZHANG,Yi SUN,Liang GUO,Hongli GAO,Xin HONG,Hongliang SONG.A new bearing fault diagnosis method based on modified convolutional neural networks[J].Chinese Journal of Aeronautics,2020,33(2):439-447. 被引量：42
6韩兴,刘晓平,王刚,韩松.基于深度神经网络复杂场景下的机器人拣选方法[J].北京邮电大学学报,2019,42(5):22-28. 被引量：6
7杜永忠,平雪良,何佳唯.圣女果表面缺陷检测与分级系统研究[J].农业机械学报,2013,44(S1):194-199. 被引量：22
8白云来,范育新,汤中立,江荣伏.关于中国西部龙首山、祁连山成矿区(带)进一步找矿问题的思考[J].地球科学进展,2005,20(1):36-41. 被引量：9
9刘晓旻,谭华春,章毓晋.人脸表情识别研究的新进展[J].中国图象图形学报,2006,11(10):1359-1368. 被引量：62
10罗明刚,李一民,曾素娣.基于Adaboost算法的人脸检测研究[J].计算机与数字工程,2007,35(2):7-8. 被引量：10

引证文献57

1孙家燕,吴红.设计部门编制施工图预算是控制工程造价方法的探讨[J].黑龙江科技信息,2000(5):66-66. 被引量：2
2高建华,王国富,樊卫华,毛陆原.导数荧光法测定复方新诺明中的磺胺甲胺异噁唑和甲氧苄胺嘧啶[J].郑州大学学报（自然科学版）,2000,32(1):77-79. 被引量：1
3牟晋娟.深度神经网络中激活函数的研究[J].电脑编程技巧与维护,2019,0(12):59-61. 被引量：13
4孙克雷,虞佳明,孙刚.一种基于改进Softplus激活函数的卷积神经网络模型[J].阜阳师范学院学报（自然科学版）,2020,37(1):75-79. 被引量：2
5罗伟,梁世豪,姜鑫,安妮,杜锐.基于深度学习的野外露头区岩石裂缝识别[J].计算机与现代化,2020,0(5):56-62. 被引量：8
6黄亦其,刘琪,赵建晔,黄文善,孙中宇,乔曦.基于深度卷积神经网络的红树林物种无人机监测研究[J].中国农机化学报,2020,41(2):141-146. 被引量：16
7黄婉蓉,何凯,刘坤,高圣楠.基于注意力机制的手写体中文字符识别[J].激光与光电子学进展,2020,57(8):29-34. 被引量：3
8刘国玉,王东颖,候桂军.基于改进VGGNet-16网络新生儿胆红素水平测量方法[J].计算机测量与控制,2020,28(7):55-58. 被引量：2
9李健.一个新的激活函数及其在图像分类的应用[J].现代计算机,2020,26(22):48-53.
10杨康,陈丽.自动驾驶中基于卷积神经网络的行人检测研究[J].电脑知识与技术,2020,16(25):22-24.

二级引证文献305

1黄成,金怀平,王彬,钱斌,杨彪.基于时空局部学习的集成自适应软测量方法[J].仪器仪表学报,2023,44(1):231-241. 被引量：2
2李波燕,张勇,袁德荣,熊堂堂,何浪.基于注意力机制的手写体数字识别[J].计算机科学,2022,49(S02):626-630. 被引量：5
3郎巨林,郑晟.基于CNN-RNN集成的隧道事故异常声音识别[J].电子测量技术,2023,46(20):164-169.
4高如新,常嘉浩,杜亚博,刘群坡.基于改进YOLOv5s的煤矸石目标检测算法[J].电子测量技术,2023,46(13):95-101. 被引量：1
5杨智伦,朱铮涛,陈树雄,李博,招祖炜.改进CNN的供水管道泄漏声音识别[J].国外电子测量技术,2023,42(1):153-158. 被引量：4
6张翔,孙宪坤,胡峻,尹京苑,熊玉洁.结合数据扩增与残差收缩网络的地震短临预测[J].地震,2022,42(2):74-88.
7张淑琼,何树华.2-(4-硝基苯氧甲基)-5-芳基-1,3,4-噁二唑的合成与结构表征[J].四川师范大学学报（自然科学版）,2008,31(5):590-592.
8廖志春.采用施工图预算控制工程造价的探讨[J].中国西部科技,2009,8(7):13-14. 被引量：7
9周宇,叶文桃,麦海妍,彭雁忠.门脉高压性胃病患者血浆、尿中内皮素浓度变化及意义[J].临床肝胆病杂志,2000,16(1):47-48. 被引量：4
10韩涛,朱光喜,朱耀庭,姚文冰.基于自适应时间窗的多媒体实时传输协议　[J].计算机工程与应用,2000,36(4):15-16. 被引量：4

1宋兆鑫,张建成,赵霁晴,郭伟.改进型滑模观测器飞轮储能系统控制方法[J].华北电力大学学报（自然科学版）,2018,45(5):36-42. 被引量：2
2龚婉,陈晓玲,周莉,章科娜.阿魏酸钠对大鼠脑缺血再灌注炎症损伤的保护作用及机制分析[J].中国实验方剂学杂志,2019,25(3):94-99. 被引量：29
3王正玲,宋玉宁,程玉清.小鼠癫痫模型血清谷氨酸脱羧酶抗体和TLR4水平与海马神经元损伤的关系[J].广东医学,2019,40(1):87-90. 被引量：5
4郭沫.智汇云BIM:为建筑赋能奏响行业最强音[J].中国商界,2019,0(6):100-103.
5赵恒,陈娱欣,续小丁,胡波.基于局部对称重加权惩罚最小二乘的拉曼基线校正[J].中国激光,2018,45(12):274-285. 被引量：10
6林淑君,张玉娟,林吉欢,张毅敏,朱明敏,张玉卿,蒲柳,陈淑莲,陈伟豪,程少冰.针刺对创伤性脑损伤大鼠神经损伤的影响[J].针刺研究,2019,44(1):19-24. 被引量：22
7薛衡,黄祖熹,王贺华,安永生,刘榧,成一,何冰,刘卡.Ahdeb油田水平井控水完井及一体化耦合模型[J].石油与天然气地质,2019,40(2):423-429. 被引量：6
8王泽梁,汪丽华.基于递进扩散模型的显著性检测[J].廊坊师范学院学报（自然科学版）,2019,19(1):14-20.
9于越,彭浩,朱勇喆.肠道病毒71型感染C57BL/6小鼠模型的初步建立[J].畜牧与兽医,2019,51(5):77-82. 被引量：1
10崔保春,文迪,马思远,王立鹏.基于新型趋近律的无刷直流电机滑模控制[J].电气传动,2019,49(4):3-5. 被引量：7

浙江大学学报（工学版）

2019年第7期

浏览历史

内容加载中请稍等...

用于图像分类的卷积神经网络中激活函数的设计被引量：57

参考文献6

二级参考文献68

共引文献608

同被引文献530

引证文献57

二级引证文献305

相关作者

相关机构

相关主题

浏览历史

用于图像分类的卷积神经网络中激活函数的设计 被引量：57

参考文献6

二级参考文献68

共引文献608

同被引文献530

引证文献57

二级引证文献305

相关作者

相关机构

相关主题

浏览历史

用于图像分类的卷积神经网络中激活函数的设计被引量：57