基于权值不确定性的玻尔兹曼机算法被引量：2

Algorithms of Boltzmann Machines Based on Weight Uncertainty

下载PDF

导出

摘要受限制的玻尔兹曼机(RBM)是一种无向图模型.基于RBM的深度学习模型包括深度置信网(DBN)和深度玻尔兹曼机(DBM)等.在神经网络和RBM的训练过程中,过拟合问题是一个比较常见的问题.针对神经网络的训练,权值随机变量(weight random variables)、Dropout方法和早期停止方法已被用于缓解过拟合问题.首先,改变RBM模型中的训练参数,使用随机变量代替传统的实值变量,构建了基于随机权值的受限的波尔兹曼机(weight uncertainty RBM,简称WRBM),接下来,在WRBM基础上构建了相应的深度模型:Weight uncertainty Deep Belief Network(WDBN)和Weight uncertainty Deep Boltzmann Machine(WDBM),并且通过实验验证了WDBN和WDBM的有效性.最后,为了更好地建模输入图像,引入基于条件高斯分布的RBM模型,构建了基于spike-and-slab RBM(ssRBM)的深度模型,并通过实验验证了模型的有效性. Based on the restricted Boltzmann machine（RBM）,which is a probabilistic graphical model,deep learning models contain deep belief net（DBN）and deep Boltzmann machine（DBM）.The overfitting problems commonly exist in neural networks and RBM models.In order to alleviate the overfitting problem,this paper introduces weight random variables to the conventional RBM model and,then builds weight uncertainty deep models based on maximum likelihood estimation.In the experimental section,the paper verifies the effectiveness of the weight uncertainty RBM.In order to improve the image recognition ability,the paper introduces the spike-and-slab RBM（ssRBM）to weight uncertainty RBM and then builds the deep models.The experiments show that the deep models based on weight random variables are effective.

作者丁世飞张健史忠植 DING Shi-Fei;ZHANG Jian;SHI Zhong-Zhi(School of Computer Science and Technology, China University of Mining and Technology, Xuzhou 221116, China;Key Laboratory of Intelligent Information Processing, Institute of Computing Technology, The Chinese Academy of Sciences, Beijing 100190, China)

机构地区中国矿业大学计算机科学与技术学院中国科学院计算技术研究所智能信息处理重点实验室

出处《软件学报》 EI CSCD 北大核心 2018年第4期1131-1142,共12页 Journal of Software

基金国家自然科学基金(61672522 61379101) 国家重点基础研究发展计划(973)(2013CB329502)~~

关键词玻尔兹曼机深度玻尔兹曼机深度置信网权值不确定性 RBM （restricted Boltzmann machine） DBM （deep Boltzmann machine） DBN （deep belief net） weight uncertainty

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1刘建伟,刘媛,罗雄麟.玻尔兹曼机研究进展[J].计算机研究与发展,2014,51(1):1-16. 被引量：71
2胡振,傅昆,张长水.基于深度学习的作曲家分类问题[J].计算机研究与发展,2014,51(9):1945-1954. 被引量：21

二级参考文献86

1Hopfield J J. Neural networks and physical systems with emergent col|ective computational abilities [J]. Proceedings of the National Academy of Sciences of the United States of America, 1982, 79(8):2554-2558. 被引量：1
2Hinton G E, Sejnowski T J. Optimal perceptual inference [C]//Proc of the 1983 IEEE Conf on Computer Vision and Pattern Recognition. Los Alamitos, CA: IEEE Computer Society, 1983: 448-453. 被引量：1
3Hinton G E, Sejnowski T J. Analyzing cooperative computation [C] //Proc of the 5th Annual Congress of the Cognitive Science Society. New York: ACM, 1983: 2554- 2558. 被引量：1
4Hofstadter D R. The copycat project: An experiment in nondeterminism and creative analogies [DB/OL:. MIT Artificial Intelligence Laboratory Memo 755. (1984- 01-01) [2004-10-01]. http://hdl, handle, net/1721.1/5648. 被引量：1
5Hofstadter D R. A Non-Deterministic Approach to Analogy, Involving the Ising Model of Ferromagnetism[M] //The Physics of Cognitive Processes. Hackensack: World Scientific, 1987. 被引量：1
6Smolensky P. Information Processing in Dynamical Systems: Foundations of Harmony Theory [M]//Parallel Distributed Processing, Vol 1: Foundations. Cambridge: MIT Press, 1986: 194-281. 被引量：1
7Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for Boltzmann machines [J]. Cognitive Science, 1985, 9(1): 147-169. 被引量：1
8Hinton G E. Training products otF experts by minimizing contrastive divergence[J]. Neural Computation, 2002, 14 (8) : 1771-1800. 被引量：1
9Kirkpatrick S, Gelatt C D, Vecchi M P. Optimization by simulated annealing [J]. Science, 1983, 220 (4598) : 671- 680. 被引量：1
10Hinton G E. To recognize shapes, first learn to generate images [J]. Computational Neuroscience: Theoretical Insights into Brain Function, 2007, 165(1): 535-547. 被引量：1

共引文献89

1李辉,范智超,李华,白亮,贾嵘,罗兴锜.基于SVD和DBN的水电机组故障诊断[J].水力发电学报,2020,39(12):104-112. 被引量：19
2高强,阳武,李倩.基于空间信息的DBN图像分类快速训练模型[J].系统仿真学报,2015,27(3):549-558. 被引量：4
3张立民,刘凯.基于深度玻尔兹曼机的文本特征提取研究[J].微电子学与计算机,2015,32(2):142-147. 被引量：9
4张晶华,甘宇健.基于深度学习支持向量机的上证指数预测[J].统计与决策,2019,35(2):176-178. 被引量：7
5孙天凯,邵晓根,鞠训光.基于对称受限玻尔兹曼机的协同过滤算法[J].江苏科技大学学报（自然科学版）,2014,28(4):392-394. 被引量：2
6尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59. 被引量：385
7周慧,周良,丁秋林.基于深度学习的疲劳状态识别算法[J].计算机科学,2015,42(3):191-194. 被引量：9
8张春霞,姬楠楠,王冠伟.受限波尔兹曼机[J].工程数学学报,2015,32(2):159-173. 被引量：104
9陆军建,林家骏.基于CUDA和深度置信网络的手写字符识别[J].华东理工大学学报（自然科学版）,2015,41(2):210-215. 被引量：7
10王培良,夏春江.基于PCA-PDBNs的故障检测与自学习辨识[J].仪器仪表学报,2015,36(5):1147-1154. 被引量：21

同被引文献18

1李晋徽,杨俊安,王一.一种新的基于瓶颈深度信念网络的特征提取方法及其在语种识别中的应用[J].计算机科学,2014,41(3):263-266. 被引量：10
2潘广源,柴伟,乔俊飞.DBN网络的深度确定方法[J].控制与决策,2015,30(2):256-260. 被引量：53
3陈雷,杨俊安,王一,王龙.LVCSR系统中一种基于区分性和自适应瓶颈深度置信网络的特征提取方法[J].信号处理,2015,31(3):290-298. 被引量：9
4陈娜,蒋芸,邹丽,沈建,胡学伟,李志磊.基于判别式受限玻尔兹曼机的医学图像分类法[J].计算机科学,2015,42(5):315-319. 被引量：12
5王培良,夏春江.基于PCA-PDBNs的故障检测与自学习辨识[J].仪器仪表学报,2015,36(5):1147-1154. 被引量：21
6高强,阳武,李倩.DBN层次趋势研究及其在航拍图像故障识别中的应用[J].仪器仪表学报,2015,36(6):1267-1274. 被引量：16
7施徐敢,张石清,赵小明.融合深度信念网络和多层感知器的人脸表情识别[J].小型微型计算机系统,2015,36(7):1629-1632. 被引量：15
8张迪飞,张金锁,姚克明,成明伟,吴永国.基于SVM分类的红外舰船目标识别[J].红外与激光工程,2016,45(1):167-172. 被引量：62
9郑昌艳,梅卫,王刚.基于深度卷积神经网络的蛇形机动航迹图像识别[J].火力与指挥控制,2016,41(5):66-70. 被引量：9
10耿志强,张怡康.一种基于胶质细胞链的改进深度信念网络模型[J].自动化学报,2016,42(6):943-952. 被引量：9

引证文献2

1周涛,陆惠玲,霍兵强.深度信念网络研究进展[J].计算机工程与应用,2020,56(9):24-32. 被引量：9
2许来祥,刘刚,刘森,曹冰许,张培根.基于改进CNN的红外目标识别方法研究[J].火力与指挥控制,2020,45(8):136-141. 被引量：13

二级引证文献22

1马垠飞,王力.融合D-S证据理论的DBN电路故障诊断算法[J].辽宁工程技术大学学报（自然科学版）,2021,40(5):448-453. 被引量：3
2范少地,许建中,唐康来,李起鸿.缓慢牵伸肢体延长周围神经亚临床损害修复过程的观察[J].第三军医大学学报,2000,22(5):470-473. 被引量：6
3刘瑞春.水利水电建筑能耗短期预测模型构建[J].信息技术,2021,45(3):161-166. 被引量：2
4于宁,孙业新,陈洪月.基于多源数据融合的采煤机截割载荷预测方法[J].中国机械工程,2021,32(10):1247-1253. 被引量：8
5周扬.基于深度信念网络的脑电信号疲劳检测系统研究[J].科技视界,2021(18):101-102.
6Caixia Tao,Xu Wang,Fengyang Gao,Min Wang.Fault Diagnosis of Photovoltaic Array Based on Deep Belief Network Optimized by Genetic Algorithm[J].Chinese Journal of Electrical Engineering,2020,6(3):106-114. 被引量：2
7赵春领.强化学习在混合动力汽车能量管理上的研究综述[J].汽车实用技术,2021,46(16):178-180.
8李环,罗惠中,刘媛媛.干扰环境下飞行器的识别与跟踪技术研究[J].沈阳理工大学学报,2021,40(5):12-16.
9赵立新,邢润哲,白银光,张宏昌,何春燕.深度学习在目标检测的研究综述[J].科学技术与工程,2021,21(30):12787-12795. 被引量：40
10李岩,袁湛,张振杰.基于深度学习的红外图像目标检测技术研究[J].信息与电脑,2022,34(3):31-34.

1张瑞贤.基于互联网金融的中小企业融资模式创新[J].环球市场,2017,0(36):86-86.
2李翔,庞革平,温素威.人工智能和实体经济如何深度融合[J].决策探索,2018(7):34-35. 被引量：2
3杨望灿,张培林,孙也尊,吴定海.引入自适应学习率的深度学习模型及其应用[J].华中科技大学学报（自然科学版）,2018,46(4):18-24. 被引量：6
4陈晓梅.混杂纤维轻骨料混凝土配合比优选研究[J].长春工程学院学报（自然科学版）,2016,17(2):6-9. 被引量：1
5Zechun HU,Xue PENG.Uniform nonintegrability of random variables[J].Frontiers of Mathematics in China,2018,13(1):41-53. 被引量：1
6唐智灵,吕晓朦.基于改进的深度置信网络的电离层F2层临界频率预测[J].计算机应用研究,2018,35(3):825-829. 被引量：1
7谷宇,吕晓琪,李菁,任国印,喻大华,赵瑛,吴凉,张文莉,郝小静,黄显武.多模态3D卷积神经网络脑部胶质瘤分割方法[J].科学技术与工程,2018,18(7):18-24. 被引量：4
8何正民.微专题三十四独立事件及随机变量的概率分布[J].中学数学教学参考,2018(4):48-51.
9杨楠,南琳,张丁一,库涛.基于深度学习的图像描述研究[J].红外与激光工程,2018,47(2):9-16. 被引量：28
10马翠红,王汉炳.LIBS结合自由定标法对钢液中多元素成分定量分析[J].激光杂志,2017,38(11):38-41. 被引量：3

软件学报

2018年第4期

浏览历史

内容加载中请稍等...

基于权值不确定性的玻尔兹曼机算法被引量：2

参考文献2

二级参考文献86

共引文献89

同被引文献18

引证文献2

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于权值不确定性的玻尔兹曼机算法 被引量：2

参考文献2

二级参考文献86

共引文献89

同被引文献18

引证文献2

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于权值不确定性的玻尔兹曼机算法被引量：2