基于强化学习的特征选择方法及材料学应用被引量：3

Feature selection based on reinforcement learning and its application in material informatics

下载PDF

导出

摘要随着大数据、人工智能以及高性能计算的快速发展,数据驱动的新材料研发成为研究热点.在对材料数据进行数据挖掘的过程中,需要对特征集合进行预处理,通过减少无关冗余特征,不仅可以避免模型过拟合,还能提高模型的可解释性.基于此,提出了一种基于强化学习的特征选择(feature selection based on reinforcement learning,FSRL)算法,将封装式特征选择抽象成机器学习模型和“环境”互动的过程,并根据利益最大化准则将对应特征加入特征子集中.同时,为了提高模型的预测精度,还提出一种基于符号变换的特征构造方法来生成新的特征.最后,将所提出方法应用到非晶合金材料的分类预测任务和铝基复合材料的回归任务中.实验结果表明,FSRL算法的分类准确率最高提升了2.8%,而在回归任务中,基于特征构造的FSRL算法使得预测精度最高提升了22.9%. Owing the rapid development of big data,artificial intelligence,and highperformance computing,the research and development of data-driven materials has intensified.During data mining and the machine learning of material data,the feature set must be preprocessed by reducing redundant and irrelevant features,which can not only avoid model overfitting,but also improve the model interpretability.Herein,a feature selection method based on reinforcement learning,known as FSRL,is proposed.By abstracting the encapsulated feature selection method into the interaction between the machine learning model and environment,the corresponding features are selected based on the maximum reward and then incorporated to the feature subset.In addition,we propose a feature construction method based on symbolic transformation to generate new high-order features to improve the prediction accuracy of the model.Subsequently,we apply the abovementioned method to the classification task of amorphous alloy materials and the regression task of aluminum matrix composite materials.Experiments show that our proposed method not only successfully achieve feature transformation in the FSRL,but also afford a 2.8%prediction improvement in the classification task and a 22.9%prediction improvement in the regression task respectively.

作者张鹏张瑞 ZHANG Peng;ZHANG Rui(School of Computer Engineering and Science,Shanghai University,Shanghai 200444,China;Center of Materials Informatics and Data Science,Materials Genome Institute,Shanghai University,Shanghai 200444,China;Zhejiang Laboratory,Hangzhou 311100,Zhejiang,China)

机构地区上海大学计算机工程与科学学院上海大学材料基因组工程研究院材料信息与数据科学中心之江实验室

出处《上海大学学报（自然科学版）》 CAS CSCD 北大核心 2022年第3期463-475,共13页 Journal of Shanghai University:Natural Science Edition

基金国家重点研发计划资助项目(2018YFB0704400) 云南省重大科技专项资助项目(202102AB080019-3,202002AB080001-2) 之江实验室科研攻关资助项目(2021PE0AC02) 上海张江国家自主创新示范区专项发展资金重大资助项目(ZJ2021-ZD-006)。

关键词特征选择强化学习特征构造方法 feature selection reinforcement learning feature construction method

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献13

1计智伟,胡珉,尹建新.特征选择算法综述[J].电子设计工程,2011,19(9):46-51. 被引量：46
2黄莉莉,汤进,孙登第,罗斌.基于多标签ReliefF的特征选择算法[J].计算机应用,2012,32(10):2888-2890. 被引量：37
3吴迪,郭嗣琮.改进的Fisher Score特征选择方法及其应用[J].辽宁工程技术大学学报（自然科学版）,2019,38(5):472-479. 被引量：10
4崔鸿雁,徐帅,张利锋,Roy E.Welsch,Berthold K.P.Horn.机器学习中的特征选择方法研究及展望[J].北京邮电大学学报,2018,41(1):1-12. 被引量：44
5姚登举,杨静,詹晓娟.基于随机森林的特征选择算法[J].吉林大学学报（工学版）,2014,44(1):137-141. 被引量：254
6姚旭,王晓丹,张玉玺,权文.特征选择方法综述[J].控制与决策,2012,27(2):161-166. 被引量：207
7毛勇,周晓波,夏铮,尹征,孙优贤.特征选择算法研究综述[J].模式识别与人工智能,2007,20(2):211-218. 被引量：95
8唐振韬,邵坤,赵冬斌,朱圆恒.深度强化学习进展:从AlphaGo到AlphaGo Zero[J].控制理论与应用,2017,34(12):1529-1546. 被引量：92
9高阳,陈世福,陆鑫.强化学习研究综述[J].自动化学报,2004,30(1):86-100. 被引量：270
10刘路放,冯博琴,谢友柏.符号回归的枚举原型算法及其匹配算法研究[J].西安交通大学学报,2000,34(3):1-4. 被引量：2

二级参考文献203

1金方杰,欧阳求保,周伟敏,张荻.14%SiC/7A04铝基复合材料的加工图[J].机械工程材料,2008,32(10):76-79. 被引量：4
2陈永来,吕宏军,张宇玮,王琪.纳米级SiC_p/6066Al复合材料的制备与力学性能的研究[J].宇航材料工艺,2005,35(2):57-59. 被引量：6
3武晓峰,张海峰,胡壮麒.W丝增强含Co锆基非晶复合材料的变形行为与力学性能[J].稀有金属材料与工程,2005,34(6):863-866. 被引量：14
4马广才,李文,李宏,张海峰,胡壮麒.In-Sn合金熔体在非晶和晶态Cu_(46)Zr_(45)Al_7Gd_2合金上的润湿性及界面特性[J].金属学报,2006,42(2):201-204. 被引量：6
5徐前刚,邱克强,张海峰,胡壮麒.Zr_(41.25)Ti_(13.75)Ni_(10)Cu_(12.5)Be_(22.5)熔体与W的润湿及复合[J].稀有金属材料与工程,2007,36(5):813-816. 被引量：3
6毛勇,周晓波,夏铮,尹征,孙优贤.特征选择算法研究综述[J].模式识别与人工智能,2007,20(2):211-218. 被引量：95
7Radhakrishna Bhat B V, Mahjan Y R, Roshan H M, et al. Processing Map for Hot Working of Powder Metallurgy 2124 Al2 20 Vol Pct SiCp Metal Matrix Composite [ J ]. Metallurgical Transactions A, 1992, 23A: 123-130. 被引量：1
8Cui Guanghua(崔光华).Effects of Cryogenic Treatment on Properties of Aluminum Matrix composites(深冷处理对铝基复合材料性能的影响)[D].Shanghai:Shanghai Jiao Tong University,2008. 被引量：1
9Maruyama B, Hunt W H. Discontinuously Reinforced Aluminum: Current Status and Future Direction [ J]. JOM, 1999 (11): 59-61. 被引量：1
10Jerome P. Commercial Success for MMCs[ J]. Powder Metallurgy, 1998, 41:25-30. 被引量：1

共引文献1091

1朱小培,位云朋,闫李,韩茜茜.基于多模态进化计算的特征选择策略[J].中原工学院学报,2021,32(4):71-76.
2陈文明.色谱重叠峰的解析方法概论[J].中国水运（下半月）,2020(5):69-71. 被引量：4
3郑睿程,顾洁,金之俭,彭虹桥,蔡珑.数据驱动与预测误差驱动融合的短期负荷预测输入变量选择方法研究[J].中国电机工程学报,2020,40(2):487-500. 被引量：43
4赵小强,牟淼.基于变量分块的KDLV-DWSVDD间歇过程故障检测算法研究[J].仪器仪表学报,2021,42(2):244-256. 被引量：7
5盛晓欣,田翔华,周毅.基于随机森林癫痫患者脑电数据的分析研究[J].中国数字医学,2020,15(1):41-43.
6姚红革,王诚,喻钧,白小军,李蔚.复杂卫星图像中的小目标船舶识别[J].遥感学报,2020,24(2):116-125. 被引量：16
7杨仙保,张王菲,孙斌,高志海,李毅夫,王晗.基于GEE和Sentinel-2时序数据的呼伦贝尔沙地及其周边植被类型识别研究[J].遥感技术与应用,2022,37(4):982-992. 被引量：3
8唐易,陈奕希,喻洪流,石萍.一种面向下肢假肢的运动意图识别方法及验证[J].信息与控制,2023,52(5):598-606. 被引量：2
9项宇,秦进,袁琳琳.结合向前状态预测和隐空间约束的强化学习表示算法[J].计算机系统应用,2022,31(11):148-156. 被引量：4
10李海宾,彭建洪,王万玺,陈平,丰义航.NbC和非晶相共强化高锰钢基复合材料的力学性能与微观组织[J].热加工工艺,2020,0(2):65-69. 被引量：1

同被引文献27

1李一航,肖斌,唐宇超,刘馥,王小梦,刘轶.尖晶石氧化物能量和结构的第一性原理计算和机器学习[J].上海大学学报（自然科学版）,2021,27(4):635-649. 被引量：2
2李国正,李丹.集成学习中特征选择技术[J].上海大学学报（自然科学版）,2007,13(5):598-604. 被引量：7
3Yongjiang Huang,Zhiliang Ning,Zhe Shen,Weizhong Liang,Haicao Sun,Jianfei Sun.Bending behavior of as-cast and annealed ZrCuNiAl bulk metallic glass[J].Journal of Materials Science & Technology,2017,33(10):1153-1158. 被引量：1
4Sheng GUO,C.T. LIU.Phase stability in high entropy alloys:Formation of solid-solution phase or amorphous phase[J].Progress in Natural Science:Materials International,2011,21(6):433-446. 被引量：111
5Teng Zhou,Zhen Song,Kai Sundmacher.Big Data Creates New Opportunities for Materials Research: A Review on Methods and Applications of Machine Learning for Materials Design[J].Engineering,2019,5(6):1017-1026. 被引量：30
6Xibin DONG,Zhiwen YU,Wenming CAO,Yifan SHI,Qianli MA.A survey on ensemble learning[J].Frontiers of Computer Science,2020,14(2):241-258. 被引量：48
7Ke Ye,Ang Cao,Jiaqi Shao,Gang Wang,Rui Si,Na Ta,Jianping Xiao,Guoxiong Wang.Synergy effects on Sn-Cu alloy catalyst for efficient CO2 electroreduction to formate with high mass activity[J].Science Bulletin,2020,65(9):711-719. 被引量：17
8吴佳琦,孙奕韬,汪卫华,李茂枝.机器学习在非晶材料中的应用[J].中国科学：物理学、力学、天文学,2020,50(6):3-16. 被引量：7
9Guo-zheng QUAN,Pu ZHANG,Yao-yao MA,Yu-qing ZHANG,Chao-long LU,Wei-yong WANG.Characterization of grain growth behaviors by BP-ANN and Sellars models for nickle-base superalloy and their comparisons[J].Transactions of Nonferrous Metals Society of China,2020,30(9):2435-2448. 被引量：13
10舒豪,王晨,史崯.基于BiLSTM和注意力机制的入侵检测[J].计算机工程与设计,2020,41(11):3042-3046. 被引量：9

引证文献3

1宗宇杨,李俊辉,朱向东,单光存,马汝广.机器学习在高熵电催化材料中的研究进展[J].上海大学学报（自然科学版）,2023,29(5):859-885.
2张婷,龙志林,彭黎.基于融合策略的块体金属玻璃形成能力预测[J].Transactions of Nonferrous Metals Society of China,2024,34(5):1558-1570. 被引量：1
3黄迎春,任国杰.基于PER-PPO2的入侵检测技术[J].沈阳理工大学学报,2024,43(5):7-13.

二级引证文献1

1刘城城,魏海霞,付奎源,苏航.机器学习在材料科学中的应用[J].鞍钢技术,2024(6):34-49.

1张照硕,侯能.基于遗传算法的封装式特征选择研究[J].电脑知识与技术,2022,18(19):94-96. 被引量：1
2岳溪朝,冯燕,刘健,于烨泳,席慷杰,钱权.材料基因组工程专用数据库[J].上海大学学报（自然科学版）,2022,28(3):399-412. 被引量：7
3王迪,黄锦辉,谭超林,杨永强.激光增材制造过程中循环热输入对组织和性能的影响[J].金属学报,2022,58(10):1221-1235. 被引量：4
4王双,徐瑶,韩建云,丁磊.基于机器学习算法的机票价格预测研究[J].民航学报,2022,6(5):16-20. 被引量：1
5李紫鹏,李书洋,李阳阳,孙榕.可复用的BGA封装温度循环仿真流程[J].科技风,2022(30):4-7.
6朱文礼.开展幼儿户外游戏活动的行动研究[J].山西教育（教学版）,2022(9):93-94. 被引量：2
7王扬,陈梅,李晖.FOCoR:一种基于特征选择优化的课程推荐技术[J].计算机与现代化,2022(10):1-7.
8徐燕,胡红青,刘茜,张玉凤,丁广太,张惠然.面向复合材料带隙预测的两段式集成学习模型构建[J].上海大学学报（自然科学版）,2022,28(3):504-511.
9戴娜娜.关注学习幸福成长——指向幼儿学习的园本课程建设[J].美眉,2022(10):22-24.
10陈茜,武星.结合上下文词汇匹配和图卷积的材料数据命名实体识别[J].上海大学学报（自然科学版）,2022,28(3):372-385.

上海大学学报（自然科学版）

2022年第3期

浏览历史

内容加载中请稍等...

基于强化学习的特征选择方法及材料学应用被引量：3

参考文献13

二级参考文献203

共引文献1091

同被引文献27

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的特征选择方法及材料学应用 被引量：3

参考文献13

二级参考文献203

共引文献1091

同被引文献27

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于强化学习的特征选择方法及材料学应用被引量：3