基于KMSMOTE和随机森林的爬升段油耗分类被引量：2

FUEL CONSUMPTION CLASSIFICATION IN CLIMBING PHASE BASED ON KMSMOTE AND RANDOM FOREST

下载PDF

导出

摘要为了解决飞机燃油消耗预测过程中的数据不平衡问题,传统SMOTE方法对少数类随机构造伪样本,从而导致了数据分布的整体变化和模糊了区间边界。针对以上问题,提出一种基于k-medoids的改进SMOTE算法,即KMSMOTE,并以随机森林作为分类器进行爬升段油耗分类。该方法使用k-medoids对少数类进行聚类操作,在聚类簇的基础上使用SMOTE构造伪样本,确保分类结果不会偏向多数类;应用随机森林算法生成分类器。选取国内同一航线、同一机型的多个航班数据为实验样本,实验结果表明,改进后的算法分类效果更好。 In order to solve the problem of data imbalance in the prediction of aircraft fuel consumption, the traditional SMOTE randomly constructs a few pseudo-samples, which leads to the overall change of data distribution and the blurs of the interval boundary. Aiming at the above problems, we proposed an improved SMOTE based on k-medoids, namely KMSMOTE, and random forest was used as classifier to classify the fuel consumption in the climbing phase. In this method, k-medoids was used to cluster a few classes, and SMOTE was applied to construct pseudo-samples on the basis of clustering, so as to ensure that the classification results were not biased towards most classes. We used the random forest to generate the classifier. Multiple flight data of the same airline and the same aircraft type in the domestic were selected as experimental samples. The experimental results show that the improved algorithm has better classification effect.

作者陈静杰崔金成 Chen Jingjie;Cui Jincheng(College qf Electronic Information and Automation , Civil Aviation University of China, Tianjin 300300, China)

机构地区中国民航大学电子信息与自动化学院

出处《计算机应用与软件》北大核心 2019年第4期247-250,316,共5页 Computer Applications and Software

基金国家科技支撑计划项目(2012BAC20B0304)

关键词爬升段不平衡 k-medoids SMOTE 随机森林 Climbing phase Imbalance k-medoids SMOTE Random forest

分类号 TP391.9 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献9

1金鑫,葛国青,陆旭,赵永彬.不平衡数据分类预测的阈值优化算法ε-KSVM[J].计算机应用与软件,2018,35(1):276-280. 被引量：1
2王超学,潘正茂,董丽丽,马春森,张星.基于改进SMOTE的非平衡数据集分类研究[J].计算机工程与应用,2013,49(2):184-187. 被引量：19
3李秋洁,茅耀斌,王执铨.基于Boosting的不平衡数据分类算法研究[J].计算机科学,2011,38(12):224-228. 被引量：17
4于化龙,高尚,赵靖,秦斌.基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J].计算机科学,2012,39(5):190-194. 被引量：9
5谷润平,黄磊,赵向领.基于QAR数据的飞机发动机性能异常检测[J].航空计算技术,2015,45(4):1-3. 被引量：9
6朱明,陶新民.基于随机下采样和SMOTE的不均衡SVM分类算法[J].信息技术,2012,36(1):39-43. 被引量：13
7曹惠玲,贾超.基于QAR的民航发动机燃油流量控制规律研究[J].科学技术与工程,2013,21(13):3814-3817. 被引量：15
8陈静杰,肖冠平.飞机航段油耗区间估计最小样本量分析[J].计算机工程与设计,2014,35(12):4356-4359. 被引量：7
9陈斌,苏一丹,黄山.基于KM-SMOTE和随机森林的不平衡数据分类[J].计算机技术与发展,2015,25(9):17-21. 被引量：22

二级参考文献93

1涂承胜,陆玉昌.Boosting视角[J].计算机科学,2005,32(5):140-143. 被引量：2
2程荣辉,古远兴,黄红超,李美金,黄顺洲.民用航空发动机核心机技术发展研究[J].燃气涡轮试验与研究,2007,20(1):1-7. 被引量：9
3杨平,郑金华.遗传选择算子的比较与研究[J].计算机工程与应用,2007,43(15):59-62. 被引量：46
4Mason L,Baxter J,Bartlett P,et al. Boosting algorithms as gra dient deseent[C] // Neural Information Processing Systems 12 Cambridge: MIT Press, 2000 : 512-518. 被引量：1
5Friedman J, Hastie T, Tibshirani R. Additive logistic regression a statistical view of boosting[J]. The Annals of Statistics, 2000 28(2) : 337-407. 被引量：1
6Seiffert C,Khoshgoftaar T M, Hulse J V, et al. RUSBoost: Im proving classification performance when training data is skewed [C]//Proceedings of 19th International Conference on Pattern Recognition. Washington DC: IEEE Computer Society, 2008:1-4. 被引量：1
7Guo H Y,Viktor H L. Learning from imbalanced data sets with boosting and data generation: the DataBoost-IM approach[J]. SIGKDD Explorations, 2004,6 ( 1 ):30-39. 被引量：1
8Sun Y,Kamel M S,Wong A K C, et al. Cost-sensitive boosting for classification of imbalanced data[J].Pattern Recognition, 2007,40(12) :3358-3378. 被引量：1
9Li Q J, Mao Y B, Wang Z Q, et al. Cost-sensitive boosting: fit ring an additive asymmetric logistic regression model[C]//Proceedings of the 1st Asian Conference on Machine Learning: Advances in Machine Learning ( ACML ' 09 ). Berlin: Springer, 2009 : 234-247. 被引量：1
10Masnadi-Shirazi H, Vaseoneelos N. Cost-sensitive boosting[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,33(2) :294-309. 被引量：1

共引文献99

1于化龙,倪军,徐森.基于留一交叉验证的类不平衡危害预评估策略[J].小型微型计算机系统,2012,33(10):2287-2292. 被引量：5
2陶新民,郝思媛,张冬雪,徐鹏.不均衡数据分类算法的综述[J].重庆邮电大学学报（自然科学版）,2013,25(1):101-110. 被引量：66
3于重重,商利利,谭励,涂序彦,杨扬.半监督学习在不平衡样本集分类中的应用研究[J].计算机应用研究,2013,30(4):1085-1089. 被引量：8
4殷士勇.基于FCM-KFDA判别的不平衡数据集分类[J].华中师范大学学报（自然科学版）,2013,47(6):776-780.
5刘余霞,刘三民,刘涛,王忠群.一种新的过采样算法DB_SMOTE[J].计算机工程与应用,2014,50(6):92-95. 被引量：12
6侯杰,茅耀斌,孙金生.基于指数损失和0-1损失的在线Boosting算法[J].自动化学报,2014,40(4):635-642. 被引量：2
7李勇,刘战东,张海军.不平衡数据的集成分类算法综述[J].计算机应用研究,2014,31(5):1287-1291. 被引量：75
8闵建.基于加权支持向量机的热轧带钢弯曲质量预测[J].热加工工艺,2018,47(23):165-167. 被引量：1
9张旭东,孙圣力,王洪超.基于数据挖掘的触诊成像乳腺癌智能诊断模型和方法[J].大数据,2019,5(1):68-76. 被引量：4
10何田中,周忠眉,黄再祥.基于选择度的分类规则学习算法[J].计算机工程,2014,40(8):179-182.

同被引文献15

1刘敏,郎荣玲,曹永斌.随机森林中树的数量[J].计算机工程与应用,2015,51(5):126-131. 被引量：58
2魏正韬,杨有龙,白婧.基于非平衡数据的随机森林分类算法改进[J].重庆大学学报（自然科学版）,2018,41(4):54-62. 被引量：11
3郭玉萱,阮春阳,王晔,张彦春.基于不平衡数据分类的中药肝毒性检测[J].计算机应用与软件,2018,35(8):226-230. 被引量：3
4彭如香,杨涛,孔华锋,姜国庆,凡友荣.基于CPD-SMOTE的类不平衡数据分类算法研究[J].计算机应用与软件,2018,35(12):259-262. 被引量：7
5朱珏钰,曹亚微,周书仁,李峰.基于随机森林深度特征选择的人体姿态估计[J].计算机工程与应用,2017,53(2):172-176. 被引量：13
6曾建华.一种基于核PCA的网络流量异常检测算法[J].计算机应用与软件,2018,35(3):140-144. 被引量：17
7王杰,程学新,彭金柱.一种基于粒子群算法优化的加权随机森林模型[J].郑州大学学报（理学版）,2018,50(1):72-76. 被引量：21
8任才溶,谢刚.基于随机森林和气象参数的PM_(2.5)浓度等级预测[J].计算机工程与应用,2019,55(2):213-220. 被引量：43
9刘一然,骆力明.基于SVM的学科试题自动分类研究[J].计算机应用与软件,2019,36(1):197-203. 被引量：8
10向鸿鑫,杨云.不平衡数据挖掘方法综述[J].计算机工程与应用,2019,55(4):1-16. 被引量：54

引证文献2

1张家伟,郭林明,杨晓梅.针对不平衡数据的过采样和随机森林改进算法[J].计算机工程与应用,2020,56(11):39-45. 被引量：36
2衷宇清,陈文文,李昭桦.不平衡数据分类中的数据重采样比较研究[J].通信技术,2020,53(6):1376-1384. 被引量：4

二级引证文献40

1马海荣,罗治情,陈聘婷,官波.基于机器学习的高分辨率遥感影像农业大棚提取[J].湖北农业科学,2020(S01):199-203. 被引量：2
2邱云飞,郭蕾.面向非均衡数据的糖尿病并发症预测[J].数据分析与知识发现,2021,5(2):116-128. 被引量：6
3管峻,毛保磊,刘慧英.利用单分类SVM算法检测Android应用程序[J].计算机系统应用,2021,30(6):148-153. 被引量：2
4张杨,董士程.面向并发程序中锁机制的智能化推荐方法[J].计算机应用,2021,41(6):1597-1603. 被引量：2
5谭文侃,叶义成,胡南燕,吴孟龙,黄兆云.LOF与改进SMOTE算法组合的强烈岩爆预测[J].岩石力学与工程学报,2021,40(6):1186-1194. 被引量：31
6路佳佳.随机森林算法中数据切分方法研究[J].唐山师范学院学报,2021,43(3):73-75.
7罗预欣,张兵,薛运强.基于变量分析和粒子群优化加权随机森林的交通事件检测方法[J].科学技术与工程,2021,21(14):6044-6049. 被引量：11
8张雯涛,吴飞,朱海,通雁辉,陆雯霞.基于FDE-IRF的室内指纹定位方法[J].全球定位系统,2021,46(4):117-126.
9邓明阳,郭应时,刘通.基于分层重组的不平衡数据采样方法研究[J].重庆理工大学学报（自然科学）,2021,35(8):122-128. 被引量：3
10孔德越,周姗琪,朱建生,闫力斌,吴颖.基于属性相关分析与聚类的铁路列车时刻表非均衡数据集预处理方法[J].铁路计算机应用,2021,30(10):1-5.

1谢国荣,郑宏,林伟圻,徐鸣,郭昆,陈基杰.基于改进随机森林算法的停电敏感用户分类[J].计算机系统应用,2019,28(3):104-110. 被引量：7
2朱诚强.内爬式塔吊内设组合框技术研究与应用[J].名城绘,2019,0(5):0237-0237.
3余凯.基于SVM的信用反欺诈预测模型探讨[J].现代商贸工业,2019,40(17):165-168. 被引量：1
4闻雅,高志远,王吉富,蔡雨轩,高晟珍,李瑞改.基于航班数据可视化系统的设计与实现[J].智能计算机与应用,2019,9(3):228-231. 被引量：5
5张小然.优质护理在妊高症孕产妇护理中的应用效果观察[J].糖尿病天地,2018,15(10):236-236. 被引量：1
6杨珏.基于遗传算法的机场特种车辆调度应用研究[J].计算机技术与发展,2019,29(3):164-168. 被引量：7
7姚超.样品不同消解方式的研究[J].精品,2019(1):199-199.
8李旗风.RFID技术在航空公司护照管理中的应用[J].电脑知识与技术,2019,15(1Z):237-238.
9姜涛.基于市场需求的航班时刻优化方法[J].民航学报,2019,3(1):15-21.
10姚刚,向成明,杨阳,石立国.强震作用下液压爬模抗震性能分析[J].施工技术,2019,48(8):55-59. 被引量：3

计算机应用与软件

2019年第4期

浏览历史

内容加载中请稍等...

基于KMSMOTE和随机森林的爬升段油耗分类被引量：2

参考文献9

二级参考文献93

共引文献99

同被引文献15

引证文献2

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于KMSMOTE和随机森林的爬升段油耗分类 被引量：2

参考文献9

二级参考文献93

共引文献99

同被引文献15

引证文献2

二级引证文献40

相关作者

相关机构

相关主题

浏览历史

基于KMSMOTE和随机森林的爬升段油耗分类被引量：2