不平衡最小二乘支持向量机被引量：4

Unbalanced Least Squares Support Vector Machines

下载PDF

导出

摘要针对标准的最小二乘支持向量机(LSSVM)没有考虑样本分布不平衡的问题提出一种称为不平衡最小二乘支持向量机的算法。首先用标准的最小二乘支持向量机对原始数据进行初步训练,产生一个分离超平面的法向量。然后把高维样本投影到该法向量上得到一维数据.最后由该一维数据的标准差以及样本数量差异所提供的信息,给出两类数据惩罚因子比例,再用标准的最小二乘支持向量机进行第二次训练,对分离超平面进行调整。该方法克服传统方法只考虑数量的不平衡的不足,将原有样本集中具有的分类信息充分提取出来,提高了最小二乘支持向量机的泛化能力。实验结果表明,所提方法可以有效提高不平衡数据的分类性能。 For the problem of unbalanced data classification which was not discussed in the standard Least Squares Support Vector Machines （LSSVM）, an algorithm was proposed, namely unbalanced least squares support vector machines （ULSSVM）. Firstly, the original samples were trained preliminarily by using standard LSSVM and a normal vector of the separation hyperplane was obtained. Secondly, one-dimensional data was generated by projecting the high dimensional data onto the normal vector Finally, by using the information provided by the standard deviation of the one-dimensional data and the difference of two-class sample sizes, the proportion of the two- class penalty factors was determinated. Thus separation hyperplane in standard LSSVM was balanced through the second training. It overcomes disadvantages of traditional designing methods which only consider the imbalance of samples size, extracts the enough classification information of samples and improves the generalization ability of LSSVM. Experiment results show that the method can effectively enhance the classification performance on imbalanced data sets.

作者薛贞霞刘三阳刘万里

机构地区西安电子科技大学应用数学系河南科技大学数学系洛阳师范学院数学系

出处《系统仿真学报》 CAS CSCD 北大核心 2009年第14期4324-4327,共4页 Journal of System Simulation

基金国家自然科学基金(60674108)

关键词不平衡数据最小二乘支持向量机投影 unbalanced data least squares support vector machines projection

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献11

1Vapnik V. The Nature of Statistical Learning Theory [M]. New York, USA: Springer, 1995. 被引量：1
2张浩然,韩正之,李昌刚.基于支持向量机的非线性系统辨识[J].系统仿真学报,2003,15(1):119-121. 被引量：59
3张炤,张素,章琛曦,陈亚珠.基于支持向量机的概率密度估计方法[J].系统仿真学报,2005,17(10):2355-2357. 被引量：24
4Platt J. Fast training of support vector machines using sequential minimal optimization [C]//Scholkopf B, Burges C J C, Smola A J, editors, Advances in Kernel Methods Support Vector Learning. Cambridge, MA, USA: MIT Press, 1999: 185-208. 被引量：1
5Suykcns J A K, Vandewalle J. Least Square Support Vector Machine Classifiers [J]. Neural Processing Letters (S1573-773X), 1999, 9(3): 293-300. 被引量：1
6Japkowicz N, Stephen S. The Class imbalanced Problem: A Systematic Study [J]. Intelligent Data Analysis (S1571-4128), 2002, 6(5): 429-449. 被引量：1
7Ricardo Barandela, Rosa M V, J SS, et al. The Imbalanced Training Sample Problem: Under or over Sampling? [C]//SSPR&SPR, LNCS. Berlin, Germany:. Springer-Verlag, 2004, 3138: 418-4262004, 5: 1253-1286. 被引量：1
8Weiss G M. Mining with Rarity- Problems and Solutions: A Unifying Framework [J]. SIGKDD Explorations (S1931-0145), 2004, 6(1): 7-19. 被引量：1
9Chew H G; Crisp D J, Bogner R E, et al. Target Detection in Radar Imagery Using Support Vector Machines with Training Size Biasing [EB/OL]. (2001-01-01). [2007-7-18]. http://users.on.net/-hgchew/SVM/ChewCrisp Bogner-Lim-ICARCV2000.pdf. 被引量：1
10肖健华,吴今培.样本数目不对称时的SVM模型[J].计算机科学,2003,30(2):165-167. 被引量：24

二级参考文献6

1Vapnik V, Mukherjee S. Support Vector Method for Multivariate Density Estimation [M]. Advances in Neural Information Processing Systems, pp 659-665, MIT Press. 2000. 被引量：1
2Weston, J. Gammerman, A. Stitson, M.O. Vapnick, V. Vovk, V.Watkins, C. Support Vector Density Estimation [M]. Advances in Kernel Methods, MIT Press. 1999. 被引量：1
3Fukunaga, K. and Hayes, R.R. The Reduced Parzen Classifier [J].IEEE Transactions on Pattern Analysis and Machine Intelligence,1989, 11(4): 423-425. 被引量：1
4VapnikVN.统计学习理论的本质[M].北京：清华大学出版社,2000.. 被引量：171
5王永骥涂健.神经元网络控制[M].北京：机械工业出版社,1999.. 被引量：40
6张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2278

共引文献100

1郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.
2陈玲,蔡琦,蔡章生.船用核动力装置技术状态的评估方法研究[J].中国修船,2005(z1):99-101.
3邬啸,魏延,吴瑕.改进的双隶属度模糊支持向量机[J].重庆师范大学学报（自然科学版）,2011,28(5):49-52. 被引量：5
4吕干云,董立新,程浩忠.基于最小二乘加权融合集成神经网络的电力变压器故障识别[J].电网技术,2004,28(16):52-55. 被引量：4
5吕干云,程浩忠,翟海保,董立新.基于改进灰色关联分析的变压器故障识别[J].中国电机工程学报,2004,24(10):121-126. 被引量：42
6刘闽,林成德.基于支持向量机的商业银行信用风险评估模型[J].厦门大学学报（自然科学版）,2005,44(1):29-32. 被引量：26
7刘云焘,吴冲,王敏,乔木.基于支持向量机的商业银行信用风险评估模型研究[J].预测,2005,24(1):52-55. 被引量：16
8吕干云,程浩忠,董立新,翟海保.基于多级支持向量机分类器的电力变压器故障识别[J].电力系统及其自动化学报,2005,17(1):19-22. 被引量：57
9陈文杰,王晶.支持向量机在工业过程中的应用[J].计算机与应用化学,2005,22(3):195-200. 被引量：9
10胡中辉,李远贵,蔡云泽,许晓鸣.Inverse Learning Control of Nonlinear Systems Using Support Vector Machines[J].Journal of Shanghai Jiaotong university(Science),2005,10(2):135-138.

同被引文献34

1全勇,杨杰.Geodesic Distance for Support Vector Machines[J].自动化学报,2005,31(2):202-208. 被引量：4
2盛昭瀚,柳炳祥.客户流失危机分析的决策树方法[J].管理科学学报,2005,8(2):20-25. 被引量：49
3Chew H G, Crisp D, Bogner R E, et al. Target detection in radar imagery using support vector machines with training size biasing [ EB/ OL]. [2010 - 05 - 08 ]. http://www, eleceng, adelaide, edu. au/ personal/hgchew/svm. html. 被引量：1
4Huang Kaizhu, Yang Haiqin, King I, et al. Machine learning : model- ing data locally and globally [M].杭州:浙江大学出版社,2008:29-68. 被引量：1
5Tenenbaum J B, Silva V D, Langford J C. A golbal geometric frame- work for nonlinear dimensionality reduction [ J ]. Science, 2000,290:2319 -2323. 被引量：1
6Ma B P, Yang F, Gao W, et al. The application of extended geodesic distance in head poses estimation [ C ]//Biometrics, the First International Conference on Biometrics (ICB) ,2006 : 192 - 198. 被引量：1
7UCI machine learning repository [DB/OL]. [2010 -06 -07 ]. http ://archive. ics. uci. edu/ml/. 被引量：1
8张新安,田澎.顾客满意与顾客忠诚之间关系的实证研究[J].管理科学学报,2007,10(4):62-72. 被引量：69
9Reinartz W J,Kumar V. On the profitability of long-life customers in a noncontractual setting:An empirical investigation and implications for marketing[J].Journal of Marketing,2000,(04):17-35. 被引量：1
10Hopmann J,Thede A. Applicability of customer churn forecasts in a non-contractual setting[J].Mathematics and Statistics,2005.330-337. 被引量：1

引证文献4

1吴登国,黄宴委,李竣.LSSVM改进测地距离的核函数算法研究[J].自动化仪表,2011,32(12):5-8.
2琚春华,卢琦蓓,郭飞鹏.融入个体活跃度的电子商务客户流失预测模型[J].系统工程理论与实践,2013,33(1):141-150. 被引量：18
3任冷,周维民.针对非平衡多分类问题SVM算法的优化研究与应用[J].电脑知识与技术,2016,12(2Z):218-220. 被引量：4
4张辉国,张孟娟,胡锡健.变系数模型的稳健LS-SVR估计算法及数值分析[J].计算机仿真,2023,40(4):367-372.

二级引证文献22

1李守伟.中国区域创新创业活跃度比较研究[J].调研世界,2021(5):68-76. 被引量：15
2云才,黄健,吴一民,刘浩江,张平平,李力.足底内侧岛状皮瓣转位修复足跟部皮肤缺损[J].内蒙古医学杂志,2000,32(2):85-86.
3袁琦.国际旅游岛电子商务发展探讨[J].长江大学学报（社会科学版）,2013,36(12):77-78.
4吴真松,张丹.粗糙集理论在旅游研究领域的应用及评析[J].旅游论坛,2014,7(4):17-21. 被引量：2
5于小兵,王旭明.影响电子商务客户流失因素分析[J].数学的实践与认识,2014,44(21):1-5. 被引量：5
6徐旭.移动互联网下终端客户流失影响因素实证研究[J].赤峰学院学报（自然科学版）,2015,31(10):71-72. 被引量：2
7夏国恩.基于满意控制的客户流失两类错误[J].系统工程,2016,34(3):136-141. 被引量：3
8李亚娟.电子商务影响我国未来市场营销方式的机制研究[J].改革与战略,2016,32(6):136-139. 被引量：8
9于小兵,卢逸群.电子商务客户流失预警与预测[J].系统工程,2016,34(9):37-43. 被引量：6
10孙庆文,郭伟伟,栾晓慧.赊销最佳时机选择的集成式决策模型与方法[J].系统工程理论与实践,2017,37(1):151-158.

1王金艳.不平衡数据的分离超平面偏置的调整方法[J].洛阳师范学院学报,2008,27(2):42-44.
2刘万里,刘三阳,薛贞霞.不平衡支持向量机的平衡方法[J].模式识别与人工智能,2008,21(2):136-141. 被引量：15
3厍向阳,薛惠锋,许五弟.基于遗传算法的多维快速聚类算法研究[J].计算机应用研究,2005,22(6):58-60. 被引量：1
4陈森平,陈启买.基于熵的K均值算法的改进[J].广东技术师范学院学报,2008,29(9):27-29. 被引量：2
5刘万里,刘三阳,王金艳.不平衡支持向量机的调整方法[J].计算机科学,2009,36(3):148-149. 被引量：5
6刘万里,刘三阳.SVM中不平衡数据的分离超平面的校正方法[J].计算机工程与应用,2008,44(19):169-171. 被引量：3
7王飞,秦小麟,刘亮,沈尧.基于数据流的k-近邻连接算法[J].计算机科学,2015,42(5):204-210. 被引量：3
8于化龙,高尚,赵靖,秦斌.基于过采样技术和随机森林的不平衡微阵列数据分类方法研究[J].计算机科学,2012,39(5):190-194. 被引量：9
9王亮.一种改进的模糊核聚类算法[J].网友世界,2012(1):64-69.
10王涛,余顺争.基于机器学习的网络流量分类研究进展[J].小型微型计算机系统,2012,33(5):1034-1040. 被引量：23

系统仿真学报

2009年第14期

浏览历史

内容加载中请稍等...

不平衡最小二乘支持向量机被引量：4

参考文献11

二级参考文献6

共引文献100

同被引文献34

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

不平衡最小二乘支持向量机 被引量：4

参考文献11

二级参考文献6

共引文献100

同被引文献34

引证文献4

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

不平衡最小二乘支持向量机被引量：4