摘要
支持向量机利用接近边界的少数向量来构造一个最优分类面。但是若两分类问题中的样本呈现非平衡分布时,即两类样本数目相差很大时,分类能力就会有所下降。提出分别使用重复数量少的一类样本、选择数量多的类样本以及引入类惩罚因子的三个方法来改善分类能力。实验表明,三种方法对不同类型数据集合,一定程度上都改善了支持向量的分类能力。
Support vector machine constructs an optimal hyper - plane utilizing a small set of vectors near boundary. However, when the two -clas,; problem samples are imbalanced distribution, SVM has a poor performance. This article presents repeat training minority class samples, selects training majority class samples and introduces punish parameter three methods. Computational resuits indicate that it improves the capability of SVM classification for the unbalanced samples of different styles datasets.
出处
《计算机与数字工程》
2006年第11期103-105,113,共4页
Computer & Digital Engineering
关键词
支持向量机
非平衡分布
惩罚因子
SVM,unbalance distribution,introduce punish parameter