摘要
分类问题是机器学习领域中的一个重要问题。给出了数字0-9的图象和26个英文大小写的图象格式的训练数据,对SVM、NB、RT、MLP、BOOST、Knearst 6种分类器的分类性能进行了测试和评估。实验结果表明,性能表现排名前3的分类器为SVM、NB、MLP。SVM具有更好的泛化能力,而NB和MLP对训练集的变化更为敏感;并且基于SVM方法的分类系统对字符和数字的识别精度达到94.2191%,高于现有文献的结果,系统识别性能具有更全和更准确的特点。
Classification is an important problem in machine learning.This paper built several image datasets consisting of ten digits and 26 upper case and 26 lower case english letter to evaluate the performace of six classifiers,SVM(Support Vecter Machine),NB(Nave Bayes),RT(Random Tree),MLP(Multi Layer Perception),BOOST,Knearest.Experimental results show SVM has better generalization ability,while NB and MLP are more sensitive to datasets.In addition,the recognition accuracy of our system based on SVM reaches to 94.2191%,which is better than many publicly reported results in the literature.
出处
《计算机科学》
CSCD
北大核心
2015年第S1期102-106 121,121,共6页
Computer Science
基金
国家自然科学基金(60773201)
广东省自然科学基金(10451032001006140)
广州市科技和信息化局应用基础研究项目(10C12140131)
广东省教育厅普通高校育苗工程(LYM10081)资助
关键词
机器学习
分类器
数据集
性能比较
识别精度
Machine learning,Classifier,Dataset,Performance comparsion,Recognition accuracy