使用sklearn设计“最优的”手写数字体digits数据集和鸢尾花数据集的分类器

本文通过实验比较了SVM、MLP、SGD三种分类器在手写数字体digits和鸢尾花数据集上的性能。SVM在digits数据集上,使用rbf核函数达到98.9%的准确率。而对于鸢尾花数据集,MLP的不同参数组合,如adam优化器配合特定激活函数,可以实现100%的准确率。实验强调了针对不同数据集选择最佳分类器参数的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

问题描述

提示:这里可以添加系列文章的所有文章的目录,目录需要自己手动添加
通过实验方法(分类器类型选择、优化方法、激活函数),设计一个“最优的”手写数字体digits数据集和鸢尾花数据集的分类器


欢迎大家交流技术,如果有任何问题可以私聊我,期待你们的关注

方法

我是使用到SVM、MLP、SGD三种分类器,针对每个分类器指定不同的参数,SVM设置不同的kernel参数值,包括’linear’, ‘poly’, ‘rbf’, ‘sigmoid’;MLP设置不同的solver优化器,包括’adam’, ‘lbfgs’, ‘sgd’,activation激活函数包括’tanh’, ‘relu’, ‘logistic’, ‘identity’;SGD设置不同的loss包括’hinge’, ‘log’, ‘modified_huber’, ‘squared_hinge’, ‘perceptron’。然后针对这些不同的分类器对手写体数字的数据集进行分类测试,根据测试的准确率来判断每个分类器的性能,将每个分类器的准确率放到一个字典中,字典的键是分类器的名称,字典的值是分类器对应的准确率,最后得到最好的分类器及其准确率。

optim = ['adam', 'lbfgs', 'sgd']
act = ['tanh', 'relu', 'logistic', 'identity']
ker = ['linear', 'poly', 'rbf', 'sigmoid']
opt = ['hinge', 'log', 'modified_huber', 'squared_hinge', 'perceptron']

结果展示

经过实验验证得到使用SVM并且使用rbf的和函数能够在手写体数字识别的数据集上获得最后的分类准确率,为98.9%。
在这里插入图片描述

针对鸢尾花的数据集,性能较好的分类器包括MLP使用adam的优化器和logistic的激活函数、MLP使用adam的优化器和tanh的激活函数、MLP使用adam的优化器和identity的激活函数、MLP使用sgd的优化器和tanh的激活函数、MLP使用sgd的优化器和identity的激活函数、MLP使用lbfgs的优化器和identity的激活函数的分类器,这些能够使准确率达到100%。

在这里插入图片描述

针对不同的数据集分类器的性能是不同的,要针对不同情况的数据集实验得到最优的分类器的参数。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值