从感知机到人工神经网络:机器学习模型的进阶之旅
支持向量机(SVM)基础与字符分类实践
在机器学习领域,支持向量机(SVM)是一种强大的模型,可用于分类和回归任务。在进行网格搜索时,脚本会派生额外的进程,这需要在特定块中执行。首先,我们需要对特征进行缩放,并将每个特征围绕原点进行中心化处理。接着,把预处理后的数据划分为训练集和测试集。
随后,我们实例化一个支持向量分类器(SVC)对象。SVC 的构造函数有几个重要的关键字参数:
- kernel :指定要使用的核函数,scikit - learn 提供了线性、多项式、Sigmoid 和径向基函数(RBF)等核函数的实现。
- degree :在使用多项式核函数时需要设置该参数。
- C :控制正则化,类似于逻辑回归中使用的 lambda 超参数。
- gamma :是 Sigmoid、多项式和 RBF 核函数的核系数。
设置这些超参数具有一定挑战性,因此我们通过网格搜索来进行调优。最佳模型的平均 F1 分数为 0.86,通过使用超过前 10000 个实例进行训练,该分数还可以进一步提高。
下面我们尝试一个更具挑战性的问题:对自然图像中的字母数字字符进行分类。Chars74K 数据集包含超过 74000 张 0 - 9 数字以及英文字母大小写的图像。我们将使用从印度班加罗尔街头场景照片中提取的 7705 张字符图像。与 MNIST 数据集不同,Chars74K 数据集中的图像以各种字体、颜色和干扰形式描绘字符。
以下是加载和处理图像的代
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



