简单机器学习分类算法训练
1. 感知机预测与误差收集
在分类任务中,感知机的 predict 方法用于预测类别标签。在训练时, fit 方法会调用 predict 来获取类别标签以更新权重;训练完成后,也可用于预测新数据的类别标签。同时,我们会将每个训练周期(epoch)中的错误分类数量收集到 self.errors_ 列表中,以便后续分析感知机在训练过程中的表现。 net_input 方法使用 np.dot 函数计算向量点积$w^Tx$。
2. 鸢尾花数据集训练感知机
2.1 加载数据集
为了测试感知机的实现,我们将分析和示例限制在鸢尾花数据集的两个特征变量(维度)上,即萼片长度和花瓣长度,这样便于在散点图中可视化训练模型的决策区域。同时,我们仅考虑鸢尾花数据集中的两种花:山鸢尾(Setosa)和变色鸢尾(Versicolor),因为感知机是二元分类器。
使用 pandas 库从UCI机器学习库直接加载鸢尾花数据集到 DataFrame 对象,并通过 tail 方法打印最后五行,以确保数据正确加载:
import os
import pandas as pd
s = os.path.join('https://archive.ics.uci.edu', 'ml',
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



