简单机器学习分类算法训练
1. 感知机模型预测与错误记录
感知机的 predict 方法用于预测类别标签,在训练时, fit 方法会调用 predict 来获取用于权重更新的类别标签;训练完成后,也可用于预测新数据的类别标签。同时,我们会将每个训练周期(epoch)中的错误分类数量记录在 self.errors_ 列表中,以便后续分析感知机在训练过程中的表现。 net_input 方法中使用的 np.dot 函数用于计算向量点积$w^Tx$。
2. 鸢尾花数据集训练感知机
2.1 数据加载与处理
为了测试感知机的实现,我们将后续分析和示例限制在两个特征变量(维度)上,仅考虑鸢尾花数据集中的萼片长度和花瓣长度这两个特征,这样便于通过散点图可视化训练模型的决策区域。同时,由于感知机是二元分类器,我们只考虑鸢尾花数据集中的山鸢尾(Setosa)和变色鸢尾(Versicolor)这两个类别。
可以使用 pandas 库直接从UCI机器学习库加载鸢尾花数据集到 DataFrame 对象中,并通过 tail 方法打印最后五行数据,以确保数据加载正确:
import os
import pandas as pd
s = os.path.join('https://archive.ics.uci.edu
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



