机器学习分类与线性回归模型详解
一、分类模型相关内容
1. 数字 3 和 5 的分类混淆问题
在某些分类模型中,数字 3 和 5 仅在几个像素上存在差异,这使得模型很容易将它们混淆。3 和 5 的主要区别在于连接顶部线条和底部弧线的小线条的位置。如果绘制数字 3 时,连接点稍微向左移动,分类器可能会将其分类为 5,反之亦然。这表明该分类器对图像的平移和旋转非常敏感。为了减少 3 和 5 的分类混淆,可以对图像进行预处理,确保它们居中且旋转角度不大,这可能也有助于减少其他错误。
2. 多标签分类
在之前的分类任务中,每个实例通常只被分配到一个类别。但在某些情况下,我们希望分类器为每个实例输出多个类别。例如,人脸识别分类器在同一张图片中识别出多个人时,应该为每个识别出的人添加一个标签。假设分类器经过训练可以识别三个人脸:Alice、Bob 和 Charlie,当给它一张包含 Alice 和 Charlie 的图片时,它应该输出 [1, 0, 1],表示“Alice 是,Bob 否,Charlie 是”。这种输出多个二进制标签的分类系统称为多标签分类系统。
下面是一个简单的示例代码:
from sklearn.neighbors import KNeighborsClassifier
import numpy as np
# 创建多标签数组
y_train_large = (y_train >= 7)
y_train_odd = (y_train % 2 == 1)
y_multilabel = np.c_[y_train_large, y_tra
超级会员免费看
订阅专栏 解锁全文
3412

被折叠的 条评论
为什么被折叠?



