线性与二次判别分析及相关机器学习技术详解
1. 线性判别分析(Linear Discriminant Analysis)
线性判别分析是一种具有线性决策边界的分类器,它通过将类条件密度拟合到数据中并使用贝叶斯规则生成。如果所有类共享相同的协方差矩阵,该模型会为每个类拟合一个高斯密度。拟合后的模型可将输入投影到最具判别性的方向,从而降低输入的维度。
1.1 操作步骤
- 打开 Jupyter 软件中的示例 Jupyter Notebook:Chapter 004 Example 010A.ipynb。加载的数据具有特定格式,结果如下:
[[-1. -1.],
[-2. -1.],
[-3. -2.],
[ 1. -1.],
[ 2. 1.],
[ 3. 2.]]
1.2 数据变换
加载的数据可以使用一系列数据变换器进行变换,这些变换器能帮助机器学习处理影响其能力的数据特征。以下是几种常见的数据变换器:
| 变换器名称 | 作用 | 使用示例 | 原始数据 | 变换后数据 |
| — | — | — | — | — |
| 标准缩放器(Standard Scaler) | 从数据集中去除均值并缩放到单位方差来创建特征 | transformer = StandardScaler(copy=True, with_mean=True, with_std=True).fit(X_raw) | [[-1. -1.], [-2. -1.]
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



