机器学习模型中预测方法predict和predict_proba

原创于 2025-11-07 09:22:21 发布 · 702 阅读

29 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法 #人工智能 #预测方法

机器学习专栏收录该内容

28 篇文章

订阅专栏

y_pred = self.model.predict(X_test)
y_proba = self.model.predict_proba(X_test)[:, 1]

【1】分别是什么

这两个方法是机器学习模型（尤其是分类模型）中常用的预测方法，常见于像 scikit-learn 这样的库中。它们的含义和区别如下：

1. `y_pred = self.model.predict(X_test)`

作用：返回模型对测试集 X_test 的类别预测结果。
输出形式：一个一维数组，每个元素是模型预测出的类别标签（如 0 或 1，或 ‘cat’/‘dog’ 等）。
适用场景：当你只需要知道模型“认为”每个样本属于哪一类时使用。

举例（二分类）：

y_pred = [0, 1, 1, 0, 1]

表示模型预测第1个样本是类别0，第2个是类别1，依此类推。

2. `y_proba = self.model.predict_proba(X_test)[:, 1]`

作用：返回模型对测试集 X_test 的每个类别的预测概率，然后取第1列（即类别1的概率）。
输出形式：
- predict_proba() 返回的是一个二维数组，形状为 (n_samples, n_classes)。
- 每一行表示对应样本属于各个类别的概率（所有概率之和为1）。
- [:, 1] 表示只取第二列，也就是属于正类（通常为类别1）的概率。
适用场景：当你需要评估模型的“置信度”，或者计算 AUC、绘制 ROC 曲线等需要概率值的任务时使用。

举例（二分类）：

predict_proba 输出可能是：
[[0.9, 0.1],
 [0.3, 0.7],
 [0.2, 0.8],
 [0.85, 0.15],
 [0.4, 0.6]]

那么 y_proba = predict_proba[:, 1] 就是：
[0.1, 0.7, 0.8, 0.15, 0.6]

核心区别总结：

方法	输出内容	类型	用途
`predict()`	预测的类别标签	整数或字符串（类别）	直接分类决策
`predict_proba()[:, 1]`	属于正类（如类别1）的概率	浮点数（0~1之间）	评估置信度、计算AUC、阈值调优等

小贴士：

在二分类问题中，通常设定阈值 0.5：若 y_proba >= 0.5，则 predict() 会返回 1；否则返回 0。
但你可以根据业务需求调整阈值（比如更重视召回率时用更低的阈值），这时就需要用 predict_proba 而不是直接用 predict。

【2】如何选择使用predict还是predict_proba方法

选择使用 predict() 还是 predict_proba()，取决于你的具体任务目标和对模型输出的需求。下面从多个角度帮你判断该用哪个：

一、看你的最终目标是什么

场景1：只需要“分类结果”（是/否、垃圾邮件/正常邮件等）

用 predict()
示例：
- 判断一封邮件是否为垃圾邮件（只需要“是”或“否”）
- 图像识别中判断一张图是猫还是狗
优点：直接、简洁，符合大多数部署场景的决策需求。

y_pred = model.predict(X_test)  # 输出: [0, 1, 1, 0, ...]

场景2：需要知道“有多确定”或做进一步分析

用 predict_proba()
示例：
- 计算 AUC、绘制 ROC 曲线
- 调整分类阈值（比如宁愿漏判也不误判）
- 对高风险样本进行人工复核（只复核概率在 0.4~0.6 的“模糊”样本）
- 构建排序系统（如推荐系统中按点击概率排序）

y_proba = model.predict_proba(X_test)[:, 1]  # 输出: [0.92, 0.35, 0.78, ...]

二、看是否需要调整决策阈值

predict() 默认使用 0.5 阈值（二分类）做硬判决。
但现实中，0.5 不一定最优。比如：
- 医疗诊断：宁可误报（假阳性），也不能漏掉病人（假阴性）→ 降低阈值（如 0.3）
- 反欺诈：避免打扰正常用户 → 提高阈值（如 0.9）

此时你必须用 predict_proba()，然后自己设定阈值：

y_proba = model.predict_proba(X_test)[:, 1]
threshold = 0.7
y_custom_pred = (y_proba >= threshold).astype(int)

三、看评估指标的需求

评估需求	所需方法
准确率、精确率、召回率、F1	`predict()`（或基于 `predict_proba` 自定义阈值后转换）
AUC-ROC、log loss、Brier score	必须用 `predict_proba()`
校准曲线（calibration curve）	必须用 `predict_proba()`

🔔 注意：AUC 衡量的是模型在所有可能阈值下的排序能力，所以它依赖概率输出，不能用 predict() 计算。

四、实际应用中的常见组合

应用	方法选择
模型上线做实时预测（如审批通过/拒绝）	通常用 `predict()`（背后可能已基于 `predict_proba` 设定好业务阈值）
模型开发与调优阶段	大量使用 `predict_proba()` 分析性能
风险评分、信用评分系统	输出概率或分数（即 `predict_proba`），供业务参考
多分类问题中查看各类别置信度	用 `predict_proba()` 查看完整概率分布

总结：一句话决策指南

只要最终答案？ → 用 predict()
要解释、调优、评估或排序？ → 用 predict_proba()

【3】AUC-ROC和预测概率有什么关系

AUC-ROC（Area Under the ROC Curve）和预测概率（predicted probabilities）之间有着本质且紧密的联系。简单来说：

AUC-ROC 的计算完全依赖于模型输出的预测概率（或得分），而不是最终的类别标签。

下面从原理、计算过程和直观理解三个层面详细解释它们的关系。

一、ROC 曲线是怎么来的？

ROC（Receiver Operating Characteristic）曲线描绘的是：

真正例率（TPR，召回率） vs 假正例率（FPR）
在不同分类阈值下的表现。

而这些“不同阈值”正是作用在预测概率上的！

举个例子（二分类）：

假设模型对5个样本输出的概率为：

y_proba = [0.9, 0.6, 0.4, 0.3, 0.1]
真实标签 y_true = [1, 1, 0, 0, 0]

我们可以尝试多个阈值（比如 0.0, 0.2, 0.5, 0.7, 1.0），对每个阈值：

把 y_proba >= threshold 的样本判为正类（1）
计算此时的 TPR 和 FPR
在图上画一个点 (FPR, TPR)

把这些点连起来 → 就是 ROC 曲线
曲线下面积 → AUC

所以：没有预测概率，就无法生成 ROC 曲线！

二、为什么不能用 `predict()`（类别标签）计算 AUC？

因为 predict() 只给出一个固定阈值（通常是 0.5）下的硬分类结果，比如：

y_pred = [1, 1, 0, 0, 0]  # 仅对应 threshold=0.5

你只能得到一个 (FPR, TPR) 点，无法画出整条曲线，更无法计算 AUC。

🔴 AUC 衡量的是模型在所有可能阈值下的整体排序能力，而不是某个阈值下的准确率。

三、AUC 的另一种理解：排序能力

AUC 还有一个等价定义：

AUC = 随机选一个正样本和一个负样本，模型给正样本打分（概率）高于负样本的概率。

这直接说明了 AUC 依赖的是概率的相对大小（排序），而不是绝对类别。

举例：

正样本概率：[0.9, 0.6]
负样本概率：[0.4, 0.1]

所有正-负配对（共 2×2=4 对）中，正样本概率都更高 → AUC = 1.0

如果有些负样本概率比正样本高 → AUC < 1.0

所以，AUC 实际衡量的是：模型能否把正类排在负类前面，而这完全由 predict_proba 的输出决定。

四、代码验证（scikit-learn）

from sklearn.metrics import roc_auc_score

y_true = [1, 1, 0, 0, 0]
y_proba = [0.9, 0.6, 0.4, 0.3, 0.1]
y_pred = [1, 1, 0, 0, 0]  # 假设 threshold=0.5

#  正确：用概率计算 AUC
auc = roc_auc_score(y_true, y_proba)  # 输出: 1.0

# ❌ 错误：用类别标签计算 AUC（会报错或结果无意义）
# roc_auc_score(y_true, y_pred)  # 虽然不报错，但结果不是真正的 AUC！

⚠️ 注意：roc_auc_score(y_true, y_pred) 在二分类下虽然能运行（因为 0/1 也可视为“得分”），但它只对应一个阈值，不能反映模型的真实区分能力，通常 AUC 会被低估或误导。

总结：AUC-ROC 与预测概率的关系

关键点	说明
输入依赖	AUC 必须使用 `predict_proba` 输出的概率（或决策函数得分）
核心机制	通过改变概率阈值，生成多组 (FPR, TPR) 点构成 ROC 曲线
本质含义	AUC 衡量模型对正负样本的排序能力，而非分类准确性
不能替代	`predict()` 只提供单一阈值结果，无法用于计算 AUC