【sklearn第二十六讲】模型评价

最新推荐文章于 2025-03-31 12:26:47 发布

Goodsta

最新推荐文章于 2025-03-31 12:26:47 发布

阅读量1.3k

点赞数

CC 4.0 BY-SA版权

文章标签： python

本文链接：https://blog.youkuaiyun.com/wong2016/article/details/81479665

本文介绍了scikit-learn库中模型评价的多种方法，包括分数参数、分类测度等。详细讲解了准确分数、混淆矩阵、分类报告和ROC曲线的概念与应用，并提供了相关示例。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习训练营——机器学习爱好者的自由交流空间（入群联系qq：2279055353）

scikit-learn有三种不同的API评价一个模型的预测质量。

估计量分数方法：估计量的score方法，对于设计解决的问题提供了一个默认的评价准则。
分数参数：使用交叉验证的模型评价工具依赖一个内部的打分策略。
测度函数：metrics模块提供评价模型预测误差的函数。

分数参数：定义模型评价规则

普遍的情况：预定义值

对于大多数普遍使用的例子，你能够使用scoring参数定义一个分数对象，下表列出了所有可能的值。所有分数对象都遵守的规则是：返回值越高越好。
这里写图片描述
用法例子：

从测度函数定义分数策略

sklearn.metrics模块提供一套简单的函数，提供给定真实情况下的预测误差。

以_score编辑的函数，返回值越大越好。
以_error or _loss编辑的函数，返回值越小越好。如果使用make_scorer转换成一个分数对象，将参数greater_is_be

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Goodsta

关注关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

sklearn中的评价指标介绍(异常检测过程记录)

Jasminexjf的博客

03-20

5503

模型评估评价指标Evaluation metrics 分类评价指标 1 准确率 2 平均准确率 3 对数损失Log-loss 4 基于混淆矩阵的评估度量 41 混淆矩阵 42 精确率Precision 43 召回率Recall 44 F1-score 5 AUCArea under the ...

机器学习的模型(sklearn)

2303_76972906的博客

05-21

2520

机器学习模型的作用是自动从数据中学习并提取有用的信息，以做出预测或决策。在监督学习中，模型通过识别特征与输出之间的关联来预测结果，如将邮件分类为垃圾邮件或非垃圾邮件。无监督学习中，模型探索数据的内在结构，如通过聚类分析市场细分。强化学习模型通过与环境的互动学习最佳行动策略。机器学习模型的应用广泛，如自动驾驶车辆的路径规划、股市趋势的预测以及个性化推荐系统等。这些模型使计算机能够处理复杂问题，无需显式编程即可适应新情况，推动了人工智能的发展。在机器学习中，模型是算法的核心，负责从数据中学习规律和做出预测。

参与评论您还未登录，请先登录后发表或查看评论

python 机器学习 sklearn 常用算法模型

whatday的专栏

03-12

2331

scikit-learn (sklearn) 是一个常用的Python机器学习库，提供了许多常用的模型和工具，帮助用户完成数据预处理、特征提取、模型训练、模型评估等机器学习任务。下面列出了sklearn中常用的模型。

sklearn评价指标

weixin_44630230的博客

02-12

772

https://blog.youkuaiyun.com/weixin_39450145/article/details/115284725?spm=1001.2101.3001.6650.15&utm_medium=distribute.pc_relevant.none-task-blog-2~default~BlogCommendFromBaidu~Rate-15.pc_relevant_default&depth_1-utm_source=distribute.pc_relevant.none-task-blog-

sklearn工具包---分类效果评估（acc、recall、F1、ROC、回归、距离）

热门推荐

飘过的春风

11-21

1万+

一、acc、recall、F1、混淆矩阵、分类综合报告 1、准确率第一种方式：accuracy_score # 准确率 import numpy as np from sklearn.metrics import accuracy_score y_pred = [0, 2, 1, 3,9,9,8,5,8] y_true = [0, 1, 2, 3,2,6,3,5,9] #共9个数据，3个...

sklearn学习模型

dashenYangHJ的博客

03-21

266

sklearn学习模型

【sklearn第十六讲】集成方法

wong2016的博客

07-07

1380

机器学习训练营——机器学习爱好者的自由交流空间（qq 群号：696721295）集成方法(Ensemble methods)的目标是，组合多个基础估计量的预测结果，以此改善单个估计量预测的通用性和稳健性。集成方法通常分为两大类：平均的方法：独立地构建多个估计量，然后平均它们的预测。一般来说，组合的估计量要优于任何一个基础估计量，这是因为它的方差减小了。例如， Bagging me...

python机器学习之sklearn分类、聚类、回归、模型选择、降维、数据预处理

m0_59485658的博客

07-15

5588

scikit-learn，又写作sklearn，是一个开源的基于python语言的机器学习工具包。它通过NumPy,SciPy和Matplotlib等python数值计算的库实现高效的算法应用，并且涵盖了几乎所有主流机器学习算法。官网搜索相关语法https安装sklearn#不是pipinstall-Usklearn。...

python数据分析与应用：第六章课后实训--应用sklearn分析竞标数据（全）

weixin_48676558的博客

04-27

6870

通过读取竞标行为数据集,进行训练集和测试集的划分、为后续的模型构建提供训练数据和测试数据;并对数据集进行降维,以适当减少数据的特征维度。

回归模型的score得分为负_深度研究：回归模型评价指标R2_score

weixin_35890416的博客

01-14

5148

回归模型的性能的评价指标主要有：RMSE(平方根误差)、MAE(平均绝对误差)、MSE(平均平方误差)、R2_score。但是当量纲不同时，RMSE、MAE、MSE难以衡量模型效果好坏。这就需要用到R2_score，实际使用时，会遇到许多问题，今天我们深度研究一下。预备知识搞清楚R2_score计算之前，我们还需要了解几个统计学概念。若用$y_i$表示真实的观测值，用$\bar{y}$表示真实观测...

机器学习模型总结（sklearn）

03-16

文档是对《Python机器学习及实践》这本书中提到的常见模型的一个总结，便于在实际运用时快速选择模型和API。

sklearn的分类器的模型训练和调用

12-03

调用sklearn生成的分类器的python代码，其中包括1. 数据的加载以及处理、数据的划分、降维、数据标准化、模型训练、保存模型和调用模型

sklearn模型整理

qq_45022743的博客

07-04

1213

sklearn 模型总结

机器学习---sklearn常用模型

weixin_57999977的博客

09-01

2662

sklearn常用模型

sklearn 模型总结

LaoChen_ZeroonE

06-11

925

sklearn结构图Skleran 线性模型中文文档. sklearn结构图 Skleran 线性模型模型解决问题实现说明普通最小二乘法回归手机 $12 导管 $1

《Sklearn 机器学习模型--分类模型》--逻辑回归（Logistic Regression）

最新发布

m0_71002812的博客

03-31

2559

逻辑回归是一种广义线性模型，通过‌Sigmoid函数‌将线性回归的输出映射到(0,1)区间，实现对样本类别的概率预测。尽管名称包含“回归”，但其本质是解决‌二分类‌问题的经典算法，扩展后也可处理多分类任务‌15。

模型评估

vshadow的专栏

02-27

902

https://en.wikipedia.org/wiki/Precision_and_recall精度预测为positve的占所有预测为positive的比例。Recall = t p t p + f n {\displaystyle {\text{Recall}}={\frac {tp}{tp+fn}}\,}召回率预测为positve的占实际positive的比例。准确率预测positive和...

机器学习----使用Sklearn构建逻辑回归模型

Zesheng_Wang的博客

04-01

1万+

机器学习----使用Sklearn构建逻辑回归模型

sklearn:选择正确的模型

搬砖小工053

07-31

2606

解决一个机器学习问题最难的一步是找到一个合适的模型，不同模型的选择与数据类型和问题类型息息相关。下面的流程图就是设计来给使用者一个简单的指导，让使用者知道怎么去看待问题，并根据自己的数据选择合适的模型。点击下面图中的每个模型可以看到相关的文档说明。原文链接：http://scikit-learn.org/dev/tutorial/machine_learning_map/index.html这里做一

sklearn中的分类模型评价指标

01-07

### sklearn 中分类模型的评价指标 #### 准确率 (Accuracy) 准确率是指预测正确的样本占总样本的比例。对于二元分类问题，可以通过 `sklearn.metrics.accuracy_score` 来计算。 ```python from sklearn.metrics import accuracy_score y_true = [0, 1, 1, 0, 1] y_pred = [0, 1, 0, 0, 1] accuracy = accuracy_score(y_true, y_pred) print(f'Accuracy: {accuracy}') ``` 此方法适用于数据集中正负样本相对平衡的情况[^3]。 #### 精确率 (Precision) 精确率衡量的是预测为正类的样本中有多少是真正的正类。可以利用 `sklearn.metrics.precision_score` 计算该值： ```python from sklearn.metrics import precision_score precision = precision_score(y_true, y_pred) print(f'Precision: {precision}') ``` 当误判正类样本代价较高时应优先考虑这个度量标准。 #### 召回率 (Recall) 召回率指的是实际为正类的样本中被正确识别出来的比例。使用 `sklearn.metrics.recall_score` 获取这一数值: ```python from sklearn.metrics import recall_score recall = recall_score(y_true, y_pred) print(f'Recall: {recall}') ``` 在不允许有太多漏诊情况发生的应用场景下非常重要。 #### F1 分数 (F1 Score) F1 分数综合考量了精确率和召回率的表现，特别适合处理类别分布不均的数据集。借助于 `sklearn.metrics.f1_score` 实现其计算过程如下所示： ```python from sklearn.metrics import f1_score f1 = f1_score(y_true, y_pred) print(f'F1 score: {f1}') ``` 它能够在两者间找到较好的折衷方案。 #### ROC 曲线与 AUC 值接收者操作特征曲线（ROC）展示了不同阈值设置下真阳性率(TPR)相对于假阳性率(FPR)的变化趋势；曲线下方区域即为AUC(Area Under Curve)，反映了整体区分能力的好坏程度。可通过 `sklearn.metrics.roc_curve` 和 `sklearn.metrics.auc` 得到这两个参数的具体表现形式： ```python import numpy as np from sklearn.metrics import roc_curve, auc fpr, tpr, thresholds = roc_curve(y_true, scores) auc_value = auc(fpr, tpr) plt.plot(fpr, tpr, label=f'AUC={np.round(auc_value, decimals=2)}') plt.xlabel('False Positive Rate') plt.ylabel('True Positive Rate') plt.title('Receiver Operating Characteristic Curve') plt.legend() plt.show() ``` 其中`scores`代表每个测试实例属于正类别的概率估计值[^1]。