[分类问题的评估指标] Macro-F1和Micro-F1

最新推荐文章于 2025-07-01 21:58:35 发布

Britesun

最新推荐文章于 2025-07-01 21:58:35 发布

阅读量1.1w

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：评估指标 Macro_F1 Micro_F1

本文链接：https://blog.youkuaiyun.com/qq_34807908/article/details/86514433

本文介绍了分类问题的评估指标，特别是Macro-F1和Micro-F1的区别。Macro-F1对所有类别平等对待，易受稀有类别影响，而Micro-F1更关注整体性能，可能受常见类别主导。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

分类问题的评估指标

在利用K_means 、LR、SVM 分类，评估Embedding 结果的好坏时，遇到如下代码：不理解当中 micro_f1，macro_f1的含义，开此篇学习记录。

    def classification(x, y, method='XGBoost'):
        x_train, x_valid, y_train, y_valid = train_test_split(x

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Britesun

关注关注

1
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

micro f1 和macro f1的异同

强化学习曾小健

05-27

1721

权重分配不同:micro f1对所有样本赋予相同权重,macro f1对每个类别赋予相同权重。应用场景不同:micro f1适用于类别数量差异不大的情况,macro f1更适用于不平衡数据集。数值大小不同:macro f1通常比micro f1大,因为它不受大类别的主导影响。此外,还有一种weighted f1,它根据每个类别的样本数量进行加权平均。在类别分布极度不平衡时,可以考虑使用weighted f1。

机器学习和深度学习分类问题的几个指标:准确率、精准率、召回率、F1-score、Macro-F1、Micro-F1

奥古斯都

03-01

4899

目录 1、Accuracy——准确率 2、Precision——精准率 3、Recall——召回率 4、进一步探索召回率和准确率 5、F1-Score 6、Micro-F1和Macro-F1 在说这个几个指标之前有一个非常重要的东西叫做混淆矩阵：我们把上述提到的这个表格称作为混淆矩阵，那么一般使用混淆矩阵干嘛呢？计算召回率、计算准确率、计算精准率。接下来分别介绍这三个指标。 TP：实际是正样本预测也是正样本；TN：预测是负样本实际也是负样本；FN：实际上是正要根本预测为负样本；FP.

1 条评论您还未登录，请先登录后发表或查看评论

分类问题的评估指标

Leoch007的博客

06-13

1231

作者版权：林子 Leoch007 欢迎转载，注明出处分类的评估指标有很多，这里考虑如下几个：Precision，Recall，F1，macro-F1，micro-F1 预测/真实 1 0 1 TP FP 0 FN TN Positive/Negative 表示预测的正负 True/False 表示预测是否正确 P...

Micro-F1 与 Macro-F1

weixin_44676142的博客

11-05

2237

1. Precision和Recall的计算名称含义 TP(True Positive) 真阳性：预测为正，实际为正 FP(False Positive) 假阳性：预测为正，实际为负 TN(True Negative) 真阴性：预测为负，实际为负 FN(False Negative) 假阴性：预测为负，实际为正（1）Precision（精确率）：被认为正的样本中，实际上有多少是正的。 Precision=TPTP+FP.{\rm Precision}=\frac {\r

RNN（Recurrent Neural Network，循环神经网络）家族详解（RNN，LSTM，GRU）

Springfield3006的博客

07-01

969

摘要：本文系统解析了循环神经网络（RNN）及其改进模型LSTM的核心机制与应用。传统RNN通过循环记忆结构处理序列数据，但存在梯度消失问题。LSTM引入遗忘门、输入门、输出门和细胞状态四大机制，有效解决了长期依赖问题。文章详细对比了RNN与LSTM的数学表达、PyTorch实现及计算示例，并通过人名特征提取案例演示了RNN的时序计算过程。RNN适用于语音识别、文本分类等场景，而LSTM在长序列任务中表现更优。两种模型的结构差异和适用条件为序列建模提供了重要技术选择依据。（149字）

【多分类指标-Macro-F1 与Micro-F1】

图挖掘领域，新晋砖家 ☞ 未来可期，欢迎和静静一起学习交流吖

10-09

9264

转载 https://blog.youkuaiyun.com/lyb3b3b/article/details/84819931 还可参考 https://www.cnblogs.com/techengin/p/8962024.html https://zhuanlan.zhihu.com/p/64315175 https://blog.youkuaiyun.com/qq_43190189/article/details/105778058 https://blog.youkuaiyun.com/sinat_28576553/article/d

机器学习学习笔记（4）——macro-F1与micro-F1

LiQZ的博客

12-30

3658

本文以我自己的实验数据来作为样例说明何为macro F1与micro F1 目录1 前置知识2 macro-F1与micro-F12.1 使用场景2.2 计算方法3 总结4 参考 1 前置知识关于F1 score的内容如果还不清楚的朋友，可以参考我的上一篇博客：《机器学习学习笔记（1）——错误率、精度、准确率、召回率、F1度量》这里就只简单的提一下核心的混淆矩阵与公式： F1 score的公式： F1=2PRP+RF1 = \frac{2 P R}{P + R}F1=P+R2PR 其中：PPP是.

多标签评价指标--Macro-F1、Micro-F1

niutingbaby的博客

06-24

8336

对于多标签分类的评价指标比较复杂，一般对于n个二分类混淆矩阵要引入宏平均、微平均、权重评价即Macro-average、Micro-Average，Weighted-Average，近期正好应用，所以就总结一下。 Macro-averaging：指所有类别的每一个统计指标值的算数平均值，则对应的macro F1为多个F1值的算数平均数。 Micro-averaging：将各个混淆矩阵对应元素平均，得到TP、FP、TN、FN，然后计算相应的平均值。 weighted-F1：在样本不平衡的时候,有时我们

机器学习指标2 micro f1和macro f1

强化学习曾小健

05-21

2404

Micro F1更关注整体性能，适用于类别分布相对平衡的情况。Macro F1更关注每个类别的性能，适用于类别分布不平衡的情况，或者当需要评估每个类别的性能时。在实际应用中，根据具体问题和业务需求选择合适的 F1 分数计算方法是很重要的。

weighted-f1和micro-f1的区别

weixin_56533314的博客

02-27

864

Weighted-F1 是对每个类别单独计算 F1-score，然后按照类别的样本数量进行加权平均。的变体，F1-score 是用于衡量分类模型性能的指标，结合了。计算 F1-score，适用于类别不均衡时。

分类问题的评价指标（Precision、Recall、Accuracy、F1-Score、Micro-F1、Macro-F1）以及混淆矩阵、ROC曲线

少年龙龙的博客

05-11

1万+

文章目录一、四个基本概念 TP、FP、TN、FN二、精确率（precision）、召回率（recall）、准确率（accuracy）三、F1-Score（F1分数）四、宏平均 Macro-F1 、微平均 Micro-F1、加权平均 Weighted avg五、混淆矩阵（Confusion Matrix）六、ROC 曲线和 AUC（Area Under the Curve，曲线下面积）一、四个基本概念 TP、FP、TN、FN 真阳性：预测为正，实际为正。把正样本成功预测为正。 TP——True Posit

一文解释Micro-F1, Macro-F1，Weighted-F1

鲁班七号

07-02

1万+

本文用通俗易懂的形式解释多分类任务中的micro-f1，macro-f1，weighted-f1。前提需要知道基本的概念如精确率、召回率。

#机器学习 Micro-F1和Macro-F1详解

最新发布

08-06