机器学习中的分类任务:从二元到多元
在机器学习领域,分类任务是一项基础且广泛应用的工作。从二元分类开始,逐步拓展到处理多个类别的情况,这其中涉及到众多的概念、方法和评估指标。下面将详细介绍二元分类以及如何处理多类别的分类问题。
1. 二元分类概述
二元分类是机器学习中极为常见的任务,它是许多机器学习工作的起点。虽然在探讨过程中对学习方面提及不多,但先研究模型要解决的任务,有助于更好地理解机器学习模型和算法。
1.1 二元分类任务定义与评估工具
- 二乘二列联表 :用于定义二元分类任务,并评估模型在该任务上的性能。通过列联表中的计数,可以推导出一系列性能指标。
- 覆盖率图 :将列联表可视化为一个矩形,矩形的垂直方向表示正例数量(Pos),水平方向表示负例数量(Neg),矩形内的一个点的纵坐标为真阳性(TP),横坐标为假阳性(FP)。可以通过多个点可视化在同一数据集上评估的多个模型,并利用斜率为 1 的线段上准确率恒定的特性,直观地对这些分类器的准确率进行排序。
- ROC 空间 :将矩形归一化为单位正方形,坐标轴分别为真阳性率和假阳性率。在这个空间中,斜率为 1 的线段(即与上升对角线平行的线段)连接具有相同平均召回率(有时也称为宏观准确率)的点。
1.2 计算得分与损失函数
- 得分计算 :为每个示例计算得分(在多类情况下为得分向量)。通常将决策阈值设置为 ˆs(x) = 0,得分的符号表
超级会员免费看
订阅专栏 解锁全文
1672

被折叠的 条评论
为什么被折叠?



