机器学习分类任务全解析
1. 多标签分类与多类分类
多标签分类(Multi-label Classification,MLC)是分类问题的一种变体,其特点是能为单个数据点分配多个标签。这些标签是非排他性的,对单个类别可分配的标签数量没有限制。用函数 $h: X \to {0, 1}^C$ 表示多标签分类,其中 $C = {c_j | j = 1, \ldots, k}$ 且 $k > 1$。多标签分类就是构建一个模型,将输入 $x \in X$ 映射到二进制向量 $y \in {0, 1}^C$,即为 $y$ 中的每个标签分配 0 或 1。
多标签分类与多类分类不同,多类分类是单标签问题,旨在将数据划分到多个类别中的某一个。以下是两者的对比示例:
|分类类型|数据情况|分类结果|
| ---- | ---- | ---- |
|多标签分类|每个数据有两个或三个对象|${1, 1, 0}, {0, 1, 1}, {1, 1, 1}$|
|多类分类|每个数据只有一个对象|${1, 0, 0}, {0, 0, 1}, {0, 1, 0}$|
常见的多标签分类算法有多标签 k - 近邻、多标签决策树和人工神经网络(ANNs)。集成学习方法也可将多个多类分类器组合成一个多标签分类器。
graph LR
A[数据] --> B[多标签分类]
A --> C[多类分类]
B --> B1[多标签k - 近邻]
B --> B2[多标签决策树]
B --> B3[人工神经网络]
C --&g
机器学习分类任务详解
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



