多类分类问题的解决方案与应用
1. 多类分类问题的初步处理
在多类分类问题中,有一种方法是对算法进行特定修改,具体体现在初始化 $D_1$ 的方式上。$D_1$ 的取值规则如下:
[
D_1(i, \ell) =
\begin{cases}
1/(2m) & \text{如果 } \ell = y_i \
1/[2m(K - 1)] & \text{否则}
\end{cases}
]
这里需要注意的是,$H_1$ 不受此修改的影响。另外,对于式 (10.7) 所采用的方法,还有一种替代方案,即选择使得 $H(x, y) = +1$ 的任意标签 $y$。这种方法的优势在于对学习算法所使用的表示形式的依赖性较低,但缺点是没有考虑每个类别的预测强度,而预测强度通常是非常有信息量的。
2. 语义分类中的应用
以电信公司 AT&T 的电话客户请求类型分类问题为例,该问题有 15 个预定义类别,用于捕捉来电者的意图,且这实际上是一个多标签问题,同一话语可能有多个标签。
- 类别列表 :
| 类别缩写 | 类别全称 |
| ---- | ---- |
| AC | AreaCode |
| CM | Competitor |
| RA | Rate |
| AS | AttService |
| DM | DialForMe |
| 3N | ThirdNumber |
| BC | BillingCredit |
| DI | Direct
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



