48、主题分类中的 F - 度量最大化及相关技术

主题分类中的 F - 度量最大化及相关技术

在多标签分类问题中,F - 度量最大化是一个重要的研究方向,它对于提高分类的准确性和有效性具有关键作用。同时,在数据挖掘挑战中,不同的方法也各有优劣,下面将详细介绍相关内容。

F - 度量的定义与最大化问题

F - 度量本质上是精确率(prec)和召回率(rec)的调和均值。精确率和召回率的计算公式分别为:
[
prec(y, h(x)) = \frac{\sum_{i = 1}^{m} y_i h_i(x)}{\sum_{i = 1}^{m} h_i(x)}
]
[
rec(y, h(x)) = \frac{\sum_{i = 1}^{m} y_i h_i(x)}{\sum_{i = 1}^{m} y_i}
]
通常,我们使用未加权的调和均值,即 F1 - 分数或 F1 - 度量。

将真实标签建模为随机变量 (Y),假设在 ({0, 1}^m) 上存在潜在的概率分布 (p(Y)),使期望 F - 度量最大化的预测 (h_F^ (x)) 为:
[
h_F^
(x) = \arg\max_{h(x) \in {0, 1}^m} E_{y \sim p(Y)} [F(y, h(x))] = \arg\max_{h(x) \in {0, 1}^m} \sum_{y \in {0, 1}^m} p(Y = y) F(y, h(x))
]
然而,该最大化问题没有封闭形式的解,暴力搜索也不可行,因为需要检查 (2^m) 种预测向量 (h) 的组合,并为每个 (h) 计算指数级数量的项的和。不过,最近已经提出了几种有效计

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值