二分类器组合以最大化部分AUC及Ihara系数在高阶学习中的应用
在机器学习和模式识别领域,分类器的性能评估和组合是一个重要的研究方向。同时,对于不规则无权重超图的有效表征和聚类也是当前的热点问题。本文将探讨二分类器组合以最大化部分AUC(pAUC)的方法,以及Ihara系数在不规则无权重超图聚类中的应用。
二分类器组合以最大化部分AUC
- 部分AUC的定义与计算
- 部分AUC(pAUC)可以定义为分类器将随机选择的正实例排在随机选择的负实例(该负实例属于1 - tk分位数范围 $[q_{t_1}^y, q_{t_0}^y]$)之上的概率,即 $pAUC = P{x_i > y_j, y_j \in [q_{t_1}^y, q_{t_0}^y]}$,其中 $x_i = f(p_i)$ 和 $y_j = f(n_j)$ 分别是二分器 $f$ 在正样本 $p_i$ 和负样本 $n_j$ 上的输出。
- 为避免在ROC曲线上进行数值积分来评估二分器的pAUC,采用非参数估计器:$pAUC = \frac{1}{m_P m_N} \sum_{i}^{m_P} \sum_{j}^{m_N} V_{q_{t_0}^y, q_{t_1}^y}^{ij}$,其中 $m_P$ 和 $m_N$ 分别是正子集和负子集的基数,$V_{q_{t_0}^y, q_{t_1}^y}^{ij}$ 根据 $x_i$ 和 $y_j$ 的大小关系取值为1、0.5或0。
- 由于大多数生物识别和医学应用的假阳性率接近零,考虑 $t_0 = 0$,此时 $V_{q_{t_1}^y}^{ij} = I{x_i
超级会员免费看
订阅专栏 解锁全文
2570

被折叠的 条评论
为什么被折叠?



