基于改进原型嵌入的广义中位数计算方法
在机器学习和模式识别领域,从一组给定对象中学习原型是一个核心问题,有着广泛的应用。例如在文本识别的多分类器组合中,算法参数的变化或不同算法的使用会产生不同结果,每个结果可能都有小错误,而共识方法可以产生一个最能代表不同结果的文本,从而消除错误和异常值。
广义中位数计算问题
广义中位数计算是一种流行的共识学习方法,它将共识学习表述为一个优化问题。给定一组对象 $O = {o_1, \ldots, o_n}$ 以及距离函数 $\delta(o_i, o_j)$,广义中位数可以表示为:
$\overline{o} = \arg \min_{o \in O} SOD(o)$
其中,$SOD(o) = \sum_{p \in O} \delta(o, p)$,即广义中位数是与所有输入对象距离之和最小的对象,且中位数对象不一定是集合 $O$ 的一部分。
广义中位数的概念已在许多问题领域得到研究,如字符串和图等。然而,在很多情况下,广义中位数的计算具有很高的计算复杂度,例如字符串编辑距离下的广义中位数字符串计算是 NP 难问题,广义 Kendall - τ 距离下的中位数排序以及合理聚类距离函数下的集成聚类也是如此。因此,需要近似解来在合理时间内计算广义中位数。
原型嵌入方法
为了解决广义中位数计算的高复杂度问题,提出了原型嵌入方法,该方法可应用于任何问题领域,并已在多个领域成功应用。其步骤如下:
1. 对象嵌入 :使用嵌入函数 $\phi(o) = (\delta(o, p_1), \delta(o, p_2), \ldots, \delta(
超级会员免费看
订阅专栏 解锁全文
1287

被折叠的 条评论
为什么被折叠?



