康多塞陪审团定理在聚类共识中的拓展
1. 引言
在聚类分析中,如何从多个样本分区中得出可靠的共识分区是一个关键问题。康多塞陪审团定理为解决这一问题提供了理论基础,该定理指出,当个体投票者独立且有能力时,多数投票往往是正确的。本文将康多塞陪审团定理拓展到分区空间,旨在为聚类共识提供理论支持。
2. 一般设置
- 设 $S_n = (X_1, \ldots, X_n)$ 是从概率分布 $Q$ 中独立同分布抽取的 $n$ 个硬分区 $X_i \in P^+$ 的样本。
- 每个样本分区 $X_i$ 对给定数据点 $z \in Z$ 进行投票,正确投票的概率为 $p_i(z)$。
- 目标是通过多数投票对数据点 $z$ 做出最终决策。
3. 投票
- 协议函数 :分区 $X$ 的表示 $X$ 的协议函数 $k_X : Z \to [0, 1]$ 定义为 $k_X(z_j) = \langle x_{:j}, x^ {:j} \rangle$,其中 $x {:j}$ 和 $x^ _{:j}$ 分别是表示 $X$ 和 $X^*$ 的第 $j$ 列。
- 投票定义 :分区 $X$ 的表示 $X$ 对数据点 $z$ 的投票定义为 $V_X(z) = I{k_X(z) > 0.5}$,其中 $I{b}$ 是指示函数。
- 分区投票 :分区 $X$ 对数据点 $z$ 的投票 $V
超级会员免费看
订阅专栏 解锁全文
64

被折叠的 条评论
为什么被折叠?



