机器学习分类器与远程实验平台技术解析
1 机器学习分类器相关技术
1.1 新度量的定义与优化
在机器学习中,为了更好地进行分类,需要定义合适的度量。给定查询 $Q$,我们通过以下方式找到其在界面 $f(x) = 0$ 上的最近邻 $P$:
$\min_{P} |Q - P|$,约束条件为 $f(P) = 0$。
然而,这种优化会带来额外的成本。因此,我们用 $Q$ 模拟 $P$,并使用 $f’(Q)$ 作为指导来制定新的度量。设 $G_Q = f’(Q) = (G_{Q,1} \cdots G_{Q,n})$,新的距离定义为:
$|x - y| {new} = \sqrt{(x - y)^T \Lambda (x - y)}$,其中 $\Lambda_i = \frac{\exp(\beta \cdot |G {Q,i}|)}{\sum_{j = 1}^{n} \exp(\beta \cdot |G_{Q,j}|)}$ 。
这里添加了指数机制以保证值的稳定性,$\beta$ 控制元素 $G_Q$ 对整体权重的影响,$\beta = \frac{1}{|f(Q)|}$。当 $Q$ 接近 $f(x)$ 时,$G_Q$ 的影响会增强,局部度量的信息更丰富;反之,当 $Q$ 远离 $f(x)$ 时,$\beta$ 趋近于 0,权重 $\Lambda_i = \frac{1}{n}$,此时距离定义回到原始状态。
在 $M$ 分类中,我们创建 1 - vs - r 的 SVM,涉及 $M$ 个决策函数 $f_j$ 和 $f_j’(Q)$。这些梯度向量以加权的方式组合,综合方向定义为:
$G_Q =
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



