26、机器学习中的距离与概率模型

距离与概率模型解析

机器学习中的距离与概率模型

1. 距离模型概述

距离模型与线性模型一样,具有很强的几何直观性。常见的距离度量包括:
- Minkowski距离(p - 范数) :特殊情况有欧几里得距离(p = 2)和曼哈顿距离(p = 1)。
- 汉明距离 :用于计算不同位或文字的数量。
- 马氏距离 :可对特征进行去相关和归一化。

2. 从核到距离

核函数可以用于扩展线性模型的能力。核是一个函数κ(xi, xj) = φ(xi)·φ(xj),它能在某些特征空间中计算点积,而无需显式构造特征向量φ(x)。由于欧几里得距离与点积密切相关,我们可以将“核技巧”应用于许多基于距离的学习方法。

欧几里得距离可以用点积重写:
Dis2(x, y) = ||x - y||2 = (x - y)·(x - y) = x·x - 2x·y + y·y

将点积替换为核函数κ,可构造核化距离:
Disκ(x, y) = √(κ(x, x) - 2κ(x, y) + κ(y, y))

当κ是正半定核时,Disκ定义了一个伪度量。

2.1 核化K - 均值算法

算法8.5将K - 均值算法改编为使用核化距离。该算法根据实例空间中的非线性距离进行聚类,对应于隐式特征空间中的欧几里得距离。但存在一个问题,定理8.1不适用于非线性距离,因此无法在实例空间中构造聚类中心。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值