机器学习基础:距离度量、学习类型与TensorFlow框架
1. 距离度量
在机器学习中,比较对象之间的相似性是一项关键任务。当我们有汽车的特征向量时,通过定义特征向量上的距离函数,就能找出哪两个汽车最为相似。特征向量让我们可以用多种方式来表示和比较对象,其中一种常用的方法是欧几里得距离。
1.1 欧几里得距离(L2范数)
假设有两个特征向量 (x = (x_1, x_2, \ldots, x_n)) 和 (y = (y_1, y_2, \ldots, y_n)),欧几里得距离 (|x - y|) 的计算公式为:
[
\sqrt{(x_1 - y_1)^2 + (x_2 - y_2)^2 + \cdots + (x_n - y_n)^2}
]
例如,向量 ((0, 1)) 和 ((1, 0)) 之间的欧几里得距离为:
[
\sqrt{(0 - 1)^2 + (1 - 0)^2} = \sqrt{2} \approx 1.414
]
欧几里得距离也被称为L2范数,它是几何平面上从一点到另一点的最直接路径,是高斯 - 马尔可夫定理所预测的最小二乘估计的范数。
1.2 其他范数
除了L2范数,还有L0、L1和L - 无穷范数等,它们都是有效的距离度量方式。
- L0范数 :计算向量中非零元素的总数。例如,原点 ((0, 0)) 与向量 ((0, 5)) 之间的L0距离是1,因为只有一个非零元素;向量 ((1, 1)) 和 ((2, 2)) 之间的L0距离是2,因为两个维度都不匹配。在登录场景中,如果登录尝试与真实
超级会员免费看
订阅专栏 解锁全文
410

被折叠的 条评论
为什么被折叠?



