35、距离与网络方法:数据空间中的度量与分类

距离与网络方法:数据空间中的度量与分类

在数据处理与分析领域,理解数据点之间的距离以及如何利用这些距离进行分类是至关重要的。下面将深入探讨距离度量、最近邻分类等相关内容。

1. 数据空间与网络的关联

一个由 $n$ 个示例(行)和 $d$ 个特征(列)组成的 $n × d$ 数据矩阵,自然地定义了 $d$ 维几何空间中的一组 $n$ 个点。将示例解释为空间中的点,为我们思考数据提供了强大的方式,就像天空中的星星一样。我们可以思考哪些星星离太阳最近,即最近邻是谁;还可以通过对数据进行聚类,识别出自然的星团,就像星系一样。

空间中的点集与网络中的顶点之间存在着紧密的联系。我们常常从几何点集构建网络,通过边连接相近的点对。反之,我们也可以从网络构建点集,将顶点嵌入到空间中,使得相连的顶点在嵌入空间中彼此靠近。

2. 距离的度量

在 $d$ 维空间中,测量两点 $p$ 和 $q$ 之间的距离是最基本的问题。传统的欧几里得度量是一种常见的距离测量方式,其定义为:
[d(p, q) = \sqrt{\sum_{i=1}^{d} |p_i - q_i|^2}]
然而,还有其他合理的距离概念值得考虑。

2.1 距离度量的性质

一个合理的距离度量应满足以下性质:
- 正性 :对于所有的 $x$ 和 $y$,$d(x, y) \geq 0$。
- 同一性 :当且仅当 $x = y$ 时,$d(x, y) = 0$。
- 对称性 :对于所有的 $x$ 和

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值