数据场与云模型:理论与应用解析
1. 数据场基础定义
1.1 数学模型
数据场的分布规律可以用势函数进行数学描述。在数据空间 $\Omega \subseteq R^P$ 中,数据对象 $x_i$ 会产生一个具有质量 $m_i$ 的虚拟场。对于 $\Omega$ 中的任意点 $x = (x_1, x_2, \ldots, x_P)^T$,数据场在 $x_i$ 上的标量势函数定义为:
$\phi(x_i) = m_i \times K(\frac{|x - x_i|}{\sigma})$
其中,$m_i$ 是 $x_i$ 的质量,$K(x)$ 是单位势函数,$|x - x_i|$ 是场中 $x_i$ 与 $x$ 之间的距离,$\sigma$ 是影响因子。
数据集中的每个数据对象 $x_i$ 在 $\Omega$ 中都有自己的数据场,所有数据场会在点 $x$ 处叠加。因此,数据场在 $\Omega$ 中 $x$ 点的势值定义如下:
$\phi(x) = \phi_D(x) = \sum_{i = 1}^{n} \phi_i(x) = \sum_{i = 1}^{n} (m_i \times K(\frac{|x - x_i|}{\sigma}))$
由于矢量强度可以通过梯度算子由标量势构建出来,$x$ 处的矢量强度 $F(x)$ 可以表示为:
$F(x) = \nabla\phi(x) = \frac{2}{\sigma^2} \sum_{i = 1}^{n} ((x_i - x) \cdot m_i \cdot K(\frac{|x - x_i|}{\sigma}))$
因为 $\frac{2}{\sigma^2}$
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



