聚类基本概念
相似度或距离
- 相似度或距离:
聚类的核心是相似度或距离的定义,它将直接影响到聚类的结果- 闵可夫斯基距离
dij=(∑k=1m∣xki−xkj∣)1pd_{ij}=(\sum\limits_{k=1}^m|x_{ki}-x_{kj}|)^{\frac{1}{p}}dij=(k=1∑m∣xki−xkj∣)p1
p=2时偶啦距离p=2时偶啦距离p=2时偶啦距离
p=1时曼哈顿距离p=1时曼哈顿距离p=1时曼哈顿距离
p=∞时为切比雪夫距离p=\infty时为切比雪夫距离p=∞时为切比雪夫距离 - 马哈拉诺比斯距离
dij=[(xi−xj)S−1(xi−xj)],其中S−1为协方差矩阵d_{ij}=[(x_i-x_j)S^{-1}(x_i-x_j)],其中S^{-1}为协方差矩阵dij=[(xi−xj)S−1(xi−xj)],其中S−1为协方差矩阵 - 相关系数
rij=∑k=1m(xki−x^i)(xkj−x^j)[∑k=1n(xki−x^i)2∑k=1m(xkj−x^j)2]12r_{ij}=\frac{\sum\limits_{k=1}^m(x_{ki}-\hat{x}_i)(x_{kj}-\hat{x}_j)}{[\sum\limits_{k=1}^n(x_{ki}-\hat{x}_i)^2\sum\limits_{k=1}^m(x_{kj}-\hat{x}_j)^2]^{\frac{1}{2}}}rij=[k=1∑n(xki−x^i)2k=1∑m(xkj−x^j)2]21k=1∑m(xki−x^i)(xkj−x^j)
绝对值越接近1表示越相似,越接近0表示越不相似 - 夹角余弦
越接近1表示越相似,越接近0表示越不相似
sij=∑k=1mxkixkj[∑k=1mxki2∑k=1mxkj2]12s_{ij}=\frac{\sum\limits_{k=1}^mx_{ki}x_{kj}}{[\sum\limits_{k=1}^mx_{ki}^2\sum\limits_{k=1}^mx_{kj}^2]^{\frac{1}{2}}}s
- 闵可夫斯基距离

最低0.47元/天 解锁文章
1705

被折叠的 条评论
为什么被折叠?



