《统计学习方法》(第十四章)——聚类方法

聚类基本概念

相似度或距离

  • 相似度或距离:
       聚类的核心是相似度或距离的定义,它将直接影响到聚类的结果
    • 闵可夫斯基距离
      dij=(∑k=1m∣xki−xkj∣)1pd_{ij}=(\sum\limits_{k=1}^m|x_{ki}-x_{kj}|)^{\frac{1}{p}}dij=(k=1mxkixkj)p1
      p=2时偶啦距离p=2时偶啦距离p=2
      p=1时曼哈顿距离p=1时曼哈顿距离p=1
      p=∞时为切比雪夫距离p=\infty时为切比雪夫距离p=
    • 马哈拉诺比斯距离
      dij=[(xi−xj)S−1(xi−xj)],其中S−1为协方差矩阵d_{ij}=[(x_i-x_j)S^{-1}(x_i-x_j)],其中S^{-1}为协方差矩阵dij=[(xixj)S1(xixj)],S1
    • 相关系数
      rij=∑k=1m(xki−x^i)(xkj−x^j)[∑k=1n(xki−x^i)2∑k=1m(xkj−x^j)2]12r_{ij}=\frac{\sum\limits_{k=1}^m(x_{ki}-\hat{x}_i)(x_{kj}-\hat{x}_j)}{[\sum\limits_{k=1}^n(x_{ki}-\hat{x}_i)^2\sum\limits_{k=1}^m(x_{kj}-\hat{x}_j)^2]^{\frac{1}{2}}}rij=[k=1n(xkix^i)2k=1m(xkjx^j)2]21k=1m(xkix^i)(xkjx^j)
      绝对值越接近1表示越相似,越接近0表示越不相似
    • 夹角余弦
      越接近1表示越相似,越接近0表示越不相似
      sij=∑k=1mxkixkj[∑k=1mxki2∑k=1mxkj2]12s_{ij}=\frac{\sum\limits_{k=1}^mx_{ki}x_{kj}}{[\sum\limits_{k=1}^mx_{ki}^2\sum\limits_{k=1}^mx_{kj}^2]^{\frac{1}{2}}}s
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值