机器学习之相似性度量

Antony Lambert

于 2021-10-10 17:39:31 发布

阅读量985

点赞数 3

分类专栏：机器学习文章标签：机器学习

本文链接：https://blog.youkuaiyun.com/qq_41997070/article/details/120684855

版权

0.引言

在建模的过程中，当需要整理出两两样本之间的联系时，通常会使用“相似性（similarity）”来描述这种联系。在一般语境中，我们通常会用“距离（distance）”来代表这种联系。一般来说，相似性和距离代表的含义是相同的。而对距离的正确建模能帮助模型更快的挖掘出隐含在数据分布之间的联系。

1.两样本的相似度的衡量

1.1 基本性质

非负性： $dist(x_i,x_j)\ge0$
同一性： $dist(x_i,x_i)=0$
对称性： $dist(x_i,x_j)=dist(x_j,x_i)$
直递性： $dist(x_i,x_j)=dist(x_i,x_k)+dist(x_k,x_j)$

1.2 常用度量方式：以n维样本 $x_1 = (x_{11}, x_{12},...,x_{1n})$ ， $x_2 = (x_{21}, x_{22},...,x_{2n})$ 为例

闵可夫斯基距离（对应P-范数）: $dist(x_1,x_2)=(\sum_{u=1}^n |x_{1u}-x_{2u}|^p)^\frac{1}{p}$

最低0.47元/天解锁文章

Antony Lambert

博客等级

码龄7年

9
原创

13
点赞

50
收藏

3
粉丝

关注

私信

分类专栏

机器学习 2篇
集成学习 1篇
聚类 1篇
Linux 1篇
PAT甲级 1篇
数据结构 1篇
C/C++ 2篇
VS2015 1篇

展开全部收起

上一篇：: 用python生成带有坐标轴的二维高斯分布散点图

最新评论

集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译
Antony Lambert: 你好，我只拿EAC作者的源代码做过对比试验，至于论文里面的数据集，我并没有试过。实际上你说的情况是可能存在的，因为集成聚类很依赖base clusterings的质量，所以base clusterings的质量决定很大一部分。你可以试着将base clusterings的簇数和ensemble size试着调大，调大可能会取得更好的效果
集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译
Mr.Persimmon: 主要目的是想问大佬有没有做相关的实验复现，复现结果如何呢？
集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译
Mr.Persimmon: 原论文中在进行多组数据集测试的时候，EAC-AL在月牙和三环这样的数据集中的错误率都是零，根据论文的伪代码中的指导，EAC-AL和EAC-SL的唯一区别就是在使用证据积累得到共同关联矩阵之后使用AL的层次聚类或者SL的层次聚类。根据实际的实验跑出来的效果，开始怀疑原论文的实验真实性。
集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译
Antony Lambert: 你好，我在github还是作者主页上找到过这篇文章的代码。你可以去github上找找，应该能找到包括matlab版本的和python版本的。感性地来讲，EAC首先构造了一个相似度矩阵，然后再通过Single-link/Average-link/Complete-link三种层次聚类的方法施加在这个新得到的相似度矩阵上获得最终结果。按你的说法，EAC-SL效果很好，AL效果很差，这应该不是EAC矩阵的问题。
集成聚类之Enhanced Ensemble Clustering via Fast Propagation of Cluster-Wise Similarities论文大纲整理及其翻译
Mr.Persimmon: 大佬，还在做集成聚类吗？我复现了EAC的集成聚类，复现的EAC-SL效果很好，但是EAC-AL的效果非常差，如果大佬曾经复现过，希望能够指点迷经。文章代码链接：https://blog.youkuaiyun.com/NoBuggie/article/details/124927765