- Pearson相关系数刻画变量间线性关系的强弱。
- 余弦相似度,指通过计算两个向量的夹角余弦值来评估它们的相似度。
- 修正余弦相似度,指中心化(减去平均值)后再求余弦相似度。
1. 从数学角度看,给定向量X和Y,Pearson相关系数和修正余弦相似度的计算是相同的,它们的关系参考下面的链接:
https://www.cnblogs.com/tracer-dhy/p/5808323.html
2. 目前很多文档中提到Pearson相关系数和修正余弦相似度的计算有差异,这主要是指当它们被应用到协同过滤问题中求用户的相似性时,计算上有一些不同,主要差异在于中心化方式不同。关于这一点,下面的链接有非常详细的阐述:
http://wulc.me/2016/02/22/《Programming%20Collective%20Intelligence》读书笔记(2)--协同过滤/
本文探讨了Pearson相关系数与修正余弦相似度之间的联系与区别,特别是在协同过滤场景下的应用差异。虽然从数学角度两者计算方法相同,但在实际应用中因中心化方式的不同而有所差异。
4806

被折叠的 条评论
为什么被折叠?



