假设数据如下图,其中行表示用户,列表示评级项目:
我们先看一下三道公式
余弦相似度(Cosine-based Similarity):
皮尔森系数(Pearson correlation):
本文探讨了基于物品的协同过滤中,余弦相似度、皮尔森系数和修正余弦相似度的差异。余弦相似度考虑所有用户评级,而皮尔森系数与修正余弦仅考虑共同评级用户。皮尔森系数关注共同评级的用户对i的评级平均值,修正余弦则计算用户已评级项目的平均值。
假设数据如下图,其中行表示用户,列表示评级项目:
我们先看一下三道公式
余弦相似度(Cosine-based Similarity):
皮尔森系数(Pearson correlation):
807
1371

被折叠的 条评论
为什么被折叠?