以下是基于用户和基于物品的图示:
基于用户(user-to-user)
在一定的历史数据支撑下,协同过滤算法认为一个用户的口味和其他和他相似的用户的口味一样,比如用户A 喜欢item1,item2,item3,item4,item5, 而用户B喜欢item1,item2,item3,item4, 那么就可以为用户B喜欢item5,用户之间的相似度计算是基于皮尔森公式的(如图),其中r代表rate(评分),ru,i代表用户u对物品i的评分,ru表示用户u的评分均值。
最后预测评分是利用如下的公式:
基于物品(item-to-item)
上述的计算是基于用户之间的在评分行为上的相似度的,另外一种是基于物品间用户对它们的评分行为的相似性来计算物品间的相似度的,公式如下:
相似度:(r代表rate(评分),ru,i代表用户u对物品i的评分,ru表示用户u的评分均值)