1.基于内容的推荐算法(Content-based recommendations)
基于内容的推荐算法大概思路如下:
1) 根据用户A喜欢的商品提取商品的特征值集合setA
2)根据setA寻找相似的商品,将商品推荐给A
对于文档来说,可以提取文档里词的TF.IDF值,来找出能够代表这个文档的特征词汇:
TF意思是词频(Term Frequency),即该词出现在此文章中的频率
TF公式:
IDF意思是逆文本频率指数(Inverse Document Frequency),即总文件数与出现该词文件数的比值
IDF公式:
TF.IDF值就是TF与IDF的乘积,所得的分数越高,相应的该特征就越明显,越具有辨识度。
对于基于内容的推荐算法,寻找出合适的特征值非常的必要,但是特征值的选取往往很困难,所以该方法存在一定的局限性。
2.协同过滤算法(Collaborative Filtering)
协同过滤算法的大概思路如下:
1)对于用户B,根据用户B的评分找出和用户B相似的用户集合setB
2)通过setB预测出用户B对别的商品的评分,把高分商品推荐给用户B
上面这种思路又叫做User-User Collaborative Filtering,当然还有Item-Item Collaborative