回顾一下暑期在Future camp学习的推荐算法(一)——CB、CF、MF

1.基于内容的推荐算法(Content-based recommendations)

基于内容的推荐算法大概思路如下:

1) 根据用户A喜欢的商品提取商品的特征值集合setA

2)根据setA寻找相似的商品,将商品推荐给A

 

对于文档来说,可以提取文档里词的TF.IDF值,来找出能够代表这个文档的特征词汇:

TF意思是词频(Term Frequency),即该词出现在此文章中的频率

TF公式:

IDF意思是逆文本频率指数(Inverse Document Frequency),即总文件数与出现该词文件数的比值

IDF公式:

TF.IDF值就是TF与IDF的乘积,所得的分数越高,相应的该特征就越明显,越具有辨识度。

 

对于基于内容的推荐算法,寻找出合适的特征值非常的必要,但是特征值的选取往往很困难,所以该方法存在一定的局限性。

 

2.协同过滤算法(Collaborative Filtering)

协同过滤算法的大概思路如下:

1)对于用户B,根据用户B的评分找出和用户B相似的用户集合setB

2)通过setB预测出用户B对别的商品的评分,把高分商品推荐给用户B

 

上面这种思路又叫做User-User Collaborative Filtering,当然还有Item-Item Collaborative

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值