推荐系统评估
准确度
打分系统
设ruirui为用户uu对物品的实际评分,r^uir^ui为预测分,有如下误差判定标准:
RMSEMAE=∑u,i∈T(rui−r^ui)2|T|−−−−−−−−−−−−−−−√=∑u,i∈T|rui−r^ui||T|(371)(371)RMSE=∑u,i∈T(rui−r^ui)2|T|MAE=∑u,i∈T|rui−r^ui||T|Top N推荐
设R(u)R(u)为根据训练建立的模型在测试集上的推荐,T(u)T(u)为测试集上用户的选择
PrecisionRecall=∑u∈U|R(u)∩T(u)|∑u∈U|R(u)|=∑u∈U|R(u)∩T(u)|∑u∈U|T(u)|(372)(372)Precision=∑u∈U|R(u)∩T(u)|∑u∈U|R(u)|Recall=∑u∈U|R(u)∩T(u)|∑u∈U|T(u)|
覆盖率
表示对物品长尾的挖掘能力(针对平台商品而言)
CoverageH=|Uu∈UR(u)||I|=−∑i=1np(i)logp(i)(373)(373)Coverage=|Uu∈UR(u)||I|H=−∑i=1np(i)logp(i)多样性
推荐结果列表中物品的丰富性(两两之间的差异性,面向用户),s(i,j)s(i,j)表示物品ii和之间的相似度,|R(u)||R(u)|表示集合元素数量(表示推荐给该uu用户的所用商品),多样性表示如下:
新颖度:商品给用户的新鲜感(推荐不知道的商品)
惊喜度:推荐和用户历史兴趣不相似却满意的
信任度:提供可靠的推荐理由
实时性:实时更新程度
推荐系统类型
基于内容
基于用户喜欢的物品的属性\内容推荐,需要分析内容,不用考虑用户与用户之间的关联,通常使用在文本相关的推荐
协同过滤
根据用户在物品上的行为找到物品或者用户的“近邻”,物以类聚,人以群分
基于用户的协同过滤
基于物品的协同过滤
冷启动问题
对于新用户
推荐非常热门的商品,收集一些信息,在用户注册的时候收集一些信息对于新商品
根据本身的属性,求与原来商品的相似度