1. 用户满意度
用户作为推荐系统的重要参与者,其满意度是评测推荐系统的最重要指标。但是,用户满意度没有办法离线计算,只能通过用户调查或者在线实验获得。
2. 预测准确度
度量一个推荐系统或者推荐算法预测用户行为的能力。这个指标是最重要的推荐系统离线评测指标,包括:
评分预测
TopN预测
3. 覆盖率
描述一个推荐系统对物品长尾的发掘能力。覆盖率有不同的定义方法,最简单的定义为推荐系统能够推荐出来的物品占总物品集合的比例
4. 多样性
推荐结果需要具有多样性
5. 新颖性
指给用户推荐那些他们以前没有听说过的物品
6. 惊喜度
提高推荐结果的用户满意度,同时降低推荐结果和用户历史兴趣的相似度
7. 信任度
对推荐系统的信任程度
8. 实时性
实时地更新推荐列表来满足用户新的行为变化;推荐系统需要能够将新加入系统的物品推荐给用户
9. 健壮性
推荐系统抗击作弊的能力
10. 商业目标
对于可以离线优化的指标,我个人的看法是应该在给定覆盖率、多样性、新颖性等限制条件下,尽量优化预测准确度。用一个数学公式表达,离线实验的优化目标是:
最大化预测准确度
使得 覆盖率 > A
多样性 > B
新颖性 > C
其中,A、B、C的取值应该视不同的应用而定。
最大化预测准确度
使得 覆盖率 > A
多样性 > B
新颖性 > C
其中,A、B、C的取值应该视不同的应用而定。
参考文献:
《推荐系统实践》