说到NDCG就需要从CG开始说起。
CG(cumulative gain,累计增益)可以用于评价基于打分/评分的个性推荐系统。假设我们推荐k个物品,这个推荐列表的CGk计算公式如下:
C G k = ∑ i k r e l i CG_k=\sum _i^k rel_i CGk=i∑kreli.
r e l i rel_i reli 表示第 k k k个物品的相关性或者评分。假设我们共推荐 k k k个文档, r e l i rel_i reli可以是用户对第 i i i部电影的评分。
比如豆瓣给用户推荐了五部电影,
M 1 , M 2 , M 3 , M 4 , M 5 , M1,M2,M3,M4,M5, M1,M2,M3,M4,M5,
该用户对这五部电影的评分分别是
5, 3, 2, 1, 2
那么这个推荐列表的 C G CG CG等于
C G 5 = 5 + 3 + 2 + 1 + 2 = 13. CG_5=5+3+2+1+2=13. CG5=5+3+2+1+2=13.
C G CG CG没有考虑推荐的次序,在此基础之后我们引入对物品顺序的考虑,就有了 D C G DCG DCG(discounted CG),折扣累积增益。公式如下:
D C G k = ∑ i = 1 k 2 rel i − 1 log 2 ( i + 1 ) . DCG_k=\sum_{i=1}^k \frac{2^{\text{rel}_i}-1}{\log_2(i+1)}.