NDCG

本文深入探讨了NDCG(Normalized Discounted Cumulative Gain)指标,它是衡量排序质量的重要方法。通过解释CG(Cumulative Gain)和DCG(Discounted Cumulative Gain)的概念,本文阐述了NDCG如何在搜索引擎优化中发挥作用,确保返回结果既相关又高质量,同时强调了NDCG在不同排名需求场景中的应用潜力。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

from: http://www.cnblogs.com/HappyAngel/p/3535919.html  

关于NDCGwiki给点解释很详细,这里我谈谈我的理解。

   NDCGNormalized discounted cumulative gain):是用来衡量排序质量的指标。

  其中一种计算公式如下:

    

  先从理解CG,DCG入手。CGcumulative gain),累积获得,指的是网页gain的累加。例如:

     
其是个不断累加的值,gain可以使自己定义的一种获得,用来衡量网页的相关性程度,上图中的gain定义如下:

    

  DCGDiscounted Cumulative Gain),Discountedfactor为:

    

  那么,NDCG就是被IDEA DCG规格化的值,即DCG/IDCG

  NDCG如何理解?对于搜索引擎,本质是用户搜一个query,引擎返回一个结果列表,那么如何衡量这个结果列表的好坏?我能够想到的是:

  1. 我们希望把最相关的结果放到排名最靠前的位置,因为大部分用户都是从上往下阅读的,那么最相关的在前面可以最大程度减少用户的阅读时间;
  2. 我们希望整个列表的结果尽可能的和query相关;

  第一个条件的满足是首要的,而第二个条件的加入是保证整体结果质量,而这两个条件都体现在了NDCG里面,首先,计算NDCG,需要计算Gain这个gain即是每条结果的质量的定义NDCG把所有结果相加最终相加保证,整体质量越高的列表NDCG值越大。同时,Discounted的设计使得越靠前的结果权重越大,这保证了第一条,更相关的排在靠前的结果会有更大的NDCG值。从这两点看,以NDCG为优化目标,保证了搜索引擎在返回结果总体质量好的情况下,把更高质量结果排在更前面。

  NDCG提供了一种计算方式,当我们有其他排名类似的需求的时候,NDCG都是值得参考的,其Gain以及Discounted的计算的变化可以产生很多其他有价值的metrics

 

参考文献:

http://en.wikipedia.org/wiki/NDCG

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值