推荐系统之评测指标

推荐系统通过分析用户行为,提供个性化推荐,如亚马逊和当当网的个性化列表。评测推荐系统的重要指标包括预测准确度(评分预测、分类准确度、排序准确度)、用户满意度、覆盖率和多样性。这些指标综合评估系统预测能力、用户喜好匹配度、物品覆盖范围及推荐多样性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、什么是推荐系统

信息量过载问题存在已久,对于信息消费者,从大量的信息中找到自己感兴趣的信息显然是一件非常困难的事情;对于信息生产者,让自己生产的信息能够准确的命中受用人群,也是一件非常困难的事情。推荐系统能够很好地解决信息生产者和消费者这一信息不对称的情况。推荐系统是通过分析用户行为日志对用户兴趣建模,挖掘出用户可能感兴趣的信息并推送给用户,满足用户对信息的需求。推荐系统和搜索引擎不同,推荐系统不需要用户提供明确的信息需求(即搜索引擎的一个查询式),推荐系统往往在用户浏览本网站的时候,就能在网页的某一区域显示一个符合用户兴趣的推荐列表,而这个推荐列表是推荐系统通过分析用户的历史数据得到的。推荐系统对于我们大多数人来说并不陌生,如百度搜索结果页右侧的相关物品推荐(图1是在百度搜索“推荐系统”结果页右侧区域截图)、

 

亚马逊的个性化推荐列表(图2)、

 

当当网的猜你喜欢(图3),


还有社交网站的好友推荐、视频网站的视频推荐、个性化广告投放、个性化阅读等。

为什么推荐系统如此重要,看看下面的数据就明白了。亚马逊的前科学家Greg Linden在曾他的博客说过,在他离开亚马逊的时候,亚马逊至少有20%(之后的一篇博文则变为35%)的销售来自推荐算法。此外,亚马逊的前首席科学家Andreas Weigend在斯坦福的曾办过一次推荐系统的演讲,就听他讲座的同学透露,亚马逊有20%-30%的销售来自推荐系统。而国外视频网站Netflix在其宣传资料中宣称,有</

### 推荐系统的命中率评估指标 #### 定义与重要性 命中率(Hit Rate, HR)是衡量推荐系统性能的重要指标之一。该指标反映了推荐列表中是否包含了用户实际感兴趣的商品或项目。较高的命中率意味着推荐算法能够更有效地捕捉用户的兴趣偏好。 #### 计算方法 对于单个用户而言,如果推荐列表里存在至少一项用户真正感兴趣的物品,则认为这次推荐成功击中目标;反之则未命中。具体来说: \[ \text{HR}_u = \begin{cases} 1 & \text{if } i \in R_u \\ 0 & \text{otherwise} \end{cases} \] 其中 \(i\) 表示用户真实交互过的商品集合中的任意一个元素,\(R_u\) 是给定用户 u 的推荐列表[^3]。 为了得到整个测试集上的总体表现,通常会对所有用户的个体命中情况进行平均求和: \[ \text{HR} = \frac{\sum_{u=1}^{N}\text{HR}_u}{N} \] 这里 N 代表参与评测的总人数数量。 这种简单的二元判定方式虽然直观易懂,但在某些场景下可能不够全面,因此实践中也经常与其他更为精细复杂的度量标准如归一化折损累积增益 (Normalized Discounted Cumulative Gain, NDCG) 或者平均互惠排名 (Mean Reciprocal Rank, MRR) 结合使用来综合考量推荐效果[^4]。 ```python def hit_rate(recommendations, actual_items): """ Calculate the Hit Rate of a recommendation list. :param recommendations: List[int], recommended item IDs :param actual_items: Set[int], set of actually interacted items by user :return: float, hit rate value either 0 or 1 """ return int(bool(set(recommendations).intersection(actual_items))) ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值