eq值 推荐算法_推荐系统算法

本文介绍了推荐系统中的关键概念,包括准确率、精准率、召回率、覆盖率和TF-IDF。接着,详细讲解了协同过滤算法,包括基于用户和物品的协同过滤,并阐述了它们的优缺点。最后提到了隐语义模型以及SVD矩阵分解在推荐系统中的应用。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一. 知识点准备

1.1 准确率、精准率、召回率

我们如下所示矩阵,称为混淆矩阵,有n行n列,每行表示真实值,每列表示预测值。如有150个样本数据,预测类标记为1,2,3各50个,分类结束后得到的混淆矩阵为:

第一行表示,“类1”预测正确的样本有43个,其中把2个实际是“类1”的样本预测成了类2。

我们用最简单的二分类,把混淆矩阵转换成如下:

T、F 表示(true)、(false)表示预测结果,T预测正确、F预测错误;P、N表示预测结果值,P预测为正、N预测为负。那么:TP 表示预测结果正确,预测值为正;

FN 表示预测结果错误,预测值为负,那么实际值就是正;

FP 表示预测结果错误,预测值为正,那么实际值就是负;

TN 表示预测结果正确,预测值为正。

准确率= (TP + TN) / (TP + FN + FP + TN) 。意思就是所有预测正确的结果除以全部的样本数量。但当我们的总样本90%是正类、10%是负类时,此时叫样本不平衡。在样本不平衡情况下,我们把全部样本预测为正类,则就会有高达90%的准确率。显然这个准确率数值水份很高。

精确率 = (TP)/(TP + FP)。预测真正准确的正样本除以所有的预测正样本数。精确率又叫查准率,它针对预测结果而言。表达的意思就是,在正样本中,我们有多少预测正确。

召回率 = (TP)/(TP + FN)。预测真正准确的正样本除以所有的正样本。召回率又叫查全率,它针对实际的正样本而言的。

我们精准率和召回率,他们只有分母 FP(预测错误,实际为负)、FN(预测错误,实际为正)的差别。FP、FN是一对互斥的指标,所以精确率和召回率也是一对互斥的指标。

1.2 覆盖率、多样性

覆盖率:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值