推荐系统常见问题(四):如果物品没有在训练集中出现过,而在测试集中出现,如何计算RMSE?

本文探讨了在矩阵分解推荐系统中,如何处理训练集与测试集划分后,某些物品仅出现在测试集的情况。即便在训练过程中未获取到特定物品的特征向量,通过初始化的物品向量仍能进行用户评级预测,进而计算RMSE值,验证模型的有效性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

这个问题是别人问我的一个问题,想想也是一个常见问题,所以更新上来。

原问题:训练集与测试集划分后有可能某个物品只出现在测试集中,这种情况在训练时得不到该物品的潜在特征向量就无法得到用户对该物品的评级预测,这时该怎么计算RMSE?


首先是可以得到该物品的特征向量的,同时也可以得到用户对该物品的评级预测的。

矩阵分解方法的目的是为了矩阵分数补全,通过将用户-物品-评分矩阵分解成用户矩阵 P 和物品矩阵 Q 进行补全。

而划分训练集和测试集的目的是为了验证方法的效果。在使用训练集进行训练的时候,我们可以得到完整的 P 矩阵和 Q 矩阵,自然可以对所有的用户-物品的分数进行预测。

至于验证效果,可以直接对比测试集里的用户-物品-评分和预测出来的用户-物品-评分是否一致,并计算出相应的RMSE值。

另,因为矩阵分解的 P 和 Q 矩阵一开始都会进行初始化,即使这个物品从来都没有出现过,这个物品向量还是有的,与用户向量相乘即可得到该用户对此物品的预测评分,即可比较RMSE值。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值