
推荐系统常见问题
该专栏主要记录我学习推荐系统以来一直有过的一些误区,可能有些地方写的不对,到现在都是误区,但还是希望整理出来给到有需要的同学,欢迎留言交流。
_ dingding_
华南理工大学硕士生,主要关注推荐系统,机器学习等。
展开
-
推荐系统常见问题(七):惊讶!为什么训练集比例越大,效果越差?
一、苦恼的一周最近做实验,被一个问题苦恼了一周。本来想要验证算法在40%、60%、80%数据集比例情况下的不同实验效果。结果发现,训练集比例越大,效果竟然越差!!!这和我以往的–训练集越多,训练效果越好的认知完全相违背!!!然后我开始一个个的排除这样情况的原因:先看看是不是我训练集和测试集的弄反了,结果没有反;再看看我的实验方法是不是哪里有错误,结果找不出错误;然后我又在想我划分数据集...原创 2020-04-02 19:03:26 · 7267 阅读 · 8 评论 -
推荐系统常见问题(六):CTR 预估和推荐系统有什么区别???
在学习推荐系统的时候,一方面搞不清楚推荐系统和机器学习的差别,一方面搞不清楚 CTR 预估和推荐系统的差别。。。这学的也太费劲了。。。下面的答案来自知乎,这是链接,我从中选取了自认为说的比较有道理的几个答案。答案一正好在计算广告和推荐系统两个领域都有从业经验,就答一下这个问题。题目问的是CTR和推荐算法的“本质”区别,那么我们就得往“本质”上说,什么算法原理上的区别,系统设计上的区别,...原创 2020-04-02 00:19:55 · 3476 阅读 · 0 评论 -
推荐系统常见问题(五):推荐系统中的目标函数有哪些类型?
一直以来对于机器学习和推荐系统是有什么区别,有什么联系???搞不懂!尤其是机器学习中有目标函数,优化方法一说,而推荐系统中也有这一说,这两东西难道是一个东西???到现在都有些迷迷糊糊的。所以下面是自己的粗浅看法,并不一定对,之后知识有更新了,再来链接里更新~一、机器学习中的目标函数我们都知道在机器学习中 目标函数 = 经验风险 + 结构风险经验风险:即代价函数,是整个训练集上所有样本误差...原创 2020-04-01 22:37:01 · 1692 阅读 · 0 评论 -
推荐系统常见问题(四):如果物品没有在训练集中出现过,而在测试集中出现,如何计算RMSE?
这个问题是别人问我的一个问题,想想也是一个常见问题,所以更新上来。原问题:训练集与测试集划分后有可能某个物品只出现在测试集中,这种情况在训练时得不到该物品的潜在特征向量就无法得到用户对该物品的评级预测,这时该怎么计算RMSE?答:首先是可以得到该物品的特征向量的,同时也可以得到用户对该物品的评级预测的。矩阵分解方法的目的是为了矩阵分数补全,通过将用户-物品-评分矩阵分解成用户矩阵 P ...原创 2020-03-21 18:46:26 · 1707 阅读 · 0 评论 -
推荐系统常见问题(三):TopN 推荐是对训练集中的用户进行推荐,还是对测试集中的用户进行推荐?
从我学习推荐系统以来,一直有个疑问深深的困扰着我,那就是到底是对训练集中的用户进行推荐,还是对测试集中的用户进行推荐呢?之所以一直苦思冥想是因为我认为这关系着我做的实验的的评估效果怎么样,比如 Precision 和 Recall。目录一、误区产生的原因 ?二、我现在终于释怀了 !三、为什么我不对评分预测任务感到迷糊 ?四、我选择 TopN 推荐!一、误区产生的原因 ?以下是我自己的苦思...原创 2020-03-17 18:36:29 · 4376 阅读 · 29 评论 -
推荐系统常见问题(二):可以使用评分预测方法去做TopN推荐吗?
问题:可以使用评分预测方法去做TopN推荐吗?专业回答:是可以的,但是效果可能没有直接使用排序方法进行推荐的好,并且有官方文档的说法是“Ranking recommended rating procedures using the rating method, you may get results, but it is not correct. ”一家之言:这个问题我以前也疑惑过,我当时认为...原创 2020-01-14 15:09:02 · 2126 阅读 · 5 评论 -
推荐系统常见问题(一):数据集按照用户行为比例进行划分的问题?
问题:数据集按照用户行为比例进行划分的问题?推荐系统若按照每个用户的交易记录按比例进行数据集的划分,比如每个用户留下80%的数据作为训练集,20%的数据作为测试集,那么对于一个有5个交易记录的用户来说,训练集应该有4个,测试集应该有1个,但是有时候不是这样的情况?我觉得还是取决于自己的代码怎么写,一般会有以下两种写代码的方式:比如如果是直接计数的代码,直接把用户交易数据的前80%个数据留下...原创 2020-01-14 15:52:29 · 1879 阅读 · 0 评论