- 推荐系统是机器学习最常用的应用,无论是在硅谷实践还是在专家经验中。虽然在学术会议中,推荐系统几乎是不受到任何关注的较小的前沿领域,但是在实践中,推荐系统却是第一个要做的事情。
- 我们只知道多个用户对多个电影的评分,如何求出属性?如何求出属性对应的Theta,要知道我们并不知道属性,也不知道Theta。这里有一个非常有趣的算法,就是:
通过随机生成Theta->求解X->优化Theta->优化X并一致这样执行下去,我们可以获得一组属性和相应的Theta。这种方法之前也见过,类似于机器翻译的模型,如IBM的model3。
因此,协同过滤的基本思想是,通过多个用户的协同,我们从整个样本集合上估计出一个算法和相应的输入。这是协同过滤。 - 需要注意的是,在协同过滤算法中,忽略了Theta(0)和X(0)。这两项在线性回归、逻辑回归、神经网络中这两项在梯度下降和成本函数中通常与其他计算方法不同,但是这一项在协同过滤中去掉了,为的是计算简便但不影响结果。 另一个需要注意的是,在协同过滤算法中,在最开始都以很小的数值随机初始化了Theta(0)和X(0),这一行为的主要目的跟神经网络中避免Symmetry问题是一致的,即避免所有神经元的作用都一致,从而是结果成为一种平均,而不是优化。
- J = J + lambda*(sum(sum(X.*X))+su
AI学习过程(4)推荐系统
推荐系统是机器学习的重要应用,特别是在实际操作中。通过协同过滤算法,即使在没有明确属性的情况下,也能通过随机初始化和迭代优化求得Theta和X。在协同过滤中,忽略Theta(0)和X(0)简化计算,同时初始时的小数值随机化避免了神经网络中的Symmetry问题,确保优化而非平均结果。

最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



