这章内容看起来像数据清洗,应该不难,就是整理数据方便后面算法使用。OK,开始!!!好兴奋!!!
一. 用户物品矩阵
没什么好说的,非常Intuitive。

左边那一列是人名,上面那一行是电影名,表格里是评分,空白代表没看过。
这里的评分可以是用户自己打的分,也可以是我们通过他在网上的行为,历史浏览记录之类的隐式推断出来的。
二。如何计算评分
这里我们采取隐式评分,显示评分太弱智了。
大的思路如下图:

这个思路是可以通过上一章dashboard应征的,这里不展开来说了。

这边给出了精确的公式。这里要得出参数需要一些约束条件优化问题,我赖得去想,反正我们一拍脑袋,有了以下参数:

event这些值是用户点击时候,js返回过来的次数。还有一些别的评分方法,机器学习的一些东西,有兴趣可以自己研究,这里不多说了。
三。实现隐式评分
还是用sql......

本文介绍了如何从零开始使用Python和Django构建电影推荐系统,重点讨论了数据清洗、用户物品矩阵的构建、隐式评分的计算方法,以及考虑时间衰减因素在推荐算法中的应用。
最低0.47元/天 解锁文章
2万+

被折叠的 条评论
为什么被折叠?



