本文为 「茶桁的 AI 秘籍 - BI 篇 第 16 篇」

文章目录
Hi,你好。我是茶桁。
前面两节课的内容中,我们从矩阵分解到 ALS 原理,依次给大家讲解了推荐系统中的一个核心概念。
矩阵分解中拆矩阵的背后其实是聚类。就说 k 等于几是人工设定的,所以跟聚类概念很像。就是要把人群划分成几类,把电影划成几类。k 等于 3 是自己去设定的,也可以把它拆成 k 等于 4、k 等于 5,都是一样的,是要完成聚类任务。
聚类不需要操心到底有哪些类型,它会自动的聚成这几类。这也是为什么把它称为隐分类。
「隐」就是我们知道它聚成了三种类型,但是不太清楚这三种类型具体的名称应该叫什么。所以它确实用了聚类的概念,至于为什么用了聚类概念,是因为最后学出来的类型是在 3 个维度上打分的,一个用户有 3 个维度的评分,一个商品也有 3 个维度评分。其实就相当于是把用户聚成了三类,商品聚成了三类。
或者换个角度,可以看一下

还是用之前的 12 * 9 的矩阵,以前一个用户的向量有 9 个维度,9 个维度还是比较多的,有可能每个维度不全。现在我们要把 9 个维度做成 3 个维度(k=3),这 3 个维度就变成了更稠密的压缩的维度,这个小的维度就是个降维。
所以用户要降成 3 个维度,商品也要降成相同的 3 个维度,它的概念都是一样的,大家都是在这个维度上面做一个抽象,这是为什么最开始我们给它画这个场景。用户商品中间这个隐分类我们把它称为 interest。
或者这个 k 就

订阅专栏 解锁全文
1412

被折叠的 条评论
为什么被折叠?



