本文为 「茶桁的 AI 秘籍 - BI 篇 第 20 篇」

Hi, 你好。我是茶桁。
之前咱们花了大概 5 节课的时间学习了推荐系统中的矩阵分解,ALS 算法以及 SlopeOne 等等。这些内容都属于协同过滤的内容,除了协同过滤之外,推荐系统还有另外一种方法,就是基于内容推荐。不过首先,咱们还是得把协同过滤讲完,当然依然还是矩阵分解,不过今天我们要讲的是 SVD 矩阵分解。
想想,咱们之前课程中所讲的矩阵分解的内容是什么?
咱们讲解了,将一个大矩阵拆成两个小矩阵,然后用一种优化方式固定一个求解另一个,就是交替最小二乘,英文应该叫做 ALS。
那今天讲的矩阵分解其实跟 ALS 相比,最后也是一样的解法,一会咱们可以一起来看一下。这个方式也是关于协同过滤的,基于内容的推荐系统将会是之后几节课中要去学习的内容。
这些都是推荐系统里面很重要的一个基石,之后我也是会带着大家一起来做一些项目,通过一些工具来去实战推荐系统的内容。
此外,我们还要考量。因为推荐系统是一个非常工程化的东西,在工程上面需要考虑的问题就会很多,比如说泛化能力。因为工程中可能会有更多的特征,希望预测的更准,就需要有更多的特征要入到模型里面去,我们之前的矩阵分解考虑的特征维度可能并没有那么多,所以工程上面还会有更泛化的一种模型,这是一种考量的维度。
还有一个考量维度就是我们的计算设备,现在我们进行计算都是在本地计算机来进行计算的,当数据量比较大的时候你电脑的内存和 CPU 都会被占满,你就无法去进行其他的工作。所以我们今天也看一看如何去使用一些云端的在线编程的工具来去加速你的运算,尤其是当你遇到一些需要 GPU 的环境的时候可以使用它来进行提速。
这两个都可以说是工程上面重要的内容。一个设备,一个是泛化能力,使用更多的一些

订阅专栏 解锁全文
6649

被折叠的 条评论
为什么被折叠?



