推荐系统01 - FM模型
FM详细推导过程+代码
(上面这个简书写的很清楚,还有FFM和deepFM算法介绍)
FM因子机深入解析【总结的也比较详细】
推荐系统FM & FFM算法解读与实践
(FM矩阵分解过程解释的比较清楚、为什么减少数据稀疏性的影响)
在FFM中,每一维特征 ,针对其它特征的每一种field ,都会学习一个隐向量 。因此,隐向量不仅与特征相关,也与field相关。也就是说,“Day=26/11/15”这个特征与“Country”特征和“Ad_type"特征进行关联的时候使用不同的隐向量,这与“Country”和“Ad_type”的内在差异相符,也是FFM中“field-aware”的由来。
假设样本的 个特征属于 个field,那么FFM的二次项有 个隐向量。而在FM模型中,每一维特征的隐向量只有一个。FM可以看作FFM的特例,是把所有特征都归属到一个field时的FFM模型。
初看FM疑惑:
【question:为什么不能直接word2vec把特征变成稠密向量,categorical类型的特征也可以直接word2vec吧,word2vec不就是为了解决数据稀疏性的?比如“男性”、“篮球”两个词的w2v相似度肯定大于“女性”、“篮球”,是可以考虑到这种交叉特性的性能的吧?
question2:推荐是分类or回归or聚类模型?还是都可以呢?比如ctr,点击1,不点击0,那么不是2分类吗?】
最后发现:
其实就是这样去解决的
解释了两个特征向量的点积:代表了相关性
深度学习:
两天入门Google Wide and deep (模型)推荐系统的资料
简单易学的深度学习算法——Wide & Deep Learning
CTR预估算法之FM, FFM, DeepFM及实践【访问量和回复很多的优快云博客】
deepFM:
论文精读-DeepFM
推荐系统遇上深度学习(三)–DeepFM模型理论和实践
DeepFM算法解析及Python实现
推荐系统从0到1(介绍的比较全面)
https://blog.youkuaiyun.com/baymax_007/article/details/83931698
https://blog.youkuaiyun.com/kingzone_2008/article/details/81117314
https://blog.youkuaiyun.com/m0_37890477/article/details/80404399
https://blog.youkuaiyun.com/hellozhxy/article/details/82872285
https://blog.youkuaiyun.com/hiwallace/article/details/81333604
https://blog.youkuaiyun.com/songbinxu/article/details/80151814
https://blog.youkuaiyun.com/zynash2/article/details/79348540
https://blog.youkuaiyun.com/yujianmin1990/article/details/80384994
机器学习–>集成学习–>Bagging,Boosting,Stacking
集成学习总结 & Stacking方法详解
stack就是把base model的predict 结果再重新训练个分类器吧?也就是相当于对base model的加权。GBDT+LR :stack。
GBDT+LR 、XGB+LR
召回算法
今日头条推荐算法召回
推荐系统的召回
推荐系统的主要模块即为:召回 => 排序(精排) => 过滤模块(对最终展示商品进行过滤,多样性排序等)