
RS
文章平均质量分 62
学习笔记
心心喵
这个作者很懒,什么都没留下…
展开
-
[RS] 推荐模型总结
CF(user_cf、item_cf) DIN + DIEN + DISN (协同过滤) 最早期的推荐算法是协同过滤CF。传统CF分为基于用户的协同过滤user_CF,和基于物品的协同过滤item_CF。基本原理是 通过用户-物品的共现矩阵M,通过行向量或列向量的相似度,找出top K个相似用户/物品,然后去做推荐列表。 由于CF存在头部效应,热门的商品容易与其他商品产生相似性,所以引入了矩阵分解MF。MF通过对共现矩阵M的行列维度进......原创 2022-04-26 15:54:50 · 480 阅读 · 0 评论 -
[RS] 辛普森悖论
辛普森悖论与因果革命(1) - 知乎 一、辛普森悖论的向量解释 非常形象: 二、辛普森悖论图解 一项关于各年龄段运动和胆固醇之间相关性的研究表明,各年龄段的人群随着运动的增加,胆固醇呈现下降的趋势;但是,如果不看年龄分层,整体看运动量和胆固醇的关系,可能会得出运动越多,胆固醇越高的错误结论。 按年龄段分层(小椭圆长轴135度):运动和胆固醇负相关 整体数据(大椭圆长轴45度):运动越多,胆固醇越高,正相关 ...原创 2022-04-06 18:53:16 · 448 阅读 · 0 评论 -
[RS] 深度推荐模型:DeepCrossing NeuralCF Wide&Deep DeepFM DIN
1. DeepCrossing 2016 模型架构上,分为 输入层、嵌入层、堆叠层、多层残差神经网络层、输出层。 嵌入层实现了稀疏向量稠密化,嵌入层以 FC 为主,后续引入了Word2Vec、GraphEmbedding进行编码。 多层残差神经网络中对各个维度的向量进行特征组合,增加表达能力。 输出层在二分类的情况下用LR,在多分类的情况下是Softmax。 2. NeuralCF 2017 3. PNN 4. Wide & Deep 单层的 Wide 和多层的 Dee..原创 2022-04-06 16:30:41 · 454 阅读 · 0 评论 -
[RS] 评价指标NDCG
搜索评价指标——NDCG - 胖喵~ - 博客园原创 2022-03-03 22:10:02 · 378 阅读 · 0 评论 -
[RS] C1&C2
原创 2022-01-27 21:11:21 · 311 阅读 · 0 评论 -
[RS] 类别数据数字化的方法 —— LabelEncoder VS OneHotEncoder (虚拟变量陷阱(Dummy Variable Trap))
参考:虚拟变量陷阱原理及算例 - 知乎 LabelEncoder 和 OneHotEncoder 在数据处理过程中,我们有时需要对不连续的数字或者文本进行数字化处理。 在使用 Python 进行数据处理时,用 encoder 来转化 dummy variable(虚拟数据)非常简便,encoder 可以将数据集中的文本转化成0或1的数值。 LabelEncoder 和 OneHotEncoder 是 scikit-learn 包中的两个功能,可以实现上述的转化过程。 sklearn.prepro.原创 2021-12-31 01:22:21 · 319 阅读 · 0 评论 -
[RS] 传统推荐模型: 协同过滤CF&MF 内容过滤LR&FM&FFM
0.序言 1.协同过滤(隐式特征) 1.1 邻域 Neighborhood_CF(usercf, itemcf) 1.2 矩阵分解 MF 流行度会导致长尾分布,产生头部效应。 也就是热门商品容易和大量商品产生相似性,而尾部商品往往特征向量稀疏,不容易被推荐。 为了缓解流行度产生的头部效应,提出了矩阵分解算法。 矩阵分解是在协同过滤算法的共现矩阵的基础上,加入了隐向量的概念,加强了模型处理稀疏矩阵的能力 [2006年]。 2.内容过滤 (显式特征) 2.1 逻辑回归LR...原创 2021-11-24 16:11:54 · 1342 阅读 · 0 评论 -
[RS] FM模型(因子分解机)
推荐系统排序算法--FM模型 - 简书 1、背景 在计算广告和推荐系统中,CTR预估(click-through rate)是非常重要的一个环节,判断一个商品的是否进行推荐需要根据CTR预估的点击率来进行。在进行CTR预估时,除了单特征外,往往要对特征进行组合。对于特征组合来说,业界常用的方法有人工特征工程 + LR(Logistic Regression)、GBDT(Gradient Boosting Decision Tree) + LR、FM(Factorization Machine)和FFM(原创 2021-11-08 17:05:14 · 332 阅读 · 0 评论