
搜索推荐
文章平均质量分 92
jp_666
这个作者很懒,什么都没留下…
展开
-
双塔模型DSSM及各种变体塔
本文是由参考1和参考2整合而来。本文主要介绍项目中用于商业兴趣建模的DSSM双塔模型。作为推荐领域中大火的双塔模型,因为效果不错并且对工业界十分友好,所以被各大厂广泛应用于推荐系统中召回阶段。通过构建user和item两个独立的子网络,将训练好的两个“塔”中的user embedding 和item embedding各自缓存到内存数据库中。线上预测的时候只需要在内存中计算相似度运算即可。DSSM双塔模型是推荐领域中不得不会的重要模型。1 为什么要学习DSSM双塔模型我们标签组主要的服务.原创 2021-03-21 19:39:55 · 4809 阅读 · 0 评论 -
DeepFM原理与实践
CTR预估DeepFM是CTR预估领域优秀的模型之一,因此这里简单介绍下CTR预估。CTR预估数据特点:1. 输入中包含类别型和连续型特征。类别型特征需要经过one-hot处理, 连续型数据可以先离散化再one-hot,也可以直接保留原值2. 维度非常高3. 数据非常稀疏4. 特征按照Field分组CTR预估重点在于学习组合特征。注意,组合特征包括二阶、三阶甚至更高阶的,阶数越高越复杂,越不容易学习。Google 的论文研究得出结论:高阶和低阶的组合特征都非常重要,同时学习到这两原创 2020-11-23 20:35:53 · 750 阅读 · 1 评论 -
FM理论与实践
背景FM算法(Factor Machine),又叫因子分解机算法。在推荐系统和点击率预估(CTR预估)中,FM算法有很广泛的应用。这两个场景的实质都是根据所提供的一些特征信息来判断用户是否会有点击行为,或者说点击的概率。在推荐系统和CTR预估任务中,通常把LR作为baseline。如果直接利用所提供的特征信息,线性模型将是最简单直接的方法。如下图所示,xi 就是某个特征值,线性模型需要为每一个特征值学习一个权重wi,最终的模型预测值就是所有的特征值乘以这个权重,加起来求和。 公式如下:如果是原创 2020-10-25 00:07:07 · 2127 阅读 · 0 评论