
推荐系统
文章平均质量分 93
搜推广
tRNA¥
这个作者很懒,什么都没留下…
展开
-
第五章 行为序列(王树森学习笔记)
精排模型要给每个候选物品打分,分数表示用户对候选物品的兴趣,最后根据分数的高低给这500个候选物品排序,保留。用户塔看不到候选物品(比如双塔召回时,有上亿候选物品,用户只能看到用户特征,看不到候选物品特征),故不能把注意力机制用在用户塔。LastN列表中的物品可能是一年前,或十分钟前的交互,重要性不同(时间越久远,重要性越低)DIN的序列短,记录用户近期行为(只记录用户最近交互过的100~200个物品),无需考虑时间信息。注意,用户还有其他的很多特征,比如用户ID、离散特征、连续特征等,把所有这些特征。原创 2025-01-14 22:33:01 · 746 阅读 · 0 评论 -
第四章 特征交叉(王树森学习笔记)
我们用一个现实的例子来理解,比如我们要预估一个二手房的价格,单用面积和地理位置都不能很好的预测结果,将两个特征交叉之后会有较准确的预测。不论是内积or哈达玛积,都要求每个特征的embedding向量形状一样,都是k维向量;因此在实践中,最好人工指定一部分特征做交叉,这样既可以减少参数数量,也可以让concatenation之后的向量变小。,对m^2个向量做concatenation,得到的向量维度太大,且其中大多数都是无意义的特征。用特征交叉的话,两个特征不仅能相加,还能相乘,这样可以提升模型的表达能力。原创 2025-01-11 23:06:02 · 884 阅读 · 0 评论 -
第三章 排序(王树森学习笔记)
粗排模型和精排模型原创 2025-01-10 23:15:29 · 789 阅读 · 0 评论 -
第二章 召回(王树森学习笔记)
双塔模型有两个塔,用户塔和物品塔。用户塔物品塔输入用户特征物品特征特征变换EmbeddingEmbedding输出余弦相似度策略/训练方法训练方法需要正负样本过采样冷门物品,或降采样热门物品&混合几种负样本召回最近邻查找模型更新全量or增量优化梯度下降。原创 2025-01-09 20:50:03 · 1944 阅读 · 0 评论 -
第一章 推荐系统基础(王树森学习笔记)
点击率:点击次数/曝光次数转发率:转发次数/点击次数阅读完成率:滑动到底次数/点击次数 x f(笔记长度)·f()是一个,和笔记长度有关,笔记越,阅读完成率。原创 2025-01-04 19:16:38 · 724 阅读 · 0 评论