- 博客(17)
- 收藏
- 关注
原创 新闻推荐项目1
优化:建立一个用户到物品的倒排表,从用户交互端考虑,避免大量物品相似度为0;但是这种情况会存在有的物品之间并没有相似度。很多物品与用户之间没有进行交互,所以大量物品之间的相似度按照这种计算方式计算为0;也就是物品冷启动问题。处理召回数量不足,还要判断填充的item用户是否已经交互过。将用户的最后一次点击当做训练的label。保证召回率,不然训练效果会受到影响。缺点:数据集用户画像特征不足。
2025-04-13 19:01:46
308
原创 推荐系统学习12
只训练一个双塔模型就可以同时用于30天物品、1天物品、6⼩时物品等内容池,会得到三条通道,每条召回通道都有一定的配额2.1 双塔模型多向量模型。
2025-03-14 15:24:38
858
原创 推荐系统学习10
基于内容的向量表征:用CV和NLP提取图片和文字的特征向量。用召回中双塔模型的物品向量表征效果不好,因为双塔模型处理不好新物品和长尾物品的向量表征。
2025-03-12 11:24:46
629
原创 推荐系统学习9
用户行为序列即last_n,用户最近交互过的n个物品。将LastN特征与用户ID、连续特征、离散特征拼接起来,输入神经网络点击过的LastN,即用户最近点击过的N个物品(物品ID,物品特征等),最上面的向量可以反映用户的兴趣。取平均是早起的做法,使用attention效果更好。输出的特征与其他的特征拼接起来输入神经网络。
2025-03-11 10:59:19
350
原创 推荐系统学习3
这种将向量进行前期融合输入到神经网络的模型都不适用于召回模型(每次计算用户对物品的兴趣都要进行一次神经网络,计算量太大),适用于进行排序。
2025-03-06 15:25:06
262
原创 推荐系统学习2
a先与各个向量(每个向量都是每个扇形区域的索引)做相似度分析,选定区域,然后再在扇形区域内做相似度分析,类似于分块查找。矩阵补充为了补充没有曝光的物品,用户对其的兴趣,但在工业界中并不会使用矩阵补充。可用随机梯度下降进行优化。2.4 近似最近邻查找。
2025-03-05 14:38:36
228
原创 推荐系统学习1
3 召回:基于物品的协同过滤(ItemCF)Collaborative Filtering。4 基于用户的协同过滤(UserCF)3.2 ItemCF完整的召回流程。4.3 UserCF召回的完整流程。3.4 ItemCF召回通道。3.1 ItemCF的实现。3.3 ItemCF的原理。4.1 UserCF的实现。3.5 Swing模型。
2025-03-04 14:55:58
150
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅