
推荐系统论文
文章平均质量分 91
我家大宝最可爱
这个作者很懒,什么都没留下…
展开
-
Embedding-based Retrieval in Facebook Search
搜索引擎帮助用户在海量的信息中进行检索,google和bing开发了各种技术来提高搜索质量。由于语义和意图非常难以表征,因此当前的搜索大多依赖于term匹配方法,也就是关键字匹配。语义匹配:解决于查询文本不完全匹配但是可以满足用户搜索意图所需要的结果深度学习在语音,机器视觉和自然语言理解中取得了重大的进展。embedding即表征被证明是一种有效的方法。本质上来说embedding是一种将ids的稀疏向量表征为密集向量的方法,也被称为语义嵌入。原创 2023-03-04 22:15:25 · 1135 阅读 · 0 评论 -
数据平滑 : 基于用户投票的排名算法
6)数据平滑。 常用的行为次数与曝光次数比值类的特征,由于数据的稀疏性,这种计算方式得到的统计量通常具有较大的偏差,需要做平滑处理,比如广告点击率常用的贝叶斯平滑技术。 而在我们推荐场景中,也会用到很多统计类特征、比率特征。 如果直接使用,比如由于不同item的下发量是不同的,这会让推荐偏向热门的类目,使得越推越窄,无法发现用户的个体差异,也不利于多样性的探索。 我们可以把曝光量进行分段,同一个曝光量级的指标进行比较,也可以用该item所属类目统计量的平均值进行平滑处理。 对于离群值较多的数据,我们会使用更转载 2021-03-09 22:28:50 · 569 阅读 · 0 评论 -
推荐算法论文:DIN网络
简介将用户各个维度的稀疏特征压缩成embedding向量,然后将这些向量拼接在一起作为用户向量,这会导致无论输入什么样的广告,用户向量都不变,就很难捕捉到用户在各个广告上的偏好。DSSM模型的时候,用户向量不就是固定的吗,然后输入不同ad的时候,去计算相似度,deepmatch也是的,为什么说不能很好补货用户偏好呢,而且我们可以获取用户的实时行为,每时每刻用户的embedding应该是不一样的吧,还是说这样不一致会导致模型不收敛,所以才要求用户向量必须是稳定的???介绍用户的历史行为被压缩到同原创 2022-05-16 17:43:52 · 316 阅读 · 0 评论 -
推荐系统:I2I召回
1. 基准i2i召回只需要考虑两个点如何表示一个商品item相似度量函数是什么1. 常规的Item-CF所有点击的用户拼接成一个向量,以此来表示一个item。假如我们有100个用户,每个用户是否点击过这个商品可以编码为一个向量user-itemu1u2u3…u100i110001i210101i300101度量函数使用cosin函数,一个优点是分母部分可以抑制热度商品,缓解哈利波特问题。sim(I1,I2)=原创 2022-05-09 22:38:36 · 1090 阅读 · 0 评论 -
推荐算法论文:Deep Neural Networks for YouTube Recommendations
吹牛逼按照经典的信息检索方式讲推荐系统划分为两部分深度候选生成模型深度排序模型1. 介绍youtube推荐系统面临的三个问题规模:当前的推荐算法可以很好的解决数据量较小的问题,但是针对YouTube这种量级的用户和物料,必须使用专业的分布式训练平台。新鲜度:youtube每天会产生非常多的新内容,推荐系统需要有足够的相应能力来处理新内容,做好新物料的探索和应用噪声:由于稀疏性和各种不可观察的外部因素,YouTube 上的历史用户行为本质上难以预测。并且没有用户的显示反馈,所以需要进行隐原创 2022-05-04 15:57:43 · 821 阅读 · 0 评论 -
推荐算法论文:Neural Collaborative Filtering
吹牛逼用户和商品的隐向量依然通过MF(矩阵分解)的方式来获取,深度网络仅仅用来抽取side信息,例如商品的文本,语音?等提出了NCF框架,NCF可以衍生出矩阵分解,如果使用神经网络可以进一步增强模型的非线性能力提出了一个假设,多层神经网络可以学习user-item的交叉函数1.介绍第一段推荐系统可以有效缓解信息过载,当前已经被应用在,电商,新闻和社交媒体,核心是可以通过用户历史信息建立协同过滤模型MF可以将用户和商品映射到统一的隐向量空间,使用隐向量表征用户和商品,这样直接可以使用两个隐原创 2022-04-28 15:01:33 · 459 阅读 · 0 评论