Twitter推荐算法总架构:
这个推荐架构的作用是生成在用户首页上显示的推文列表

步骤:
1、从不同的推荐来源中获取最好的推文,这个过程被称为候选来源。
2、使用机器学习模型对每条推文进行排名。
3、应用启发式方法和过滤器,例如过滤掉你已经屏蔽的用户的推文、NSFW内容以及你已经看过的推文。
候选源:
来源分成两部分,网络内和网络外。这里的网络指的是Twitter的社交网络。
1、网络内来源
网络内来源是最大的候选来源,旨在提供所关注的用户的最相关、最近的推文。它使用逻辑回归模型,根据相关性对你所关注的用户的推文进行有效排名。排名靠前的推文会被送到下一个阶段。
对网络内推文进行排名的最重要组成部分是Real Graph。真实图谱是一个预测两个用户之间接触的可能性的模型。你和推文作者之间的Real Graph得分越高,将包括更多他们的推文。
网络内来源一直是Twitter最近工作的主题。最近停止了使用Fanout服务,这是一项有12年历史的服务,以前是用来从每个用户的推文缓存中提供网络内推文的。也正在重新设计逻辑回归排名模型,该模型最后一次更新和训练是在几年前!
2、网络外的来源
寻找用户网络之外的相关推文是一个比较棘手的问题:如果你不关注作者,怎么能知道某条推文是否与你有关?Twitter采取了两种方法来解决这个问题。

Twitter的推荐算法主要由网络内和网络外的候选来源构成,通过机器学习模型对推文进行排名,同时应用启发式方法和过滤器以提供个性化和多样化的首页推文列表。网络内来源依赖于RealGraph和逻辑回归模型,而网络外来源则利用社会图谱和嵌入空间方法寻找相关推文。最终,经过排序和过滤,推文被混合到用户的时间线上。
最低0.47元/天 解锁文章
1890

被折叠的 条评论
为什么被折叠?



