【每周一文】Googles News Personalization:Scalable Online Collaborative Filtering(2007)

这篇论文介绍了Google如何实现大规模在线推荐系统,重点讨论了MinHash聚类、PLSI模型和共现统计在用户个性化推荐中的应用,以及如何通过LSH优化计算效率。系统框架为实时推荐和大规模数据处理提供了架构参考。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

概述

最近因工作需要调研一下对大规模数据如何进行有效用户聚类,发现google之前论文做过相关事情。

该文从工程实现角度介绍了一种通用的在线推荐架构,可以适用于大规模数据和实时推荐。该文提到模型通过三种方式进行推荐1)MinHash 聚类2)PLSI 3)共现

问题

问题:根据用户对页面的点击历史进行个性化推荐。
和Netfix电影推荐的主要不同是
1)用户点击行为噪声比较多
2)没有负样本数据,点击数据只会告诉用户偏好,用户不喜欢的兴趣不清楚。

模型

通过以下模型对问题进行建模,基于Item_based CF模型

rua,skci:
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值