推荐系统:原理、方法与评估
1. 推荐系统概述
在搜索系统的讨论中,我们常关注短期的临时信息需求,例如图书馆或网络搜索,用户从静态信息源中主动获取相关信息。然而,大多数用户也有长期信息需求,如从动态信息源中过滤或推荐文档(或其他类型的项目),此时系统会主动向用户推送信息,像新闻过滤器、电子邮件过滤器、电影/书籍推荐器或文献推荐器等。虽然推荐系统(强调向用户提供有用项目)和过滤系统(强调排除无用项目)有所区别,但使用的技术相似,为方便起见,我们将“推荐”和“过滤”互换使用。
与临时搜索不同,过滤过程中我们能从用户那里收集大量反馈信息,这对于学习反馈以提高过滤性能至关重要。在过滤时,文档从动态信息源传递,系统必须在文档“到达”时立即做出关于其与用户相关性的二元决策,这比搜索更具挑战性,因为搜索只需提供排名列表,让用户灵活设置截止点。不过,由于能收集反馈信息,我们可以逐渐了解用户喜好,从而更易区分相关和不相关文档。
过滤的核心问题是:用户 u 是否会喜欢项目 x?回答这个问题的方式决定了我们采用以下两种策略中的哪一种:
- 基于内容的过滤 :查看用户 u 喜欢的内容,并对项目 x 进行特征描述。
- 协同过滤 :查看喜欢项目 x 的用户,并对用户 u 进行特征描述。
基于内容的过滤是学习用户喜欢的内容类型,然后将当前文章的内容与我们认为能很好描述用户喜好的“内容原型”进行匹配。协同过滤则是查看其他相似用户喜欢的内容,并假设与你相似的其他用户喜欢某个项目,你可能也会喜欢。需要注意的是,如果能获取用户对项目的评分,协同过滤可用于推荐任何项目;而基于内容的过滤仅适用于我们知道如
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



