
推荐系统实践
读书笔记
Fiona-Dong
这个作者很懒,什么都没留下…
展开
-
(二)利用用户行为数据 -- 3 隐语义模型
3. 隐语义模型 3.1 基础算法 隐语义模型LFM(latent factor model) 的核心思想是,通过隐含特征(latent factor) 联系用户兴趣和物品。 简单来说,可以对书和物品的兴趣进行分类,然后对于某个用户,先得到他的兴趣分类,再从分类中挑选他可能喜欢的物品。 人工 vs 隐含语义分析技术 这种基于兴趣分类的方法大概需要解决以下3个问题: (1) 如何给物品进行分类; (2) 如何确定用户对哪些类的物品感兴趣,以及感兴趣的程度; (3) 对于一个给定的类,选择哪些属于这个类的物品原创 2020-08-30 21:09:12 · 254 阅读 · 0 评论 -
(二)利用用户行为数据 -- 2 基于邻域的算法 (2)
2.2 基于物品的协同过滤算法 基于物品的协同过滤(item-based collaborative filtering) 算法是目前业界应用最多的算法。 2.2.1 基础算法 基于用户的协同过滤算法,主要存在以下两个缺点: (1) 随着网站的用户数目越来越大,计算用户兴趣相似度矩阵将越来越困难,其运算时间复杂度和空 间复杂度的增长和用户数的增长近似于平方关系。 (2) 基于用户的协同过滤很难对推荐结果作出解释。 由此,提出了基于物品的协同过滤算法(简称Item CF) ,即,给用户推荐那些和他们之前喜欢的原创 2020-08-30 19:57:03 · 328 阅读 · 0 评论 -
(二)利用用户行为数据 -- 2 基于邻域的算法 (1)
2. 基于邻域的算法 基于邻域的算法分为两大类,一是基于用户的协同过滤算法,二是基于物品的协同过滤算法。 2.1 基于用户的协同过滤算法 2.1.1 基础算法 基于用户的协同过滤算法 当一个用户A需要个性化推荐时,可以先找到和他有相似兴趣的其他用户,然后把那些用户喜欢的、而用户A没有听说过的物品推荐给A。 主要包括两个步骤: (1) 找到和目标用户兴趣相似的用户集合。 (2) 找到这个集合中的用户喜欢的,且目标用户没有听说过的物品推荐给目标用户。 其中,步骤(1)的关键就是计算两个用户的兴趣相似度。原创 2020-08-30 18:51:56 · 439 阅读 · 0 评论 -
(二)利用用户行为数据 -- 1 数据简介及分析
1. 数据简介及分析 1.1 数据简介 行为数据 用户行为数据在网站上最简单的存在形式是日志。 网站在运行过程中产生大量原始日志(raw log) , 并将其存储在文件系统中。 很多互联网业务会将多种原始日志按照用户行为汇总为会话日志(session log) 。其中,每个会话表示一次用户行为和对应的服务。 例如, 在搜索引擎和搜索广告系统中: 服务会为每次查询生成一个展示日志(impression log) , 记录了查询和返回结果。 若用户点击了某个结果, 则该点击信息会被服务器截获并存储在点击日志(原创 2020-08-30 17:49:25 · 1136 阅读 · 0 评论 -
(一)好的推荐系统
1. 推荐系统的定义及应用 推荐算法的本质是通过一定的方式将用户和物品联系起来,而不同的推荐系统利用了不同的方式。 联系用户和物品的常用方式,如下图所示: 推荐系统在电子商务中最主要的应用为:个性化商品推荐列表和相关商品的推荐列表。 2. 推荐系统评测 2.1 实验方法 在推荐系统中, 主要有3种评测推荐效果的实验方法: 离线实验(offline experiment) 、用户调查(user study)、在线实验(online experiment) 。 离线实验 离线实验的方法一般由以下几个原创 2020-08-30 16:56:59 · 179 阅读 · 0 评论