一,概述
猜你喜欢与最近浏览相响应,用户在页面上点击一个商品时,首先会出现在最近浏览部分,最近浏览部分随即会出现本页最近浏览商品对应的分类信息,将出现的分类,对应的浏览量最大的商品推荐出来即为猜你喜欢。
二,数据源
2.1商品基本数据
商品ID,对应的最低一级分类,该数据从数据库中获取。
2.2数据挖掘的数据
商品ID,商品的浏览次数;从行为日志中获取
2.2.1算法处理-数据部分
商品数据<基本数据>
商品ID | 分类ID |
|
|
|
|
|
|
商品数据<基本数据>
商品ID | 浏览次数 |
|
|
|
|
|
|
第一步 (mapreduce)
商品ID | 1:分类ID,2:浏览次数 |
|
|
|
|
|
|
第二步 (mapreduce)
分类 | 商品ID1,次数1;商品ID2,次数2 |
|
|
|
|
2.2.2 算法处理-推荐引擎部分
<1>取出用户最近浏览数据,取出最近浏览数据对应的所有分类。
<2>根据分类取猜你喜欢数据,得到商品ID+浏览次数列表,按浏览次数排序,分页,返回给用户即可。
分类和浏览次数做权重计算排序权重,实际应用中可以参考其它排序因素。