反馈系统设计
转贴请声明原文:http://blog.youkuaiyun.com/duck_genuine/article/details/20727169
日志收集:
展示:
带多一个vids参数,表示展示相关的视频集合,按展示顺序拼接起来
show_vids=12_32_32_32
点击:
现有from_vid=1&to_vid=2 从哪个视频点击到哪个视频情况
日志计算:(MR程序实现)
from_vid—>to_vid 的点击率
存储: (存储Hbase)
key value
from_vid-to_vid : 点击率
每次计算最近20天数据,直接覆盖或者相加再平均。
推荐计算跟点击率计算合并
~~~~~~~~~~~~~~~~~~~~~~~~
点击率reduce:
from_vid 到一系列vids的概率
vid——>vid_weight_list
如:
5—》 1:0.1, 2:0.15
nearest_video相关视频的结果
vid—>vid_weight_list
如:
5———》 1:0.54, 3:0.6
~~~~reduce 合并两个结果~~~~~~
相关度,与点击率没有交集的处理
没有点击率的数据默认为 0.15 (平均的点击率)让没有出现的数据有机会出头
那么结果就是:
5 ——》 1:0.1*0.54 , 3:0.6* 0.15
转贴请声明原文:http://blog.youkuaiyun.com/duck_genuine/article/details/20727169