可选的算法:
余弦相似度:杰卡德 广义杰卡德 余弦
层次及矩阵:购买及兑换 、 浏览、意向挖掘(借记卡、信用卡、商城等)、权益内容
疑点:相似度要分开算么,推荐列表要分开算么,到底要怎么计算组合
1、如果用余弦相似度,似乎可以按照原来的计划,分权重进行叠加,然后统一计算,这个方法比较简单,但是从历史经验上看,使用杰卡德相似度,视乎在CTR等指标上会有较好的效果
2、如果用杰卡德相似度
可能就要分开来计算了,但是如何合并是个问题
计算杰卡德就是不管多少,就分 0 1,不太好计算
3、可用皮尔逊相关系数来计算相似度
这个和余弦差不多,而且好理解
生成推荐列表的时候,行为矩阵要保留成:0-没有行为,2.3几个行为