相似度的计算方法和推荐列表及计算步骤

博客讨论了可选的相似度算法,如余弦相似度、杰卡德相似度、广义杰卡德相似度和皮尔逊相关系数。还提及层次及矩阵相关内容,包括购买、浏览等行为。同时提出了相似度和推荐列表计算方式的疑问,分析了不同算法在计算和效果上的特点。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

可选的算法:

 

余弦相似度:杰卡德  广义杰卡德  余弦

层次及矩阵:购买及兑换  、 浏览、意向挖掘(借记卡、信用卡、商城等)、权益内容

疑点:相似度要分开算么,推荐列表要分开算么,到底要怎么计算组合

1、如果用余弦相似度,似乎可以按照原来的计划,分权重进行叠加,然后统一计算,这个方法比较简单,但是从历史经验上看,使用杰卡德相似度,视乎在CTR等指标上会有较好的效果

2、如果用杰卡德相似度

可能就要分开来计算了,但是如何合并是个问题

 

计算杰卡德就是不管多少,就分 0  1,不太好计算

3、可用皮尔逊相关系数来计算相似度

这个和余弦差不多,而且好理解

 

生成推荐列表的时候,行为矩阵要保留成:0-没有行为,2.3几个行为

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值