谷本系数的相似性度量 —— Tanimoto Coefficient-based Similarity

最新推荐文章于 2024-11-15 17:35:37 发布

转载最新推荐文章于 2024-11-15 17:35:37 发布 · 2.4w 阅读

·

3

·

推荐算法专栏收录该内容

6 篇文章

订阅专栏

本文介绍了Tanimoto系数（也称Jaccard系数），一种用于评估用户与物品间关联程度的相似度指标。该系数仅关注用户是否对物品有过评价，并通过计算共同评价物品的数量与所有评价物品数量的比例来衡量相似度。

AI助手已提取文章相关产品：

Tanimoto Coefficient和前面的5中相关度计算方式有很大的不同，它不关心用户对物品的具体评分值是多少，它在关心用户与物品之间是否存在关联关系。还记得上一篇文章《Mahout学习笔记——数据承载》里面提到的布尔喜好值（Boolean Preference）吧！Tanimoto Coefficient依赖于用户和物品之间的这种Boolean关系作为输入。

更准确的说法为：Tanimoto Coefficient主要用于计算符号度量或布尔值度量的个体间的相似度，因为个体的特征属性都是由符号度量或者布尔值标识，因此无法衡量差异具体值的大小，只能获得“是否相同”这个结果，所以Tanimoto Coefficient只关心个体间共同具有的特征是否一致这个问题。Tanimoto Coefficient又被叫做Jaccard Coefficient，其值等于两个用户共同关联（不管喜欢还是不喜欢）的物品数量除于两个用户分别关联的所有物品数量。

也就是关联的交集除于关联的并集，用公式表示为：

其值介于[0, 1]之间，如果两个用户关联的物品完全相同，交集等于并集，值为1；如果没有任何关联，交集为空，值为0。

注：本块中提及的关联指用户对物品有评分值

您可能感兴趣的与本文相关内容

博客等级

码龄14年

关注

22点赞

83收藏

21粉丝

评论 1

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。