【Python】Tanimoto相似度算法实现

本文介绍了一种名为Tanimoto相似度的计算方法,用于衡量两个集合间的相似度。通过两个示例展示了如何计算两个列表之间的公共元素比例,并提供了两种Python实现方式。

公式:

  • 假设A  =  [1,2,3,4]  ,长度为4
  • 假设B  =  [1,2,5,6]  ,长度为4 
  • 则AB的公共部分C = [1,2], 长度为2
  • AB的相似度为:2 / (4 + 4 - 2) = 0.33

算法:

方法一:

#-*- coding: utf-8 -*-  
#user_data为用户信息嵌套字典  
#如{'fabrice' : {'water' : 3}}  
def sim_tonimoto(user_data, user1, user2):  
    common = {}  
    #判断有没有相同的数据, 没有相同数据则返回0  
    for item in user_data[user1]:  
        if item in user_data[user2]:  
            common[item] = 1  
  
    if len(common) == 0:  
        return 0  
  
    common_num = len(common)  
    user1_num = len(user_data[user1])  
    user2_num = len(user_data[user2])  
  
    res = float(common_num)/(user1_num + user2_num - common_num)  
  
    return res  

 

方法二:

def sim_tonimoto(user_data, user1, user2):  
    common = [item for item in user_data[user1] if item in user_data[user2]]  
    return float(len(common))/(len(user_data[user1]) + len(user_data[user2]) - len(common))  

 

转载于:https://my.oschina.net/mickelfeng/blog/749552

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值