基于杰卡德系数搭建推荐系统【小白必备】

目录

一、引言

二、杰卡德系数是什么?

三、Python搭建推荐模型

01、生成消费数据

02、计算杰卡德系数

03、筛选高相似用户,生成推荐

四、结论:杰卡德系数的优与思


一、引言

在逛电商时你是不是总好奇,为什么平台推的商品刚好是我想要的?

其实这背后藏着各种推荐算法,今天就给大家分享一个简单又实用的模型,基于杰卡德系数的电商推荐系统,拆解模型怎么找相似买家、推精准商品。

二、杰卡德系数是什么?

一句话来说,杰卡德系数就是用交集和并集来算相似。

杰卡德系数衡量的是两个集合的重叠程度,公式为:J(A,B)=|A∩B|/|A∪B|。

A∩B:两个集合的交集,比如用户A买过的商品和用户B买过的商品的重叠部分。

A∪B:两个集合的并集,比如用户A和用户B买过的所有商品;

取值范围:0~1,系数越接近1,说明两个集合越相似。越接近0,越不相似。

三、Python搭建推荐模型

光懂理论不够,我们直接用仿真电商消费数据实操!步骤清晰,小白也能跟着做~

01、生成消费数据

首先模拟电商场景,搭建商品池包括红牛、啤酒、伏特加、葡萄酒、咖啡、牛奶、可乐7种常见饮品。随机生成30位消费者的商品数据,用1表示购买,0表示未购买。这里可以替换成真实数据进行实操。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from matplotlib.patches import Rectangle
import networkx as nx
# 设置中文字体(避免乱码)
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False
# 1. 定义商品列表和用户列表(30位用户)
products = ["红牛", "啤酒", "伏特加", "葡萄酒", "咖啡", "牛奶", "可乐"]
users = [f"U{i}" for i in range(1, 31)]  # U1~U30(30位用户)
# 2. 生成完整购买数据(无缺失值,1=购买,0=未
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小小 科研

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值