协同过滤(Collaborative Filtering)介绍
协同过滤(Collaborative Filtering,CF)是一种推荐系统技术,通过分析用户和物品之间的交互数据来预测用户对未接触过的物品的偏好。协同过滤主要有两种类型:
-
用户基于的协同过滤(User-Based Collaborative Filtering):
- 通过找到与目标用户兴趣相似的其他用户,推荐这些用户喜欢的物品。
-
物品基于的协同过滤(Item-Based Collaborative Filtering):
- 通过找到与目标物品相似的其他物品,推荐与目标用户已喜欢的物品相似的物品。
协同过滤的基本步骤
- 数据收集:收集用户与物品之间的交互数据,通常以评分矩阵的形式表示。
- 相似度计算:计算用户或物品之间的相似度,常用的方法包括余弦相似度、皮尔逊相关系数等。
- 生成推荐:根据相似度,为用户推荐物品。
Python 代码示例
以下是一个使用用户基于协同过滤的简单示例,使用 pandas 和 numpy 库。
安装依赖
确保安装了 pandas 和 numpy:
pip install pandas numpy
示例代码
import pandas as pd
import numpy as np
# 示例评分数据
data = {
'User': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'D', 'D'],
'Item': ['Item1', 'Item2', 'Item3', 'Item1', 'Item3', 'Item2', 'Item3', 'Item4', 'Item1', 'Item4'],
'Rating': [5, 3, 4, 4, 2, 5, 4, 3, 2, 5]
}
# 创建 DataFrame
df = pd.DataFrame(data)
# 创建评分矩阵
rating_matrix = df.pivot_table(index='User', columns='Item', values='Rating').fillna(0)
# 计算用户之间的余弦相似度
from sklearn.metrics.pairwise import cosine_similarity
user_similarity = cosine_similarity(rating_matrix)
user_similarity_df = pd.DataFrame(user_similarity, index=rating_matrix.index, columns=rating_matrix.index)
# 打印用户相似度矩阵
print("用户相似度矩阵:\n", user_similarity_df)
# 为用户 A 推荐物品
def get_recommendations(user, rating_matrix, user_similarity_df, n_recommendations=2):
similar_users = user_similarity_df[user].sort_values(ascending=False)
recommendations = pd.Series()
for similar_user in similar_users.index:
if similar_user != user:
similar_user_ratings = rating_matrix.loc[similar_user]
recommendations = recommendations.append(similar_user_ratings[similar_user_ratings > 0])
recommendations = recommendations.groupby(recommendations.index).mean().sort_values(ascending=False)
return recommendations.head(n_recommendations)
# 获取用户 A 的推荐
recommendations_for_A = get_recommendations('A', rating_matrix, user_similarity_df)
print("\n为用户 A 推荐的物品:\n", recommendations_for_A)
Find More
代码解释
-
数据准备:创建一个包含用户、物品和评分的示例数据集,并将其转换为评分矩阵。
-
计算用户相似度:使用余弦相似度计算用户之间的相似度,并生成用户相似度矩阵。
-
推荐函数:定义一个函数
get_recommendations,为指定用户生成物品推荐。该函数根据相似用户的评分生成推荐。 -
获取推荐:调用推荐函数,为用户 A 获取推荐物品并打印结果。
总结
协同过滤是一种有效的推荐系统方法,通过分析用户行为来生成个性化推荐。以上示例展示了如何使用用户基于协同过滤的基本实现,实际应用中可以根据需求扩展更多功能,如处理稀疏矩阵、引入时间因素等。
2871

被折叠的 条评论
为什么被折叠?



