协同过滤（Collaborative Filtering）介绍和代码示例

最新推荐文章于 2025-12-11 09:43:23 发布

原创最新推荐文章于 2025-12-11 09:43:23 发布 · 42 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#运维

人工智能专栏收录该内容

85 篇文章

订阅专栏

协同过滤（Collaborative Filtering）介绍

协同过滤（Collaborative Filtering，CF）是一种推荐系统技术，通过分析用户和物品之间的交互数据来预测用户对未接触过的物品的偏好。协同过滤主要有两种类型：

用户基于的协同过滤（User-Based Collaborative Filtering）：
- 通过找到与目标用户兴趣相似的其他用户，推荐这些用户喜欢的物品。
物品基于的协同过滤（Item-Based Collaborative Filtering）：
- 通过找到与目标物品相似的其他物品，推荐与目标用户已喜欢的物品相似的物品。

协同过滤的基本步骤

数据收集：收集用户与物品之间的交互数据，通常以评分矩阵的形式表示。
相似度计算：计算用户或物品之间的相似度，常用的方法包括余弦相似度、皮尔逊相关系数等。
生成推荐：根据相似度，为用户推荐物品。

Python 代码示例

以下是一个使用用户基于协同过滤的简单示例，使用 pandas 和 numpy 库。

安装依赖

确保安装了 pandas 和 numpy：

pip install pandas numpy

示例代码

import pandas as pd
import numpy as np

# 示例评分数据
data = {
    'User': ['A', 'A', 'A', 'B', 'B', 'C', 'C', 'C', 'D', 'D'],
    'Item': ['Item1', 'Item2', 'Item3', 'Item1', 'Item3', 'Item2', 'Item3', 'Item4', 'Item1', 'Item4'],
    'Rating': [5, 3, 4, 4, 2, 5, 4, 3, 2, 5]
}

# 创建 DataFrame
df = pd.DataFrame(data)

# 创建评分矩阵
rating_matrix = df.pivot_table(index='User', columns='Item', values='Rating').fillna(0)

# 计算用户之间的余弦相似度
from sklearn.metrics.pairwise import cosine_similarity

user_similarity = cosine_similarity(rating_matrix)
user_similarity_df = pd.DataFrame(user_similarity, index=rating_matrix.index, columns=rating_matrix.index)

# 打印用户相似度矩阵
print("用户相似度矩阵:\n", user_similarity_df)

# 为用户 A 推荐物品
def get_recommendations(user, rating_matrix, user_similarity_df, n_recommendations=2):
    similar_users = user_similarity_df[user].sort_values(ascending=False)
    recommendations = pd.Series()

    for similar_user in similar_users.index:
        if similar_user != user:
            similar_user_ratings = rating_matrix.loc[similar_user]
            recommendations = recommendations.append(similar_user_ratings[similar_user_ratings > 0])
    
    recommendations = recommendations.groupby(recommendations.index).mean().sort_values(ascending=False)
    return recommendations.head(n_recommendations)

# 获取用户 A 的推荐
recommendations_for_A = get_recommendations('A', rating_matrix, user_similarity_df)
print("\n为用户 A 推荐的物品:\n", recommendations_for_A)

Find More