机器学习中的协同过滤与深度学习
1. 协同过滤(CF)
协同过滤(CF)主要关注用户的相似性属性,即通过相似性度量从大量用户中找出品味相似的人。在实际应用中,CF 有两种实现方式:基于内存的和基于模型的。
1.1 基于内存的协同过滤
基于内存的协同过滤主要基于相似性算法。该算法通过查看相似用户喜欢的物品来创建推荐列表,然后对列表进行排序,向用户推荐排名靠前的 n 个物品。用户相似度推荐算法可以表示为:
[
pr_{m,r_{m,x_k},x,u,N,y_k,y,x,y,u,N,x,y,y,x,y,x} = \sum_{y \in N_x} sim(u_x, u_y) \frac{r_{y,k} - \bar{r} y}{\sum {y \in N_x} sim(u_x, u_y)}
]
以下是一个使用电影评分数据集的协同过滤推荐系统的示例代码:
import numpy as np
import pandas as pd
df = pd.read_csv('Data/movie_rating.csv')
n_users = df.userID.unique().shape[0]
n_items = df.itemID.unique().shape[0]
print ('\nNumber of users = ' + str(n_users) + ' | Number of movies = ' + str(n_items))
# Create user-item similarity matrices
df_matrix
协同过滤与深度学习技术解析
超级会员免费看
订阅专栏 解锁全文
539

被折叠的 条评论
为什么被折叠?



