基于受限玻尔兹曼机的协同过滤与电影评论情感分析移动应用
1. 基于受限玻尔兹曼机的协同过滤系统实现
在协同过滤系统的实现中,我们将使用受限玻尔兹曼机(RBM)。所使用的数据集是 MovieLens 100K 数据集,该数据集包含用户对不同电影给出的 1 到 5 星的评分,可从 https://grouplens.org/datasets/movielens/100k/ 下载。
1.1 输入数据处理
输入的评分文件每行包含用户 ID、电影 ID、评分和时间戳。我们对每条记录进行处理,创建一个三维的 numpy 数组作为训练文件,这三个维度分别对应用户 ID、电影 ID 和评分。评分从 1 到 5 进行独热编码,因此评分维度的长度为 5。我们使用 80% 的输入记录创建训练数据,其余 20% 用于测试。用户评分的电影数量为 1682 部,训练文件包含 943 个用户,所以训练数据的维度为 (943, 1682, 5)。
以下是创建训练和测试文件的详细代码:
"""
@author: santanu
"""
import numpy as np
import pandas as pd
import argparse
'''
Ratings file preprocessing script to create training and hold out test datasets
'''
def process_file(in
超级会员免费看
订阅专栏 解锁全文
2万+

被折叠的 条评论
为什么被折叠?



