python pandas 实战电影评分处理

最新推荐文章于 2025-03-24 21:34:03 发布

瓦力冫

最新推荐文章于 2025-03-24 21:34:03 发布

阅读量2.3k

点赞数

CC 4.0 BY-SA版权

分类专栏： python pandas

本文链接：https://blog.youkuaiyun.com/fox64194167/article/details/80599751

python 同时被 2 个专栏收录

73 篇文章 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

pandas

7 篇文章

订阅专栏

本文详细介绍了如何使用Python的Pandas库处理电影评分数据，包括数据清洗、统计分析、数据可视化等步骤，揭示电影评分背后的有趣洞察。

import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import json
from pandas import DataFrame, Series


unames = ['user_id', 'gender', 'age', 'occupation', 'zip']
#用read_table方式读取数据，给出分隔和names
users = pd.read_table('ch02/movielens/users.dat', sep='::', header=None, names=unames)

rnames = ['user_id', 'movie_id', 'rating', 'timestamp']
ratings = pd.read_table('ch02/movielens/ratings.dat', sep='::', header=None, names=rnames)


mnames = ['movie_id', 'title', 'genres']
movies = pd.read_table('ch02/movielens/movies.dat', sep='::', header=None, names=mnames)

#合并
data = pd.merge(pd.merge(ratings, users), movies)

#透视表
mean_ratings = data.pivot_table('rating', index='title', columns='gender', aggfunc='mean')

ratings_by_title = da

了解本专栏