这是《用Python玩转数据》4.2的编程练习。
要求:
计算MovieLens 100k数据集中男性女性用户评分的标准差并输出。
数据集下载
其中u.data 表示100k条评分记录,每一列的数值含义是:
user id | item id | rating | timestamp
u.user表示用户的信息,每一列的数值含义是:
user id | age | gender | occupation | zip code
u.item文件表示电影的相关信息,每一列的数值含义是:
movie id | movie title | release date | video release date |IMDb URL | unknown | Action | Adventure | Animation | Children’s | Comedy | Crime | Documentary | Drama | Fantasy |Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi |Thriller | War | Western |
最后的输出应该是这样的:
gender
F *.*(只是示意)
M *.*(只是示意)
Name: rating, dtype: float64
编程思路
(话说,这里是不是应该制作程序设计逻辑图?这里有基本功的教程:,在线画图工具

这篇博客介绍了如何使用Python处理MovieLens 100k数据集,通过读取数据、合并用户信息,然后利用pivot_table计算男性和女性用户的评分标准差。内容包括数据集介绍、编程思路、代码实现和输出结果。
最低0.47元/天 解锁文章
1652

被折叠的 条评论
为什么被折叠?



