用Python计算MovieLens 100k数据集中男性女性用户评分的标准差

这篇博客介绍了如何使用Python处理MovieLens 100k数据集,通过读取数据、合并用户信息,然后利用pivot_table计算男性和女性用户的评分标准差。内容包括数据集介绍、编程思路、代码实现和输出结果。

这是《用Python玩转数据》4.2的编程练习。


要求:

计算MovieLens 100k数据集中男性女性用户评分的标准差并输出。
数据集下载

其中u.data 表示100k条评分记录,每一列的数值含义是:
user id | item id | rating | timestamp

u.user表示用户的信息,每一列的数值含义是:
user id | age | gender | occupation | zip code

u.item文件表示电影的相关信息,每一列的数值含义是:
movie id | movie title | release date | video release date |IMDb URL | unknown | Action | Adventure | Animation | Children’s | Comedy | Crime | Documentary | Drama | Fantasy |Film-Noir | Horror | Musical | Mystery | Romance | Sci-Fi |Thriller | War | Western |

最后的输出应该是这样的:

gender
F         *.*(只是示意)
M         *.*(只是示意)
Name: rating, dtype: float64

编程思路
(话说,这里是不是应该制作程序设计逻辑图?这里有基本功的教程:,在线画图工具

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值