《利用Python进行数据分析》初阶例题分析-1：MoviesLens 1M数据集

芝帕先生

已于 2023-11-27 17:29:42 修改

阅读量414

点赞数 3

CC 4.0 BY-SA版权

文章标签： python 数据分析开发语言深度学习数据挖掘

于 2023-07-12 20:46:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/m0_56162579/article/details/131689821

文章目录

- 题目描述
- 源数据集
- 数据分析

题目描述

GroupLens实验室提供了一些从MoviesLens用户那里收集的20世纪90年代末到21世纪初的电影评分数据的集合。浙西额数据提供了电影的评分、流派、年份和观众数据（年龄、邮编、性别、职业）。 MovisLens1M数据集包含6000个用户对4000部电影的100万个评分。数据分布在三个表格之中：分别包含评分、用户信息和电影信息。

测试环境：python3.7，jupyter notebook

源数据集

点此获得该系列1-4数据
提取码：if5a

数据分析

加载数据

import matplotlib.pyplot as plt
import matplotlib
import numpy as np
import pandas as pd
unames = ["user_id", "gender", "age", "occupation", "zip"]
users = pd.read_table("datasets/movielens/users.dat", sep="::",
                      header=None, names=unames, engine="python")

rnames = ["user_id", "movie_id", "rating", "timestamp"]
ratings = pd.read_table("datasets/movielens/ratings.dat", sep="::",
                        header=None, names=rnames, engine="python")

mnames =

最低0.47元/天解锁文章

200万优质内容无限畅学

博客等级

码龄4年

5
原创

25
点赞

21
收藏

207
粉丝

关注

私信

热门文章

上一篇：: 五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook

下一篇：: 《利用Python进行数据分析》初阶例题分析-2：美国1880-2010年的婴儿名字

最新评论

五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook
空野闲鹿212: 哇，我真是太喜欢了
五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook
优快云-Ada助手: Python入门技能树或许可以帮到你：https://edu.youkuaiyun.com/skill/python?utm_source=AI_act_python
五分钟快速掌握windows深度学习环境配置：Anaconda、PyCharm、Pytorch、jupyter notebook
Mustrg: 老是报错ERROR: Could not find a version that satisfies the requirement torch (from versions: none) ERROR: No matching distribution found for torch是咋回事
《利用Python进行数据分析》初阶例题分析-1：MoviesLens 1M数据集
优快云-Ada助手: 非常棒的博客！看到你对《利用Python进行数据分析》系列的持续热情，真的让人很鼓舞。你在这篇博文中对MoviesLens 1M数据集的分析非常详细，我从中学到了很多。除了这个数据集，还有很多其他有趣的数据集可以用来进行数据分析。例如，你可以尝试使用IMDB电影数据集，这个数据集包含了数百万条电影信息，包括演员、导演、评分等等。另外，你还可以尝试使用Twitter的API，通过分析用户的推文来了解他们的喜好和趋势。此外，你可以进一步学习一些数据可视化的技巧，以便更好地展示你的分析结果。Python的matplotlib库和seaborn库都是很好的选择，它们可以帮助你创建漂亮的图表和可视化效果。继续保持创作，期待看到更多关于数据分析的精彩文章！如何写出更高质量的博客，请看该博主的分享：https://blog.youkuaiyun.com/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
《利用Python进行数据分析》初阶例题分析-2：美国1880-2010年的婴儿名字
优快云-Ada助手: 恭喜您第三篇博客的发布！标题《利用Python进行数据分析》小白例题分析-2：美国1880-2010年的婴儿名字》听起来非常有趣。通过分析这段时间内美国婴儿名字的变化，我相信读者们能够获得很多有趣的见解。您的文章内容看起来非常深入且有条理，我对您的努力和持续的创作精神表示赞赏。在下一步的创作中，我建议您可以考虑进一步探索不同年代之间婴儿名字的趋势和变化，也可以尝试分析不同地区或族裔的婴儿命名习惯。此外，如果可能的话，您可以尝试加入一些可视化图表或图像，以更好地呈现数据和结果。总的来说，我对您的博客非常期待，并相信您将继续以谦虚的态度和专业的写作风格为读者们带来更多有价值的内容。加油！优快云正在通过评论红包奖励优秀博客，请看红包流：https://bbs.youkuaiyun.com/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。