【Python有趣打卡】利用pandas完成数据分析项目(一)

本文介绍了使用pandas进行数据分析的项目,通过Kaggle上的星巴克店铺数据,探讨了全球及中国星巴克店铺的分布情况,包括处理缺失值、异常值,以及通过可视化展示各国和各城市店铺数量。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

【Python有趣打卡】数据分析pandas完成数据分析项目

今天依然是跟着罗罗攀学习数据分析,原创:罗罗攀(公众号:luoluopan1)学习Python有趣|数据分析三板斧。今天是在DD大数据团队实习的第一天,正式开始数据分析之旅,很开心,感觉离自己的梦想又进了一步~

数据源

import numpy as np
import pandas as pd
data = pd.read_csv(r'C:\Users\xuxiaojielucky_i\Desktop\directory.csv')
data.head()

还是使用jupyter notebook
在这里插入图片描述

查看数据

  • 检查数据
data.describe()

describe函数主要是用来了解数值型数据的分布和概况
在这里插入图片描述

data.info()

info函数主要是用来查看数据的缺失值情况,如针对我们的问题,我们关注的数据主要是地点(国家和城市),这里城市city部分数据缺失。

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值