【Python有趣打卡】数据分析pandas完成数据分析项目

今天依然是跟着罗罗攀学习数据分析,原创:罗罗攀(公众号:luoluopan1)学习Python有趣|数据分析三板斧。今天是在DD大数据团队实习的第一天,正式开始数据分析之旅,很开心,感觉离自己的梦想又进了一步~
数据源
- 数据来源
https://www.kaggle.com/starbucks/store-locations (数据下载需要注册) - 定义问题
哪些国家星巴克店铺较多;哪些城市星巴克店铺较多;中国星巴克店铺分布情况 - 读取数据
import numpy as np
import pandas as pd
data = pd.read_csv(r'C:\Users\xuxiaojielucky_i\Desktop\directory.csv')
data.head()
还是使用jupyter notebook
查看数据
- 检查数据
data.describe()
describe函数主要是用来了解数值型数据的分布和概况
data.info()
info函数主要是用来查看数据的缺失值情况,如针对我们的问题,我们关注的数据主要是地点(国家和城市),这里城市city部分数据缺失。