# 导入项目所需的模块
import pandas as pd
from pyecharts.charts import *
from pyecharts import options as opts
# 使用pandas读取数据
df = pd.read_csv('directory.csv')
df.head()

查看缺失值
df.isnull().sum()

del df['Phone Number']
del df['Postcode']
df.isnull().sum()

删除空值
df.dropna(inplace= True)
地理热力图

-
从热力图分布来看,星巴克门店主要还是集中于美国,其次在亚洲的日本,韩国,中国沿海地区也有不少分布;
-
非洲,大洋洲几乎看不到星巴克门店的存在,当然这其中的原因,有的是出于该地区的消费水平考虑,星巴克不愿去开设门店,比如非洲地区,有的是因为当地居民瞧不上星巴克这种“商业咖啡”,比如澳大利亚
#通过`pd.merge()`将数据进行关联,获取门店的所属国家信息;
country_df = pd.read_excel('./abb_country.xlsx')
df_new = pd.merge(df,country_df,left_on='Country',right_on='abb',how = 'left')
# 数据分组计数,计算每个国家的门店数
df_t = df_new.groupby(['Coun'])['Brand'].count().reset_index()
df_t.head()
df_t.columns = ['Coun', '计数']
data_pair = [i for i in zip(df_t['Coun'],df_t['计数'])]
绘制星