读取数据:
df = pd.read_csv('./data/当当网畅销图书榜单数据.csv')
df.head(10)

数据预处理:
df.info()

df = df.drop_duplicates(subset=['书名', '出版日期'])
df['出版日期_year'] = pd.to_datetime(df['出版日期']).dt.year

df.info()

df.to_csv('./data/当当网畅销图书榜单数据处理后.csv', index=False)
数据可视化:
df = pd.read_csv('./data/当当网畅销图书榜单数据处理后.csv')
new_data = []
data = df['作者'].value_counts()
data = data.sort_values(
ascending=False
).head(20)
for index, value in data.items():
new_data.append((index, value))
chart = Funnel(init_opts=opts.InitOpts(width="1200px", height="600px"))
chart.add(series_name="数量",
data_pair=new_data,
label_opts=opts.LabelOpts(
font_size=10,
is_show=True,
position="inside",
formatter="{b} : {c}本"
),
tooltip_opts=opts.TooltipOpts(
trigger='item',
)