使用Matplotlib、Pandas和Seaborn进行数据可视化
1. 堆叠面积图发现新兴趋势
堆叠面积图是发现新兴趋势的绝佳可视化工具,尤其在市场分析中,常用于展示互联网浏览器、手机或车辆等的市场份额百分比。
操作步骤 :
1. 读取聚会数据集,将 join_date 列转换为时间戳,设置为索引,并输出前五行:
import pandas as pd
meetup = pd.read_csv('data/meetup_groups.csv',
parse_dates=['join_date'],
index_col='join_date')
meetup.head()
- 统计每周每个小组的加入人数:
group_count = meetup.groupby([pd.Grouper(freq='W'), 'group']).size()
group_count.head()
- 重塑数据,使每个聚会小组有自己的数据列:
gc2 = group_count.unstack('group', fill_value=0)
gc2.tail
超级会员免费看
订阅专栏 解锁全文
743

被折叠的 条评论
为什么被折叠?



