时间序列分析:犯罪数据与员工薪资的多维度洞察
1. 按工作日和年份衡量犯罪率
在分析犯罪数据时,我们常常需要同时考虑工作日和年份这两个因素。幸运的是,Pandas 提供了强大的 dt 访问器,它可以让我们直接从时间戳中提取所需信息。
1.1 准备工作
我们将使用 dt 访问器提取每起犯罪的工作日名称和年份,并将其作为 Series。然后,通过这两个 Series 对犯罪数据进行分组计数。最后,在创建犯罪总量热力图之前,对数据进行调整,以考虑部分年份和人口因素。
1.2 操作步骤
- 读取数据 :
import pandas as pd
crime = pd.read_hdf('data/crime.h5', 'crime')
crime.head()
- 提取工作日名称并计数 :
wd_counts = crime['REPORTED_DATE'].dt.weekday_name.value_counts()
wd_counts
输出结果显示,周末的犯罪和交通事故数量明显少于工作日:
| 工作日 | 数量 |
| — | — |
| Monday | 70024 |
超级会员免费看
订阅专栏 解锁全文
18

被折叠的 条评论
为什么被折叠?



