时间序列分析:犯罪数据处理与洞察
在数据分析领域,时间序列分析是一项至关重要的技术,它能够帮助我们从带有时间戳的数据中提取有价值的信息。本文将围绕犯罪数据展开,详细介绍如何运用各种方法对犯罪数据进行时间序列分析,包括数据选择、切片、分组以及聚合等操作。
1. 数据选择与切片
在处理犯罪数据时,我们常常需要根据日期来选择和切片数据。首先,确保数据的索引包含日期值,这样才能利用索引操作符进行智能的行选择和切片。以下是具体的操作步骤:
- 设置日期索引 :将 REPORTED_DATE 列移动到索引中,创建一个 DatetimeIndex 。
import pandas as pd
crime = pd.read_hdf('data/crime.h5', 'crime').set_index('REPORTED_DATE')
print(type(crime.index))
- 使用
.loc索引器选择数据 :可以使用各种字符串来选择行,所有能传递给pandas Timestamp构造函数的字符串都适用。
crime.loc['2015-3-4 22':'2016-1-1 11:45:00'].sort_index()
超级会员免费看
订阅专栏 解锁全文
33

被折叠的 条评论
为什么被折叠?



