- 背景:有一时间序列数据,如下图,存在部分城市缺失一些日期的数据。
- 目标:补齐缺失的日期数据(本文完整的日期范围是2022.1.1-2022.1.5)。

- 代码
# 补全缺失日期
min_date = df['日期'].min()
max_date = df['日期'].max()
date_range = pd.date_range(min_date, max_date)
df.groupby(['省份','城市']).apply(lambda x: x.reindex(date_range))

仅展示部分结果。
本文介绍如何使用Python的Pandas库处理时间序列数据,针对存在部分城市缺失日期的情况,通过找到数据集的最早和最晚日期,创建完整日期范围,并利用`reindex`函数来填充缺失日期,确保2022年1月1日至1月5日数据的完整性。
1296

被折叠的 条评论
为什么被折叠?



