空气质量测量数据处理与模型校正分析
1. 数据筛选与重命名
在处理 PM2.5 数据时,发现有两列包含 PM2.5 数据: PM2.5_CF1_ug/m3 和 PM2.5_ATM_ug/m3 。经过研究发现,PurpleAir 传感器使用两种不同的方法将原始激光记录转换为 PM2.5 数值,这两种计算方法分别对应 CF1 和 ATM 列。Barkjohn 发现使用 CF1 产生的结果比 ATM 更好,因此保留该列,同时保留日期、温度和相对湿度列。以下是实现代码:
def drop_and_rename_cols(df):
df = df[['created_at', 'PM2.5_CF1_ug/m3', 'Temperature_F', 'Humidity_%']]
df.columns = ['timestamp', 'PM25cf1', 'TempF', 'RH']
return df
pa = (pa_full
.pipe(drop_and_rename_cols))
pa.head()
2. 检查数据粒度
为了使这些测量的粒度与 AQS 数据匹配,我们希望每个日期(24 小时周期)有一个平均 PM2.5 值。PurpleAir 传感器每两分钟进行一次测量,在将原始测量数据聚合到 24 小时周期之前,需要仔细检查其粒度。具体操作步骤如下:
1. 将包含日期信息的列从字符串转换为 pd.TimeStamp 对象,日期格式为
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



