空气质量测量与文本数据处理:从模型构建到文本分析
空气质量测量模型构建
在空气质量测量的研究中,我们致力于让PurpleAir传感器的测量结果更接近AQS(空气质量系统)的测量值。研究发现,对PurpleAir测量值的调整系数约为1/2。Barkjohn采用的模型纳入了相对湿度这一因素,其表达式为:
[PA \approx b + m_1AQS + m_2RH]
这是一个多变量线性回归模型,通过最小化数据的平均平方误差来拟合模型,公式如下:
[\frac{1}{n} \sum_{i = 1}^{n} [PA_i - (b + m_1AQS_i + m_2RH_i)]^2]
之后,通过反转校准得到预测模型:
[True\ air\ quality \approx -\frac{b}{m_1} + \frac{1}{m_1}PA - \frac{m_2}{m_1}RH]
以下是Python代码实现:
AQS_RH, PA = full_df[['pm25aqs', 'rh']], full_df['pm25pa']
model_h = LinearRegression().fit(AQS_RH, PA)
[m1, m2], b = model_h.coef_, model_h.intercept_
print(f"True Air Quality Estimate = {-b/m1:.2} + {1/m1:.2}PA + {-m2/m1:.2}RH")
运行结果为:
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



