BigQuery数据处理与线性回归模型特征选择
1. BigQuery查询结果保存
在使用BigQuery进行查询时,有时我们可能会面临不同的结果保存需求。以下是两种常见情况及对应的解决方法:
1.1 执行查询后决定保存结果
如果在执行查询后才决定保存结果,无需重新运行查询。可以在查询结果上方的Web控制台中,选择“Save Results”,然后选择“BigQuery Table”,接着填写要从这些结果创建的表的数据集和表名。
1.2 事后发现应保存结果
当执行查询时,结果会存储在临时表中。该临时表在查询完成后会保留24小时。要访问临时表,可按以下步骤操作:
1. 转到控制台底部的“Personal History”选项卡。
2. 点击与你想要检索结果的查询对应的作业。
3. 点击“Temporary table”。
这个临时表可以像其他表一样进行查询,并且可以按上述方法保存结果。
2. 线性回归模型
2.1 问题定义
我们的目标是根据温度、环境压力、相对湿度和排气真空压力来预测联合循环发电厂(CCPP)的能源产量,这是一个回归问题,因为目标是预测一个实数(发电厂的能源产量,单位为兆瓦)。
2.2 线性回归模型原理
线性回归模型是一种寻求最佳拟合线的模型。假设我们有一些数值特征 (x_1, \cdots, x_n),通常用 (\vec{x}) 表示这些特征的列表。线性回归模型的函数形式为:
[f(\vec{x}) = w_0 + w_1 \times x_1 + \cdo
超级会员免费看
订阅专栏 解锁全文
687

被折叠的 条评论
为什么被折叠?



