利用 BigQuery ML 构建神经网络模型进行能源生产预测
1. 特征选择与模型训练
在进行模型训练时,我们可以使用部分特征来训练新模型。具体步骤如下:
1. 特征选择 :利用相关性和共线性知识来挑选特征。
2. 模型训练 :使用选定的特征训练新模型。
3. 模型评估 :评估这些新模型,找出表现最佳的特征组合。
4. 特征贡献分析 :使用可解释性函数,探究哪些特征在全局和局部对模型性能贡献最大,查看是否有意外发现。
2. 神经网络简介
神经网络是一种数学函数,它以数值特征值作为输入,输出标签的预测值。与线性回归模型类似,神经网络也可用于回归和分类问题,这里我们主要关注回归模型。
以预测能源生产问题为例,有四个特征:温度($x_1$)、环境压力($x_2$)、相对湿度($x_3$)和排气真空压力($x_4$)。线性回归模型的形式为:
$f(\vec{x}) = y = w_0 + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4$
我们可以将其可视化为一个网络,为每个特征和输出 $y$ 绘制一个顶点,从特征顶点到输出顶点绘制箭头,并分别用权重 $w_1$、$w_2$、$w_3$ 和 $w_4$ 标记这些边。通常,在这种表示中不会绘制偏置 $w_0$。
接下来,我们可以将原始特征组合成新的隐藏特征 $z_1$ 和 $z_2$,每个隐藏特征是原始特征的线性组合,例如:
$z_1 = c_0 +
超级会员免费看
订阅专栏 解锁全文
1393

被折叠的 条评论
为什么被折叠?



