广义线性模型(GLM)在不同数据集上的应用与调优
1. GLM 参数介绍
1.1 obj_reg
obj_reg 是一个高级选项,用于修改目标函数。默认值为 -1,表示使用训练数据集行数的倒数。
1.2 prior
用于二项分类,是两个类别中第一个类别的先验概率。作为概率,其值必须在 0.0 到 1.0 之间。默认值是训练数据中第一个类别的样本百分比,只有当你确定默认值不准确时才需设置。
1.3 compute_p_values
将其设置为 true 可返回每个系数的 p 值,仅在使用 solver=”IRLSM” 且 lambda=0 时可用。
2. 建筑能源效率数据集:默认 GLM 模型
2.1 问题描述
这是一个回归问题,基于房屋设计特征估计制冷负荷。
2.2 代码实现
在 R 中使用以下代码:
m <- h2o.glm(x, y, train, nfolds = 10, model_id = "GBM_defaults")
在 Python 中使用以下代码:
from h2o.estimators.glm import H2OGeneralizedLinearEstimator
m = H2OGeneralizedLinearEstimator(model_id="GLM_defaults", n
超级会员免费看
订阅专栏 解锁全文
5828

被折叠的 条评论
为什么被折叠?



