使用H2O深度学习进行回归分析
1. H2O Flow UI菜单概述
H2O的Flow UI界面顶部是主菜单,它提供了丰富的功能,可用于操作流程、单元格、数据和模型等。具体如下:
- 流程操作 :创建、加载、保存流程,运行流程中的所有单元格。
- 单元格操作 :运行、剪切、删除、移动单元格。
- 数据操作 :导入和分割数据。
- 模型操作 :创建、导出、导入模型。
此外,通过“Admin”子菜单,你可以查看运行中的作业、集群状态和CPU使用情况,检查日志以及访问其他高级选项(如网络测试)。而“Help”子菜单则能为你提供使用H2O的相关信息。按下“H”键,Flow UI会弹出一个显示键盘快捷键的提示框,其操作十分直观,易于上手。
2. 数据集选择与目标
本文选用UCI波士顿住房数据集,该数据集可用于预测波士顿郊区自有住房的平均价值。通过使用此数据集,我们可以专注于H2O和Sparkling Water的特性,同时便于与Spark ML的技术和易用性进行比较。
3. 将数据加载到H2O框架
此步骤是将数据加载到Sparkling Water,并使其作为H2O框架供H2O集群使用。H2O框架与Spark DataFrames类似,H2OContext类提供了从Spark DataFrames和RDD到H2O框架的隐式和显式转换。
操作步骤如下:
1. 导入转换方法:
超级会员免费看
订阅专栏 解锁全文
5万+

被折叠的 条评论
为什么被折叠?



