43、使用 H2O 在 Spark 上进行深度学习及 Apache Spark 安装指南

最新推荐文章于 2025-12-02 20:45:02 发布

web99

最新推荐文章于 2025-12-02 20:45:02 发布

阅读量5

点赞数

CC 4.0 BY-SA版权

分类专栏： Spark实战精要文章标签： H2O Spark 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.youkuaiyun.com/web99/article/details/155478093

Spark实战精要专栏收录该内容

45 篇文章 ¥499.90

订阅专栏¥69.90

会员秒杀 ¥9.9 重磅福利

超级会员免费看

使用 H2O 在 Spark 上进行深度学习及 Apache Spark 安装指南

1. 使用 H2O 深度学习进行分类

深度学习不仅可用于回归，还能用于分类。这里将使用之前用过的成人数据集，该数据集提取自 1994 年美国人口普查数据，包含 13 个属性，如性别、年龄、教育程度、婚姻状况、种族、国籍等，目标变量是收入，目的是预测一个人每年收入是否超过 50000 美元。数据集可在在线仓库找到，列描述可在 adult.names 文件中查看。

1.1 加载和拆分数据

1.1.1 加载数据

可将数据从文件直接加载到 H2OFrame，只需提供文件路径：

val censusH2O = new H2OFrame(new java.net.URI("first-edition/ch08/adult.raw"))

该框架可通过 H2O Flow UI 以 adult_raw.hex 名称访问。H2O 会自动检测哪些列包含数字，哪些包含分类值（H2O 术语中的枚举类型），如教育程度和婚姻状况就是分类值。

1.1.2 修改列名

adult.raw 文件不包含列名，可使用 H2O API 修改列名：

会员秒杀 ¥9.9 重磅福利

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。