可扩展机器学习及相关技术
1. 深度学习预测前列腺癌肿瘤浸润
在这个示例中,我们将使用 H2O 在本地主机(localhost:54321)上运行深度学习模型,以预测前列腺癌的肿瘤浸润情况。
1.1 运行演示
为了更好地理解函数的作用,我们将输出拆分并详细解释每个部分。
# 运行深度学习演示
demo(h2o.deeplearning)
1.2 加载测试数据
从 R 的本地文件系统目录中加载数据,该目录是 H2O 包的安装位置。
prostate.hex = h2o.uploadFile(path = system.file("extdata", "prostate.csv", package="h2o"), destination_frame = "prostate.hex")
查看数据的摘要输出,确保其与特征定义匹配。
summary(prostate.hex)
输出结果如下:
| 变量 | 最小值 | 第一四分位数 | 中位数 | 均值 | 第三四分位数 | 最大值 |
| — | — | — | — | — | — | — |
| ID | 1.00 | 95.75 | 190.50 | 190.50 | 285.25 | 380.00 |
| CAPSULE | 0.0000 |