机器学习与深度学习模型训练实践
1. 表格数据机器学习模型训练
在这个示例中,我们将使用数据科学中非常流行的葡萄酒理化性质数据集来预测特定葡萄酒的质量。我们将使用 Azure Databricks Runtime ML,所以要确保将笔记本附加到运行该版本可用运行时的集群上。
1.1 变量工程
变量工程的步骤如下:
1. 加载数据 :
import pandas as pd
white_wine = pd.read_csv("/dbfs/databricks-datasets/wine-quality/winequality-white.csv", sep=";")
red_wine = pd.read_csv("/dbfs/databricks-datasets/wine-quality/winequality-red.csv", sep=";")
- 合并数据并添加新特征 :
red_wine['is_red'] = 1
white_wine['is_red'] = 0
data = pd.concat([red_wine, white_wine], axis=0)
- 处理列名 :
机器学习与深度学习模型训练
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



