逻辑回归:从原理到实践的全面解析
1. 数据预处理与特征组装
在进行逻辑回归之前,需要对数据进行预处理,其中 VectorAssembler 类发挥了重要作用。它可以将多个列的值组合成一个特征向量。具体操作步骤如下:
1. 定义 VectorAssembler 对象 :指定输出列名为 features ,输入列排除 income 列。
val va = new VectorAssembler().setOutputCol("features").
setInputCols(dfhot.columns.diff(Array("income")))
- 进行数据转换 :将
dfhot数据框进行转换,并将income列重命名为label。
val lpoints = va.transform(dfhot).select("features", "income").
withColumnRenamed("income", "label")
2. 模型训练
完成数据预处理后,就可以开始训练逻辑回归模型了。这里使用Spark
超级会员免费看
订阅专栏 解锁全文
1746

被折叠的 条评论
为什么被折叠?



