org.apache.spark.ml.feature包中包含了4种不同的归一化方法:
Normalizer
StandardScaler
MinMaxScaler
MaxAbsScaler
数据准备
函数对于要处理的数据格式要求是org.apache.spark.ml.linalg.DenseVector
import org.apache.spark.ml.linalg.Vectors
// 数据预处理
val dataFrame = data.na.fill(0).rdd.map(a=>(a.getString(0),Vectors.dense(a.getLong(1),a.getLong(2),a.getLong(3),a.getLong(4)))).toDF(