二分分类: SVM、逻辑回归、决策树、贝叶斯
多类分类:决策树、贝叶斯
回归:线性最小二乘法
聚类:kmeans、层次法(CURE、CHAMELEON)、网格算法(STING、WaveCluster)
与分类不同,分类是示例式学习,要求分类前指出各个类别,并断言每个元素映射到一个类别,儿聚类是观察式学习,在聚类前可以不知道类别甚至不给定类别数量,是无监督学习的一种。
二分分类
线性SVM
MLlib支持两个线性方法:线性支持向量机SVM和逻辑回归。在MLlib中,训练标签用1表示积极,用0表示消极。
线性SVM是大规模分类任务的标准方法。
L ( w ; x , y ) = max {
0 , 1 − y w T x }
线性SVM算法输出一个SVM模型,对