各类算法及其适用场景如下图所示。 二分类Two-class Classification二分类支持向量机Two-class SVM适用于数据特征较多,线性模型的场景二分类平均感知器Two-class Average Perceptron适用于训练时间短,线性模型的场景二分类逻辑回归Two-class Logistic Regression二分类贝叶斯点机Two-class Bayes Point Machine二分类提升决策树Two-class Boosted Decision Tree适用于训练时间短,精准度高,内存占用量大的场景二分类决策丛林Two-class Decision Jungle适用于训练时间短,精确度高,内存占用量小的场景二分类局部深度支持向量机Two-class Locally Deep SVM适用于数据特征较多的场景二分类神经网络Two-class Neural Network适用于精准度高,训练时间较长的场景二分类决策森林Two-class Decision Forest适用于训练时间短,精准的场景多分类Multi-class Classification多分类逻辑回归Multiclass Logistic Regression多分类神经网络Multiclass Neural Network多分类决策森林Multiclass Decision Forest多分类决策丛林Multiclass Decision Jungle适用于精准度高,内存占用较小的场景'一对多'多分类One-vs-all Multiclass取决于二分类器效果回归Regression排序回归Ordinal Regression适用于对数据进行分类排序的场景泊松回归Poission Regression适用于预测事件次数的场景快速森林分位数回归Fast Forest Quantile Regression适用于预测分布的场景线性回归Linear Regression贝叶斯线性回归Bayesian Linear Regression适用于线性模型,训练数据量较少的场景神经网络回归Neural Network Regression决策森林回归Decision Forest Regression提升决策树回归Boosted Decision Tree Regression聚类Clustering层次聚类Hierarchical Clustering适用于训练时间短,大数据量的场景K-means算法模糊聚类FCM算法Fuzzy C-means,FCMSOM神经网络Self-organizing Feature Map,SOM适用于运行时间较长的场景异常检测Anomaly Detection一分类支持向量机One-class SVM适用于数据特征较多的场景基于PCA的异常检测PCA-based Anomaly Detection适用于训练时间短的场景 图 13、