sklearn官方网站:http://scikit-learn.org/stable/
原文:https://www.e-learn.cn/content/python/752525
总的来说,Sklearn可实现的函数或功能可分为以下几个方面:
分类算法
—线性判别分析(LDA)
二次判别分析(QDA)
支持向量机(SVM),
Knn算法,神经网络(nn),
朴素贝叶斯算法(Naive Bayes),
决策树算法(decision tree)
回归算法
最小二乘回归(OLS)
岭回归(Ridge Regression)
核岭回归(Kernel ridge regression)
支持向量机回归(SVR)
套索回归(Lasso)
弹性网络回归(Elastic Net)
贝叶斯回归(Bayesian Regression)
逻辑回归(Logistic regression)
稳健回归(Robustness regression)
多项式回归(Polynomial regression——多项式基函数回归)
高斯过程回归(Gaussian Process Regression)
偏最小二乘回归(PLS)
典型相关分析(CCA)
聚类算法
Knn算法
Kmeans算法
层次聚类(Hierarchical clustering)——支持多种距离
降维算法
主成分方法(PCA)
核函主成分(kernal pca)
因子分析(Factor Analysis)
文本挖掘算法
主题生成模型(Latent Dirichlet Allocation)
潜在语义分析(latent semantic analysis)
模型优化
特征选择
随机梯度方法
交叉验证
参数调优
模型评估:支持准确率、召回率、AUC等计算,ROC,损失函数等作图
数据预处理
标准化
异常值处理
非线性转换
二值化
独热编码(one-hot)
缺失值插补:支持均值、中位数、众数、特定值插补、多重插补
衍生变量生成
可能不支持的算法(也可能是我没找到,但有其他模块可以实现)
极限提升树算法(xgboost)
有专门的xgb模块支持
深度学习相关算法RNN,DNN,NN,LSTM等
有专门的深度学习模块入tf,keras等支持