监督学习 广义线性模型 普通最小二乘法岭回归Lasso回归多任务Lasso弹性网络多任务弹性网络最小角回归坐标下降法正交匹配追踪法贝叶斯回归 贝叶斯岭回归主动相关决策理论 逻辑回归随机梯度下降感知器被动攻击算法稳健回归多项式回归 线性和二次判别分析 线性判别分析二次判别分析 内核岭回归支持向量机随机梯度下降最近邻高斯过程交叉分解朴素贝叶斯决策树集成方法 Bagging随机森林Adaboost梯度树提升投票分类器投票回归器 多类和多标签算法特征选择半监督学习等式回归概率校准神经网络模型(有监督) 无监督学习 高斯混合模型流形学习聚类双聚类分解成分中的信号(矩阵分解问题)协方差估计新奇和异常值检测密度估计神经网络模型(无监督) 模型选择和评估 交叉验证:评估估算器的表现调整估计器的超参数模型评估: 量化预测的质量模型持久化验证曲线: 绘制分数以评估模型 检验 部分依赖图 数据集转换 Pipeline(管道)和 FeatureUnion(特征联合): 合并的评估器特征提取预处理数据缺失值插补无监督降维随机投影内核近似成对的矩阵, 类别和核函数预测目标 数据集加载工具 通用数据集 API玩具数据集真实世界中的数据集样本生成器加载其他数据集 使用scikit-learn计算 大规模计算的策略: 更大量的数据计算性能并行性、资源管理和配置