
sklearn
文章平均质量分 95
Goldxwang
这个作者很懒,什么都没留下…
展开
-
使用sklearn进行集成学习——理论
目录1 前言2 集成学习是什么?3 偏差和方差 3.1 模型的偏差和方差是什么? 3.2 bagging的偏差和方差 3.3 boosting的偏差和方差 3.4 模型的独立性 3.5 小结4 Gradient Boosting 4.1 拟合残差 4.2 拟合反向梯度 4.2.1 契机:引入损失函数 4.2.2 难题一:原创 2017-06-14 13:23:58 · 488 阅读 · 0 评论 -
使用sklearn进行集成学习——实践
目录1 Random Forest和Gradient Tree Boosting参数详解2 如何调参? 2.1 调参的目标:偏差和方差的协调 2.2 参数对整体模型性能的影响 2.3 一个朴实的方案:贪心的坐标下降法 2.3.1 Random Forest调参案例:Digit Recognizer 2.3.1.1 调整过程影响类参数原创 2017-06-14 13:27:31 · 541 阅读 · 0 评论 -
【scikit-learn】如何进行模型参数的选择
内容概要这一节我们介绍以下几个内容:我们该怎样选择模型用于监督学习任务?我们该如何选择调整得到最好的模型参数?我们该如何对测试数据进行预测估计?1. 使用整个数据集进行训练和测试这里我们使用手中的整个数据集来训练模型使用同样的数据集来测试模型,然后评估预测的结果和真实结果的差别In [1]:from sklearn.datasets import load_ir原创 2017-06-15 10:15:04 · 958 阅读 · 0 评论 -
sklearn数据集随机切分(train_test_split)
sklearn学习给定数据集X和类别标签y,将数据集按一定比例随机切分为训练集和测试集。代码#!/usr/bin/env python# -*- coding: utf-8 -*-"""功能:数据集按比例切分为训练集和测试集时间:2017年3月11日 12:48:57"""from sklearn.cross_validation import trai转载 2017-06-15 10:31:22 · 5345 阅读 · 0 评论 -
sklearn的train_test_split
train_test_split函数用于将矩阵随机划分为训练子集和测试子集,并返回划分好的训练集测试集样本和训练集测试集标签。格式:X_train,X_test, y_train, y_test =cross_validation.train_test_split(train_data,train_target,test_size=0.3, random_state=0)参转载 2017-06-15 18:02:11 · 1082 阅读 · 0 评论