17、树算法与集成学习实战

树算法与集成学习实战

1. 集成学习概述

在集成学习中,装袋回归(bagging regression)在某些情况下表现优于随机森林,其平均绝对误差和平均绝对百分比误差都更理想。而且,集成学习并不局限于树模型,还可以使用 KNN 算法构建集成回归器。

2. 梯度提升树调优

2.1 数据准备

以加利福尼亚住房数据集为例,使用梯度提升树进行分析。首先加载数据并将其拆分为训练集和测试集:

%matplotlib inline
from __future__ import division 
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.datasets import fetch_california_housing

cali_housing = fetch_california_housing()
X = cali_housing.data
y = cali_housing.target

bins = np.arange(6)
binned_y = np.digitize(y, bins)
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=binned_y)

2.2 调参步骤

    评论
    成就一亿技术人!
    拼手气红包6.0元
    还能输入1000个字符  | 博主筛选后可见
     
    红包 添加红包
    表情包 插入表情
     条评论被折叠 查看
    添加红包

    请填写红包祝福语或标题

    红包个数最小为10个

    红包金额最低5元

    当前余额3.43前往充值 >
    需支付:10.00
    成就一亿技术人!
    领取后你会自动成为博主和红包主的粉丝 规则
    hope_wisdom
    发出的红包
    实付
    使用余额支付
    点击重新获取
    扫码支付
    钱包余额 0

    抵扣说明:

    1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
    2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

    余额充值