分类模型:随机森林、梯度提升与K近邻算法
1. 随机森林实现
决策树是分类模型的一个良好起点,它对底层数据的假设较少,且无需太多预处理。而随机森林通常可以提升决策树模型的性能,原因在于使用随机森林时方差会降低。以下是使用随机森林改进心脏病模型的具体步骤:
1. 加载库 :
import pandas as pd
import numpy as np
from imblearn.pipeline import make_pipeline
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import RandomizedSearchCV
from scipy.stats import randint
import sklearn.metrics as skmet
import os
import sys
sys.path.append(os.getcwd() + "/helperfunctions")
import healthinfo as hi
- 获取数据 :
X_train = hi.X_train
X_test = hi.X_test
y_train = hi.y_train
y_test = hi.y_test
超级会员免费看
订阅专栏 解锁全文
2007

被折叠的 条评论
为什么被折叠?



