机器学习-总结笔记-决策树-代码实现

Toooooopia

于 2021-06-10 22:58:52 发布

阅读量678

点赞数

分类专栏：机器学习文章标签：决策树机器学习 python

本文链接：https://blog.youkuaiyun.com/weixin_52329576/article/details/117783573

版权

本文详细介绍了如何使用Python的sklearn库构建决策树，包括数据导入、数据查看、决策树构建过程，以及如何进行可视化展示。同时，讨论了决策树的重要参数如criterion、max_depth、min_samples_split等，并提到了可视化参数如filled、rounded等，以及如何用train_test_split进行训练集和测试集的划分来评估模型精度。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1）导入包和数据（来自sklearn）

%matplotlib inline  # 如果不是jupyter notebook 可无视

import matplotlib.pyplot as plt
import pandas as pd
from sklearn.datasets.california_housing import fetch_california_housing

from sklearn import tree

import pydotplus
from IPython.display import Image

from sklearn.model_selection import train_test_split

2）查看数据描述

housing = fetch_california_housing()
print(housing.DESCR)

在这里插入图片描述

3）查看数据结构

housing.data.shape

在这里插入图片描述

4）决策树构建

这里是用决策树做回归（衡量标准是MSE），还可以做分类，调用tree.DecisionTreeClassifier

dtr = tree.DecisionTr

最低0.47元/天解锁文章