机器学习算法导论---DTR共享单车需求问题的决策树回归问题

最新推荐文章于 2025-01-08 15:52:18 发布

原创最新推荐文章于 2025-01-08 15:52:18 发布 · 617 阅读

1 ·

CC 4.0 BY-SA版权

文章标签：

#机器学习 #算法 #r语言

机器学习算法导论代码专栏收录该内容

13 篇文章

订阅专栏

本文介绍了如何从CSV数据中提取特征，利用 sklearn 的 DecisionTreeRegressor 进行模型训练，并计算 R²分数评估模型性能。通过 train_test_split 函数将数据集分为训练集和测试集，展示了机器学习的基本流程。

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from machine_learning.lib.decision_tree_regressor import DecisionTreeRegressor
from sklearn.metrics import r2_score

def get_data():
    df=pd.read_csv("./bike.csv")
    df.datetime=df.datetime.apply(pd.to_datetime)
    df['hour']=df.datetime.apply(lambda x:x.hour)
    y=df['count'].values
    df.drop(['datetime','casual','registered','count'],1,inplace=True)
    X=df.values
    return X,y
X,y=get_data()
X_train,X_test,y_train,y_test=train_test_split(X,y,test_size=0.5,random_state=0)

model=DecisionTreeRegressor(max_depth=2)
model.fit(X_train,y_train)
y_pred=model.predict(X_test)
# print('r2={}'.format(get_r2(y_test,y_pred)))