机器学习笔记 - Kaggle竞赛 基于SMAPE评估指标的TensorFlow决策森林预测帕金森病进展

本文利用TensorFlow的决策森林模型参与Kaggle帕金森病进展预测竞赛,重点介绍如何用随机森林预测MDS-UPDRS评分,探讨SMAPE评估指标的实现,数据预处理,以及模型训练、评估和变量重要性的分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一、概述

        比赛提供的AMP®-帕金森病进展预测数据集上的TensorFlow决策森林来训练基线随机森林模型。该模型必须预测MDS-UPDR评分,该评分衡量帕金森病患者的进展情况。

        大致上,代码如下所示:

import tensorflow_decision_forests as tfdf
import pandas as pd

dataset = pd.read_csv("project/dataset.csv")
tf_dataset = tfdf.keras.pd_dataframe_to_tf_dataset(dataset, label="my_label")

model = tfdf.keras.RandomForestModel()
model.fit(tf_dataset)

print(model.summary())

        这里首先将对数据进行一些预处理,使ML模型更容易从中学习。然后了解如何实现和使用本次比赛中使用的评估指标:SMAPE。

        决策森林是一个基于树的模型家族,包括随机森林和梯度提升树。在处理表格数据时,它们是比较好的起点,可以提供一个基线,以供下一步基于神经网络进行预测参考之用。

        数据集下载


                
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

坐望云起

如果觉得有用,请不吝打赏

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值