概述
演示了对交通路况预测的基本流程。数据集包含了2019年7月1日至2019年7月31日西安市的实时和历史路况信息, 以及道路属性和路网拓扑信息,规模庞大,要求测试集中每个样本待预测时间片的路况状态。该任务是一个多分类任务,需要预测三种路况状态,每路况状态标签对应如下:
| 类别名 | 畅通 | 缓行 | 拥堵 |
|---|---|---|---|
| 标签 | 1 | 2 | 3 |
-
数据集: 数据集包含了2019年7月1日至2019年7月31日西安市的实时和历史路况信息,实时路况信息包含近期几个时间片的路况信息(如状态、速度、车辆数等),历史路况信息包含前四周内的同期和与当前时间片较近的几个时间片的路况信息。数据可以从这里下载,下载后解压到
data目录下。 -
运行环境:
<lightgbm=2.2.3 xgboost=1.1.0 catboost=0.24.2 numpy=1.18.5 pandas=1.1.4 tqdm=4.47.0
该博客详细介绍了使用CatBoost、XGBoost和LightGBM进行路况多分类任务的实战过程,包括数据探索、特征工程、模型训练、优化思路等内容。数据集包含了西安2019年7月的路况信息,目标是预测三种路况状态。博主分享了数据预处理、模型训练和融合策略,适合机器学习初学者学习。
订阅专栏 解锁全文
255

被折叠的 条评论
为什么被折叠?



