愉快的学习就从翻译开始吧_Multi-step Time Series Forecasting_3_Data Preparation and Model Evaluation

Data Preparation and Model Evaluation/数据准备和模型评估

This section describes data preparation and model evaluation used in this tutorial

本节描述本教程中用到的数据准备和模型评估

Data Split/数据分割

We will split the Shampoo Sales dataset into two parts: a training and a test set.

我们将分割洗发水销量数据集为两部分:一个训练和一个测试集

The first two years of data will be taken for the training dataset and the remaining one year of data will be used for the test set.

前两年的数据被拿来作为训练集,剩下一年的数据被用作测试集

Models will be developed using the training dataset and will make predictions on the test dataset.

模型将用训练数据集来发,并在测试数据集上做出预测

For reference, the last 12 months of observations are as follows:

作为参考,最后12个月的 观测值如下:

Model Evaluation/模型评估

A rolling-forecast scenario will be used, also called walk-forward model validation.
将使用滚动预测方案,也称为前向模型验证。

Each time step of the test dataset will be walked one at a time. A model will be used to make a forecast for the time step, then the actual expected value for the next month from the test set will be taken and made available to the model for the forecast on the next time step.

测试数据集的时间步将一次走一步,模型被用来对这个时间步做出预测,然后从测试数据集中来的下个月的实际期望值被拿给模型用于在下一个时间步上的预测(这句话就不对,应该是当前时间步上的预期值,用作下一个时间步的输入)

This mimics a real-world scenario where new Shampoo Sales observations would be available each month and used in the forecasting of the following month.

这模拟了一个真实世界的情景,每个月都有新的洗发水销售观测值,并用于下个月的预测。

This will be simulated by the structure of the train and test datasets.

这将通过训练和测试数据集的结构来模拟

All forecasts on the test dataset will be collected and an error score calculated to summarize the skill of the model for each of the forecast time steps. The root mean squared error (RMSE) will be used as it punishes large errors and results in a score that is in the same units as the forecast data, namely monthly shampoo sales.

所有测试数据集上的预测被收集,并且一个错误分数被计算用来评估模型对每个预测时间步的技能。 将使用均方根误差(RMSE),因为它会惩罚较大的错误,并产生与预测数据相同单位的分数,即月度洗发水销量(偏差)。

(复习依然来气,文章多处表达错误,这么长时间,跟着学的人那么多,都没人看出来吗?)

数据集介绍:神经元细胞核检测数据集 一、基础信息 数据集名称:神经元细胞核检测数据集 图片数量: - 训练集:16,353- 测试集:963张 分类类别: - Neuron(神经元细胞核):中枢神经系统的基本功能单位,检测其形态特征对神经科学研究具有重要意义。 标注格式: - YOLO格式,包含边界框坐标及类别标签,适用于目标检测任务 - 数据来源于显微镜成像,覆盖多种细胞分布形态和成像条件 二、适用场景 神经科学研究: 支持构建神经元定位分析工具,助力脑科学研究和神经系统疾病机理探索 医学影像分析: 适用于开发自动化细胞核检测系统,辅助病理诊断和细胞计数任务 AI辅助诊断工具开发: 可用于训练检测神经元退行性病变的模型,支持阿尔茨海默症等神经疾病的早期筛查 生物教育及研究: 提供标准化的神经元检测数据,适用于高校生物学实验室和科研机构的教学实验 三、数据集优势 大规模训练样本: 包含超1.6万张训练图像,充分覆盖细胞核的多样分布状态,支持模型深度学习 精准定位标注: 所有标注框均严格贴合细胞核边缘,确保目标检测模型的训练精度 任务适配性强: 原生YOLO格式可直接应用于主流检测框架(YOLOv5/v7/v8等),支持快速模型迭代 生物学特性突出: 专注神经元细胞核的形态特征,包含密集分布、重叠细胞等真实生物场景样本 跨领域应用潜力: 检测结果可延伸应用于细胞计数、病理分析、药物研发等多个生物医学领域
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值