销量预测建模中常用的损失函数与模型评估指标

最新推荐文章于 2025-11-30 09:34:17 发布

原创

最新推荐文章于 2025-11-30 09:34:17 发布 · 3.1k 阅读

·

2

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#算法 #机器学习 #数据挖掘 #spark

本文详细介绍了销量预测中常见的损失函数，包括均方误差、平均绝对误差、Huber Loss和分位数损失，以及评估指标如均方根误差、MAPE、SMAPE、预测精度等，并探讨了它们的选择原则和应用场景。

销量预测建模中常用的损失函数与模型评估指标

本文为销量预测第9篇：销量预测建模中常用的损失函数与模型评估指标
第1篇：PySpark与DataFrame简介
第2篇：PySpark时间序列数据统计描述，分布特性与内部特性
第3篇：缺失值填充与异常值处理
第4篇：时间序列特征工程
第5篇：特征选择
第6篇：简单预测模型
第7篇：线性回归与广义线性模型
第8篇：机器学习调参方法

本文详细的梳理了销量预测领域常见的损失函数和模型评估指标。

一.损失函数

机器学习任务依赖于对目标函数最大或最小化，把最小化的函数称为损失函数（ Loss Function ），用于衡量机器学习模型的预测能力，使用基于梯度下降法等的优化手段求解最小化损失函数。

但同一种损失函数并非适用于所有的模型，即使针对同一个预测任务。损失函数的选取依赖于参数的数量、是否有异常值、机器学习算法、梯度下降的效率等方面。所以下面介绍在销量预测领域常用的损失函数。

(1) 均方误差（Mean Squared Error - MSE）

均方误差是回归任务中最常用的损失函数，也叫L2损失，它是预测值与目标值之间差值的平方和，其公式如下所示：

$\mathrm{MSE}=\frac{1}{N} \cdot \sum_{i=1}^{N}\left(\hat{y}_{i}-y_{i}\right)^{2}$

如果预测模型使用MSE作为损失函数，通过使其导数为零，最小化损失。

$\begin{array}{c} \frac{\partial M S E}{\partial f}=\frac{\partial \frac{1}{n} \sum\left(f_{i}-{y}_{i}\right)^{2}}{\partial f} \\ \frac{2}{n} \sum\left(f_{t}-{y}_{i}\right)=0 \\ \sum f_{t}=\sum {y}_{i} \end{array}$

模型会趋于让整体预测值与实际值相等,整体样本趋向于平均值。
在这里插入图片描述

(2) 平均绝对误差（Mean Absolute Error - MAE）

平均绝对误差也叫L1损失，是目标值与预测值之差绝对值的和，表示预测值的平均误差幅度，不考虑误差的方向。

$MAE=\frac{1}{N} \cdot \sum_{i=1}^{N}\left|\hat{y}_{i}-y_{i}\right|$

若模型使用MAE作为损失函数，通过令导数为零，使其最小化：

$\frac{\partial M A E}{\partial f}=\frac{\partial \frac{1}{n} \sum\left|f_{t}-{y}_{i}\right|}{\partial f}\\$

$\left|f_{i}-{y}_{i}\right|=\left\{\begin{array}{ll} f_{i}-{y}_{i} & {y}_{i}<f_{i} \\ \text { indefinite } & {y}_{i}=f_{i} \\ {y}_{i}-f_{i} & {y}_{i}>f_{i} \end{array}\right. \\$

最低0.47元/天解锁文章

评论

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。