本文为销量预测第9篇:销量预测建模中常用的损失函数与模型评估指标
第1篇:PySpark与DataFrame简介
第2篇:PySpark时间序列数据统计描述,分布特性与内部特性
第3篇:缺失值填充与异常值处理
第4篇:时间序列特征工程
第5篇:特征选择
第6篇:简单预测模型
第7篇:线性回归与广义线性模型
第8篇:机器学习调参方法
本文详细的梳理了销量预测领域常见的损失函数和模型评估指标。
一.损失函数
机器学习任务依赖于对目标函数最大或最小化,把最小化的函数称为损失函数( Loss Function ),用于衡量机器学习模型的预测能力,使用基于梯度下降法等的优化手段求解最小化损失函数。
但同一种损失函数并非适用于所有的模型,即使针对同一个预测任务。损失函数的选取依赖于参数的数量、是否有异常值、机器学习算法、梯度下降的效率等方面。所以下面介绍在销量预测领域常用的损失函数。
(1) 均方误差(Mean Squared Error - MSE)
均方误差是回归任务中最常用的损失函数,也叫L2损失,它是预测值与目标值之间差值的平方和,其公式如下所示:
M S E = 1 N ⋅ ∑ i = 1 N ( y ^ i − y i ) 2 \mathrm{MSE}=\frac{1}{N} \cdot \sum_{i=1}^{N}\left(\hat{y}_{i}-y_{i}\right)^{2} MSE=N1⋅i=1∑N(y^i−yi)2
如果预测模型使用MSE作为损失函数,通过使其导数为零,最小化损失。
∂ M S E ∂ f = ∂ 1 n ∑ ( f i − y i ) 2 ∂ f 2 n ∑ ( f t − y i ) = 0 ∑ f t = ∑ y i \begin{array}{c} \frac{\partial M S E}{\partial f}=\frac{\partial \frac{1}{n} \sum\left(f_{i}-{y}_{i}\right)^{2}}{\partial f} \\ \frac{2}{n} \sum\left(f_{t}-{y}_{i}\right)=0 \\ \sum f_{t}=\sum {y}_{i} \end{array} ∂f∂MSE=∂f∂n1∑(fi−yi)2n2∑(ft−yi)=0∑ft=∑yi
模型会趋于让整体预测值与实际值相等,整体样本趋向于平均值。

(2) 平均绝对误差(Mean Absolute Error - MAE)
平均绝对误差也叫L1损失,是目标值与预测值之差绝对值的和,表示预测值的平均误差幅度,不考虑误差的方向。
M A E = 1 N ⋅ ∑ i = 1 N ∣ y ^ i − y i ∣ MAE=\frac{1}{N} \cdot \sum_{i=1}^{N}\left|\hat{y}_{i}-y_{i}\right| MAE=N1⋅i=1∑N∣y^i−yi∣
若模型使用MAE作为损失函数,通过令导数为零,使其最小化:
∂ M A E ∂ f = ∂ 1 n ∑ ∣ f t − y i ∣ ∂ f \frac{\partial M A E}{\partial f}=\frac{\partial \frac{1}{n} \sum\left|f_{t}-{y}_{i}\right|}{\partial f}\\ ∂f∂MAE=∂f∂n1∑∣ft−yi∣
∣ f i − y i ∣ = { f i − y i y i < f i indefinite y i = f i y i − f i y i > f i \left|f_{i}-{y}_{i}\right|=\left\{\begin{array}{ll} f_{i}-{y}_{i} & {y}_{i}<f_{i} \\ \text { indefinite } & {y}_{i}=f_{i} \\ {y}_{i}-f_{i} & {y}_{i}>f_{i} \end{array}\right. \\ ∣fi−yi∣=⎩⎨⎧fi−yi indefinite yi−

本文详细介绍了销量预测中常见的损失函数,包括均方误差、平均绝对误差、Huber Loss和分位数损失,以及评估指标如均方根误差、MAPE、SMAPE、预测精度等,并探讨了它们的选择原则和应用场景。
最低0.47元/天 解锁文章
2163

被折叠的 条评论
为什么被折叠?



