分位数回归（Quantile Regression）

最新推荐文章于 2025-11-14 04:00:07 发布

翻译最新推荐文章于 2025-11-14 04:00:07 发布 · 2.4w 阅读

69 ·

CC 4.0 BY-SA版权

原文链接：https://towardsdatascience.com/quantile-regression-ff2343c4a03

文章标签：

#人工智能 #机器学习 #python

人工智能同时被 2 个专栏收录

32 篇文章

订阅专栏

机器学习

22 篇文章

订阅专栏

本文深入探讨了分位数回归的原理与应用，对比传统线性回归，分位数回归能更全面地评估数据分布，尤其适用于数据异常值较多的情况。通过Python statsmodels库的示例，展示了如何进行分位数回归分析。

部署运行你感兴趣的模型镜像

在这里插入图片描述

数据采用分位数回归在执行回归分析时，仅对问题进行数值预测还不够，您还需要表达您对该预测是否正确的信心。例如，如果您正在查看特定市场中房屋的价格，并且您的模型预测房屋的售价为262,458.45美元，那么您对模型的预测是否正确的信心如何？希望您的直觉会说这是真的，而且可能性很小，但是也许您的模型很接近实际答案。我们需要一种在一定范围内具有一定置信度，同时也能预测值范围的方法。

分位数回归。与常规线性回归不同，常规线性回归使用最小二乘法来计算不同特征值之间条件概率的均值（conditional mean），分位数回归估计条件概率的中位数（conditional median）。分位数回归是线性回归的扩展，当不满足线性回归的条件（即线性，均方差，独立性或正态性）时使用。传统上，用于计算均值的线性回归模型采用以下形式

在这里插入图片描述

线性回归模型方程

其中p等于方程式中的特征数量，n是训练数据点的数量。最佳线性回归线是通过最小化均方误差来计算的，该均方根误差可通过以下公式找到
在这里插入图片描述

线性回归的均方误差
现在，对于分位数回归，您不仅可以找到中位数，还可以为特征中的特定值计算任何分位数（百分比）。例如，如果我们要找到特定房屋价格的第25个分位数，则意味着房屋的实际价格有25％的机会低于预测值，而价格有75％的机会高于预测值。

采用与线性回归模型相似的结构，五分位数的分位数回归模型方程为

在这里插入图片描述

分位数回归模型
这意味着β贝塔系数现在不是常数，而是与分位数相关的函数。在特定分位数下找到这些β的值类似于常规线性回归的过程，只是现在我们必须减少绝对中位差（median absolute deviation）。

在这里插入图片描述

分位数回归的绝对中位差
在此，函数𝜌是检查函数，该函数根据误差的分位数和整体符号为误差赋予不对称权重。在数学上，𝜌采用以下形式

在这里插入图片描述

检查函数方程

在这里插入图片描述

检查功能图
在这种情况下，u是单个数据点的误差，并且max函数返回括号中的最大值。这意味着如果误差为正，则检查功能将误差乘以𝜏，如果误差为负，则检查功能将误差乘以（1- 𝜏）。

例如，如果您想要第10个百分位数的中位数，则意味着您希望90％的误差为正，而10％的误差为负。为了在使该语句为真的同时找到最小的MAD，必须将权重添加到错误中。在第十个分位数的情况下，负数权重为0.9，负数为正数。

让我们看看实际的分位数回归。让我们研究QuantReg的python statsmodels示例，该示例查看1857年比利时工人阶级家庭样本中食品收入与支出之间的关系，并了解我们可以进行什么样的统计分析。

import statsmodels.api as sm
import statsmodels.formula.api as smf
data = sm.datasets.engel.load_pandas().data
data.head()

在这里插入图片描述

1857年比利时家庭数据

mod = smf.quantreg('foodexp ~ income', data)
res = mod.fit(q=.5)
print(res.summary())

在这里插入图片描述
如您所见，您可以为特定分位数创建回归线，并对其进行统计分析，方法与使用常规线性回归模型相同。

补充材料：

如何通俗地理解分位数?
https://www.zhihu.com/question/67763556

分位数回归（Quantile Regression）
https://blog.youkuaiyun.com/jesseyule/article/details/95247155

什么是“绝对中位差”（median absolute deviation）？
https://www.zhihu.com/question/56537218

【强化学习 48】Quantile Regression
https://zhuanlan.zhihu.com/p/60912847

您可能感兴趣的与本文相关的镜像

Python3.10

Conda

Python

Python 是一种高级、解释型、通用的编程语言，以其简洁易读的语法而闻名，适用于广泛的应用，包括Web开发、数据分析、人工智能和自动化脚本

分位数回归（Quantile Regression）

补充材料：

1 条评论