通过学习分位数函数提升预测准确性

最新推荐文章于 2025-12-18 10:34:05 发布

原创

最新推荐文章于 2025-12-18 10:34:05 发布 · 833 阅读

·

12

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#学习 #机器学习 #概率预测 #时间序列 #程序那些事 #AIGC #自然语言处理

通过学习分位数函数提升预测准确性

分位数函数是一种数学函数，它以分位数（分布的百分比，从0到1）作为输入，输出变量的值。它可以回答诸如"如果我想保证95%的客户在24小时内收到订单，我需要准备多少库存？"这样的问题。因此，分位数函数常用于预测问题的背景中。

然而在实际应用中，我们很少有一个整洁的公式来计算分位数函数。相反，统计学家通常使用回归分析一次近似一个分位数水平。这意味着如果你决定要计算不同的分位数，就必须建立一个新的回归模型——在今天，这通常意味着重新训练神经网络。

在两篇论文中，我们描述了一种同时学习整个分位数函数近似值的方法，而不是简单地近似每个分位数水平。

分位数函数

任何概率分布——比如人群中身高的分布——都可以表示为一个函数，称为概率密度函数（PDF）。该函数的输入是一个变量（特定身高），输出是一个正数，表示输入的概率（该人群中具有该身高的人的比例）。

一个有用的相关函数是累积分布函数（CDF），它是变量取特定值或低于特定值的概率——例如，身高5英尺6英寸或更矮的人群比例。CDF的值介于0（没有人矮于0英尺0英寸）和1（100%的人群矮于500英尺0英寸）之间。

从技术上讲，CDF是PDF的积分，因此它计算概率曲线到目标点下方的面积。在低输入值时，CDF输出的概率可能低于PDF输出的概率。但由于CDF是累积的，它是单调非递减的：输入值越高，输出值越高。

如果CDF存在，分位数函数就是它的反函数。分位数函数的图形可以通过将CDF图形翻转过来产生——即围绕从图形左下角到右上角的对角线轴旋转180度。

与CDF一样，分位数函数是单调非递减的。这是我们方法所基于的基本观察。

单变量情况

传统近似分位数函数方法（仅在特定点估计）的缺点之一是可能导致分位数交叉。也就是说，由于每个预测基于不同的模型，在不同的局部数据上训练，给定概率的预测变量值可能低于为较低概率预测的值。这违反了分位数函数必须单调非递减的要求。

为了避免分位数交叉，我们的方法同时学习几个不同输入值

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。