通过学习分位数函数提升预测准确性
分位数函数是一种数学函数,它以分位数(分布的百分比,从0到1)作为输入,输出变量的值。它可以回答诸如"如果我想保证95%的客户在24小时内收到订单,我需要准备多少库存?"这样的问题。因此,分位数函数常用于预测问题的背景中。
然而在实际应用中,我们很少有一个整洁的公式来计算分位数函数。相反,统计学家通常使用回归分析一次近似一个分位数水平。这意味着如果你决定要计算不同的分位数,就必须建立一个新的回归模型——在今天,这通常意味着重新训练神经网络。
在两篇论文中,我们描述了一种同时学习整个分位数函数近似值的方法,而不是简单地近似每个分位数水平。
分位数函数
任何概率分布——比如人群中身高的分布——都可以表示为一个函数,称为概率密度函数(PDF)。该函数的输入是一个变量(特定身高),输出是一个正数,表示输入的概率(该人群中具有该身高的人的比例)。
一个有用的相关函数是累积分布函数(CDF),它是变量取特定值或低于特定值的概率——例如,身高5英尺6英寸或更矮的人群比例。CDF的值介于0(没有人矮于0英尺0英寸)和1(100%的人群矮于500英尺0英寸)之间。
从技术上讲,CDF是PDF的积分,因此它计算概率曲线到目标点下方的面积。在低输入值时,CDF输出的概率可能低于PDF输出的概率。但由于CDF是累积的,它是单调非递减的:输入值越高,输出值越高。
如果CDF存在,分位数函数就是它的反函数。分位数函数的图形可以通过将CDF图形翻转过来产生——即围绕从图形左下角到右上角的对角线轴旋转180度。
与CDF一样,分位数函数是单调非递减的。这是我们方法所基于的基本观察。
单变量情况
传统近似分位数函数方法(仅在特定点估计)的缺点之一是可能导致分位数交叉。也就是说,由于每个预测基于不同的模型,在不同的局部数据上训练,给定概率的预测变量值可能低于为较低概率预测的值。这违反了分位数函数必须单调非递减的要求。
为了避免分位数交叉,我们的方法同时学习几个不同输入值

最低0.47元/天 解锁文章
1140

被折叠的 条评论
为什么被折叠?



