报童问题的简单解法

本文提供了一个比传统解法更简单的报童问题解决方案。通过期望收益最大化,推导出最优采购量 x 的公式,涉及随机变量 D 的概率分布、累积分布函数以及临界分位数的概念。

本文链接个人站 | 简书 | 优快云
版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

我们早先已经在《报童问题》一文中介绍了这个经典的商品采购模型。文中的推导略有些繁复。为了便于理解,本文将给出一个相对简单的解法。

问题

我们还是沿用前文的记号。问题定义如下:

每天早上,报童以批发价 c c c 元/份采购当天的报纸,然后以零售价 p p p 元/份售卖。如果当天报纸没有卖完,则以 s s s 元/份的价格卖给废品回收站。不失一般性,假设 p > c > s p>c>s p>c>s。用随机变量 D D D 表示当天的需求量,并已知其概率分布。求使得期望收益最大的采购量 x x x

求解

收益为总销售额减去总成本:
π ( x , D ) = p ⋅ min ⁡ ( x , D ) + s ⋅ max ⁡ ( x − D , 0 ) − c ⋅ x = p ⋅ min ⁡ ( x , D ) + s ⋅ [ max ⁡ ( x , D ) − D ] − c ⋅ x = p ⋅ min ⁡ ( x , D ) + s ⋅ [ x + D − min ⁡ ( x , D ) − D ] − c ⋅ x = ( p − s ) ⋅ min ⁡ ( x , D ) − ( c − s ) ⋅ x \begin{aligned} \pi(x, D) &= p\cdot \min(x, D)+s\cdot\max(x-D, 0)-c\cdot x\\ &=p\cdot \min(x, D)+s\cdot[\max(x, D) - D]-c\cdot x\\ &=p\cdot \min(x, D)+s\cdot[x+D - \min(x, D) - D]-c\cdot x\\ &=(p-s)\cdot \min(x, D)-(c-s)\cdot x \end{aligned} π(x,D)=pmin(x,D)+smax(xD,0)cx=pmin(x,D)+s[max(x,D)D]cx=pmin(x,D)+s[x

所谓报童问题是一个与需求有关,而需求是随机的问题。一位报童从报刊发行处订报后零售,每卖出一份可获利a元,若订报后卖不出去,则退回发行处,每份将要赔钱b元。那么报童如何根据以往的卖报情况(每天报纸的需求量为k份的概率为 )来推算出每天收益达到最大的订报量n? 算法解说分析: ① 我利用负指数分布公式“g(u)=-lg(u)”,其中“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”。函数中“g(u)=-lg(u)”的自变量“u”是均匀产生[0,1]之间的数,可知“g(u)”的函数值也是等可能的产生的,而且这些函数值是呈一种负指数分布趋向的。我可以通过一些巧妙地方法,就是让这些函数值乘上一个数值,让其不能超过1并且把这些值累加起来(今次加上上一次的),这是一个循环,结束的条件是累加的这些和的值≥1。到循环结束的时候,我可以算一下究竟循环了多少次,而这个循环了“多少次”就是我们所需要的需求量的模拟值。 ② 因为我们都知道“-lg(u)”的值是公平地呈负指数分布出现的,为何?很明显,“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”证明其“公平性”。“公平性”很重要,因为能出现通过“-lg(u)”计算得出的值必须要公平才有“可信性”。同理,“-lg(u)”乘上一个具体的数以后也是能“g(u)”的值是公平地呈负指数分布出现的“x=-1.0/t*log(u);/*产生负指数分布的随机数(t是确定的常数)*/ ” ③ 根据负指数函数的分布规律可知,每次让这些函数值缩小某个级别的时候在累加起来,直到其值“=1”才停止,其中循环的次
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值