报童问题的简单解法

本文提供了一个比传统解法更简单的报童问题解决方案。通过期望收益最大化,推导出最优采购量 x 的公式,涉及随机变量 D 的概率分布、累积分布函数以及临界分位数的概念。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本文链接个人站 | 简书 | 优快云
版权声明:除特别声明外,本博客文章均采用 BY-NC-SA 许可协议。转载请注明出处。

我们早先已经在《报童问题》一文中介绍了这个经典的商品采购模型。文中的推导略有些繁复。为了便于理解,本文将给出一个相对简单的解法。

问题

我们还是沿用前文的记号。问题定义如下:

每天早上,报童以批发价 c c c 元/份采购当天的报纸,然后以零售价 p p p 元/份售卖。如果当天报纸没有卖完,则以 s s s 元/份的价格卖给废品回收站。不失一般性,假设 p > c > s p>c>s p>c>s。用随机变量 D D D 表示当天的需求量,并已知其概率分布。求使得期望收益最大的采购量 x x x

求解

收益为总销售额减去总成本:
π ( x , D ) = p ⋅ min ⁡ ( x , D ) + s ⋅ max ⁡ ( x − D , 0 ) − c ⋅ x = p ⋅ min ⁡ ( x , D ) + s ⋅ [ max ⁡ ( x , D ) − D ] − c ⋅ x = p ⋅ min ⁡ ( x , D ) + s ⋅ [ x + D − min ⁡ ( x , D ) − D ] − c ⋅ x = ( p − s ) ⋅ min ⁡ ( x , D ) − ( c − s ) ⋅ x \begin{aligned} \pi(x, D) &= p\cdot \min(x, D)+s\cdot\max(x-D, 0)-c\cdot x\\ &=p\cdot \min(x, D)+s\cdot[\max(x, D) - D]-c\cdot x\\ &=p\cdot \min(x, D)+s\cdot[x+D - \min(x, D) - D]-c\cdot x\\ &=(p-s)\cdot \min(x, D)-(c-s)\cdot x \end{aligned} π(x,D)=pmin(x,D)+smax(xD,0)cx=pmin(x,D)+s[max(x,D)

所谓报童问题是一个与需求有关,而需求是随机的问题。一位报童从报刊发行处订报后零售,每卖出一份可获利a元,若订报后卖不出去,则退回发行处,每份将要赔钱b元。那么报童如何根据以往的卖报情况(每天报纸的需求量为k份的概率为 )来推算出每天收益达到最大的订报量n? 算法解说分析: ① 我利用负指数分布公式“g(u)=-lg(u)”,其中“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”。函数中“g(u)=-lg(u)”的自变量“u”是均匀产生[0,1]之间的数,可知“g(u)”的函数值也是等可能的产生的,而且这些函数值是呈一种负指数分布趋向的。我可以通过一些巧妙地方法,就是让这些函数值乘上一个数值,让其不能超过1并且把这些值累加起来(今次加上上一次的),这是一个循环,结束的条件是累加的这些和的值≥1。到循环结束的时候,我可以算一下究竟循环了多少次,而这个循环了“多少次”就是我们所需要的需求量的模拟值。 ② 因为我们都知道“-lg(u)”的值是公平地呈负指数分布出现的,为何?很明显,“u=1.0*u/RAND_MAX(产生[0,1]均匀分布的随机数)”证明其“公平性”。“公平性”很重要,因为能出现通过“-lg(u)”计算得出的值必须要公平才有“可信性”。同理,“-lg(u)”乘上一个具体的数以后也是能“g(u)”的值是公平地呈负指数分布出现的“x=-1.0/t*log(u);/*产生负指数分布的随机数(t是确定的常数)*/ ” ③ 根据负指数函数的分布规律可知,每次让这些函数值缩小某个级别的时候在累加起来,直到其值“=1”才停止,其中循环的次
当然可以,下面是2000字左右的报童问题研究文献综述及引用文献。 1. 简介 报童问题是物流管理中的一种经典问题,它源于报童在出售报纸时面临的一个决策问题:在不确定需求的情况下,他应该采购多少份报纸以达到最大的利润。这个问题被广泛地应用于库存管理、生产计划、物流配送等领域。 2. 历史 报童问题最早出现在20世纪50年代,由哈佛大学的经济学家Leonard M. Marx提出。这个问题得名于一位经营零售店的华盛顿邮差,他每天都需要决定购买多少份当天的报纸。这个问题引起了很多学者们的兴趣,他们开始研究报童问题的最优解及其应用。 3. 模型 报童问题的模型可以用一个简单的概率模型来描述:假设每天的需求都是独立同分布的随机变量,且服从某个已知的分布。报童需要在每天采购若干份报纸,每份报纸的成本是已知的且不变,而销售每份报纸的价格是固定的,且大于等于采购成本。报童需要制定一个策略,即每天应该采购多少份报纸,以达到最大的期望利润。 4. 解法 在这个模型中,存在一个经典的最优策略——期望利润最大化策略。它的思想是:当需求达到某个量时,采购量等于需求量;当需求小于这个量时,采购量等于剩余期望需求量。 根据这个策略,我们可以得到一个简单的公式,即最优采购量= $F^{-1}(\frac{r}{c+r})$,其中$F^{-1}$为需求分布函数的反函数,$r$为每份报纸的收益,$c$为每份报纸的成本。这个公式可以被视为解决报童问题的经典结论,广泛地应用于库存管理、生产计划、物流配送等领域。 5. 进展 随着研究的深入,学者们逐渐意识到仅考虑期望利润最大化这一标准是不足够的。例如,在一些领域,超额库存的成本比少货的成本高得多,因此需要考虑库存损失的风险。这些问题促使学者们开展了大量的研究工作,推出了多种针对不同情况的报童问题解法及优化算法。 6. 引用文献 1. Marx, L.M. (1959). “The Problem of the Newsboy”. Operations Research. 7(1): 81–97. 2. Ke, Y., & Zhang, G. (2000). On the newsboy problem: An overview. IIE Transactions on Operations Engineering, 32(9), 795-811. 3. Nino-Mora, J. (2001). The newsvendor model: recent developments in research. Engineering Management Journal, 13(3), 17-28. 4. Lee, H. L., & Tang, C. S. (1997). Modeling the costs and benefits of delayed product differentiation. Management science, 43(1), 40-53. 5. Dong, L., Li, J., Liang, L., & Wang, T. (2017). Three-scale approximations for newsvendor models with general demand and lost sales. Mathematical Methods of Operations Research, 85(2), 221-243.
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值