Relative Entropy, Exponential Utility, and Robust Dynamic Pricing

符号

符号含义
[ 0 , T ] [0,T] [0,T]时间周期
c c c可以在有限的时间间隔内出售的易腐物品的最大数量
N ( t ) N(t) N(t)截至(包括)时间 t t t 的销售总数
X ( t ) X(t) X(t)时间 t t t 时库存中剩余的物品数
F t = σ { N ( s ) , 0 ≤ s ≤ t } \mathcal{F}_t = \sigma\{ N(s), 0\leq s \leq t\} Ft=σ{N(s),0st} N ( t ) N(t) N(t) 生成的 filtration
F = F T \mathcal{F}=\mathcal{F}_T F=FT
p ( t − ) p(t^-) p(t) t t t 时刻的销售价格
λ ( t ) \lambda(t) λ(t)顾客的瞬时到达率( instantaneous arrival rate)
P \mathscr{P} P满足 λ ( p ) < ∞ \lambda(p)<\infty λ(p)< 的价格集合
R \mathscr{R} R P \mathscr{P} P 对应的所有顾客到达速率集合

λ ( t ) \lambda(t) λ(t)可以表示成价格的一个函数 λ ( t ) = λ ( p ( t ) ) \lambda(t)=\lambda(p(t)) λ(t)=λ(p(t)) 或者简写为 λ ( p ) \lambda(p) λ(p),比如 λ ( p ) = A e − B p \lambda(p)=A e^{-Bp} λ(p)=AeBp

经典动态定价问题( Gallego and van Ryzin)

假设 λ ( p ) \lambda(p) λ(p) 是已知的,给定一个价格策略 p ( t ) p(t) p(t), 就为顾客到达过程 N ( t ) N(t) N(t) 指定了一个到达速率 λ ( t ) \lambda(t) λ(t),进而得到一个(依赖于 p ( t ) p(t) p(t))的概率测度 P \mathbb{P} P,在此测度下 N ( t ) N(t) N(t) 是一个速率为 λ ( t ) \lambda(t) λ(t) 的计数过程。

问题模型:
max ⁡ p ( ⋅ ) E P [ ∫ 0 T p ( t ) d N ( t ) ] \mathop{\max}\limits_{p(\cdot)} \quad\mathbb{E}_{\mathbb{P}} \left[ \int_0^T p(t) dN(t) \right] p()maxEP[0Tp(t)dN(t)] s.t. ∫ 0 T d N ( t ) ≤ c \text{s.t.} \qquad \int_0^T dN(t)\leq c \quad s.t.0TdN(t)c p ( ⋅ ) ∈ U p(\cdot)\in\mathcal{U} p()U
其中
U = { p ( t ) = [ p ( t , 0 ) , p ( t , 1 ) , ⋯   , p ( t , c ) ] ∣ p ( ⋅ , n ) : [ 0 , T ] → [ 0 , p ˉ ] 在 [ 0 , T ] 可测且非负 } \mathcal{U} = \{p(t)=[p(t,0),p(t,1),\cdots,p(t,c)] \Big | p(\cdot, n) : [0,T] \rightarrow [0,\bar{p}] \text{在} [0,T] \text{可测且非负}\} U={p(t)=[p(t,0),p(t,1),,p(t,c)]p(,n):[0,T][0,pˉ][0,T]可测且非负}

不确定性

在现实中,对于给定的定价策略 p ( t ) p(t) p(t),控制客户实际到达的度量可能不是 P \mathbb{P} P,而是一些其他测度 Q \mathbb{Q} Q。等价地说,依赖于 p ( ⋅ ) p(\cdot) p() 的实际顾客到达速率通常不是 λ ( t ) \lambda(t) λ(t),而是其它某个 F t \mathcal{F}_t Ft-可预测过程 β ( t ) \beta(t) β(t)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

zte10096334

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值