符号
符号 | 含义 |
---|---|
[ 0 , T ] [0,T] [0,T] | 时间周期 |
c c c | 可以在有限的时间间隔内出售的易腐物品的最大数量 |
N ( t ) N(t) N(t) | 截至(包括)时间 t t t 的销售总数 |
X ( t ) X(t) X(t) | 时间 t t t 时库存中剩余的物品数 |
F t = σ { N ( s ) , 0 ≤ s ≤ t } \mathcal{F}_t = \sigma\{ N(s), 0\leq s \leq t\} Ft=σ{N(s),0≤s≤t} | 由 N ( t ) N(t) N(t) 生成的 filtration |
F = F T \mathcal{F}=\mathcal{F}_T F=FT | |
p ( t − ) p(t^-) p(t−) | t t t 时刻的销售价格 |
λ ( t ) \lambda(t) λ(t) | 顾客的瞬时到达率( instantaneous arrival rate) |
P \mathscr{P} P | 满足 λ ( p ) < ∞ \lambda(p)<\infty λ(p)<∞ 的价格集合 |
R \mathscr{R} R | P \mathscr{P} P 对应的所有顾客到达速率集合 |
λ ( t ) \lambda(t) λ(t)可以表示成价格的一个函数 λ ( t ) = λ ( p ( t ) ) \lambda(t)=\lambda(p(t)) λ(t)=λ(p(t)) 或者简写为 λ ( p ) \lambda(p) λ(p),比如 λ ( p ) = A e − B p \lambda(p)=A e^{-Bp} λ(p)=Ae−Bp。
经典动态定价问题( Gallego and van Ryzin)
假设 λ ( p ) \lambda(p) λ(p) 是已知的,给定一个价格策略 p ( t ) p(t) p(t), 就为顾客到达过程 N ( t ) N(t) N(t) 指定了一个到达速率 λ ( t ) \lambda(t) λ(t),进而得到一个(依赖于 p ( t ) p(t) p(t))的概率测度 P \mathbb{P} P,在此测度下 N ( t ) N(t) N(t) 是一个速率为 λ ( t ) \lambda(t) λ(t) 的计数过程。
问题模型:
max
p
(
⋅
)
E
P
[
∫
0
T
p
(
t
)
d
N
(
t
)
]
\mathop{\max}\limits_{p(\cdot)} \quad\mathbb{E}_{\mathbb{P}} \left[ \int_0^T p(t) dN(t) \right]
p(⋅)maxEP[∫0Tp(t)dN(t)]
s.t.
∫
0
T
d
N
(
t
)
≤
c
\text{s.t.} \qquad \int_0^T dN(t)\leq c \quad
s.t.∫0TdN(t)≤c
p
(
⋅
)
∈
U
p(\cdot)\in\mathcal{U}
p(⋅)∈U
其中
U
=
{
p
(
t
)
=
[
p
(
t
,
0
)
,
p
(
t
,
1
)
,
⋯
,
p
(
t
,
c
)
]
∣
p
(
⋅
,
n
)
:
[
0
,
T
]
→
[
0
,
p
ˉ
]
在
[
0
,
T
]
可测且非负
}
\mathcal{U} = \{p(t)=[p(t,0),p(t,1),\cdots,p(t,c)] \Big | p(\cdot, n) : [0,T] \rightarrow [0,\bar{p}] \text{在} [0,T] \text{可测且非负}\}
U={p(t)=[p(t,0),p(t,1),⋯,p(t,c)]∣∣∣p(⋅,n):[0,T]→[0,pˉ]在[0,T]可测且非负}
不确定性
在现实中,对于给定的定价策略 p ( t ) p(t) p(t),控制客户实际到达的度量可能不是 P \mathbb{P} P,而是一些其他测度 Q \mathbb{Q} Q。等价地说,依赖于 p ( ⋅ ) p(\cdot) p(⋅) 的实际顾客到达速率通常不是 λ ( t ) \lambda(t) λ(t),而是其它某个 F t \mathcal{F}_t Ft-可预测过程 β ( t ) \beta(t) β(t)。