15、最优停止问题:从理论到现实的决策智慧

最优停止问题:从理论到现实的决策智慧

1. 最优停止问题的起源与经典问题

最优停止问题在数学和现实生活中都有着广泛的应用。其最著名的谜题之一是秘书问题,它最早以“古戈尔游戏”的形式出现在印刷品中。1958 年,约翰·福克斯和杰拉尔德·马尼设计了这个游戏:第一个玩家在不同纸条上写下任意数量的独特正数,洗牌后逐一翻面,第二个玩家若能在某张纸条停下且该数是所有数中最大的,则获胜。福克斯最初认为第二个玩家的最优策略是等一半纸条翻面后,选择第一个比前半部分最大数还大的数,获胜概率约为 34.7%。

在此之前,1875 年英国数学家亚瑟·凯莱提出了一个类似的抽奖问题:有 n 张代表不同金额的彩票,一个人最多抽 k 次,每次抽完可选择是否继续,最终获得最后抽到彩票的价值,求在概率理论下最有利的抽奖策略和期望价值。后来利奥·莫泽对该问题进行了改进,增加了彩票价值在 0 到 1 之间均匀分布的条件。凯莱 - 莫泽问题与秘书问题的区别在于,前者关注的是所选数字的平均价值最大化,而后者追求找到最大数字的概率最大化。

莫泽在 1956 年的论文中不仅解决了凯莱 - 莫泽问题,还首次提及了最优停止问题在现实世界中的应用,如游客找旅馆和单身汉择偶问题。

2. 秘书问题的 37% 规则

经过研究,莫泽为加德纳提供了秘书问题的正确解决方案——37% 规则。该规则的推导过程是,对于 n 个申请人,计算基于前 k 个申请人设定标准最终选到最佳申请人的概率,用 k 与 n 的比值 p 表示,当 n 足够大时,选到最佳申请人的概率收敛于数学函数 -p log p,当 p = 1/e(e 约为 2.71828,1/e 约为 0.367879441,接近 37%)时,该函数取得最

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值